Seminario 3 EA

Guía Seminario Estadística Aplicada Nº 3 CORRELACION Y REGRESION 1. El editor en jefe de un importante periódico metropo

Views 180 Downloads 4 File size 141KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Guía Seminario Estadística Aplicada Nº 3 CORRELACION Y REGRESION 1. El editor en jefe de un importante periódico metropolitano ha intentado convencer al dueño del periódico para que mejore las condiciones de trabajo en el taller de prensas. Está convencido de que, cuando trabajan las prensas, el grado de ruido crea niveles no saludables de tensión y ansiedad. Recientemente hizo que un psicólogo realizara una prueba durante la cual los prensistas se situaron en cuartos con niveles variables de ruido y luego se le hizo otra prueba para medir niveles de humor y ansiedad. La siguiente tabla muestra el índice de su grado de ansiedad o nerviosismo y el nivel de ruido al que se vieron expuestos. (1,0 es bajo y 10,0 es alto). Nivel de ruido Grado de ansiedad

4 39

3 38

1 16

2 18

6 41

7 45

5 40

8 48

a) Represente gráficamente estos datos.

b) Desarrolle una ecuación de estimación que describa los datos. y=4.393x+15.857 c) Pronostique el grado de ansiedad que podríamos esperar cuando el nivel de ruido es 9. y=4.393(9)+15.857 y=55.394 d) Calcule e interprete el coeficiente de correlación R=0.899 El coeficiente de correlación puede adoptar valores desde -1 hasta 1. Si R es +/- 1 o próximo a estos valores, decimos que el modelo lineal es adecuado para describir los datos experimentales. Cuando R es cercano a 0 decimos que una expresión lineal no es una buena descripción de los datos. Para este caso el valor obtenido de R=0,899, entonces podemos decir que la ecuación lineal de estimación es una buena representación de la relación que existe entre el nivel de ruido y el grado de ansiedad. e) Calcule e interprete el coeficiente de determinación A diferencia del coeficiente de correlación este solo adopta valores de 0 hasta 1, no puede ser negativo. Mientras más cercano a 1 decimos que el modelo lineal es adecuado para describir los datos y mientras más cercano a 0

decimos que una expresión lineal no es una buena descripción de los datos. En nuestro caso R=0,809, entonces podemos decir que la ecuación lineal de estimación es una buena representación de la relación que existe entre el nivel de ruido y el grado de ansiedad 2. El Gerente de una Clínica dispone de la siguiente información: Año Cirugías

2011 120

2012 143

2013 150

2014 170

a)

Grafique y determine la ecuación de la tendencia.

b)

Proyecte las cirugías al corazón para el año 2017

2015 162

2016 158

y=144.7 3. Se ha medido la variación de creatinina en pacientes tratados con Captopril (droga antihipertensión) tras la suspensión del tratamiento con diálisis, resultando la siguiente tabla: Días tras la diálisis: X Creatinina (mg/dl): Y

1 5.

5 5. 7

10 4. 2

15 4. 8

20 25 4. 4 5 2

35 3. 8

a) Calcule el modelo de regresión lineal y=-0.0552x+5.475 b) Interprete la variación de creatinina, en función de los días transcurridos tras la diálisis. De acuerdo a la ecuación de estimación calculada anteriormente se puede decir que la creatina en un paciente tras la suspensión de la diálisis disminuye en 0,0552 por cada día que trasncurre. Y que además en el día del diálisis (x=0) la persona presentará un nivel de creatinina de 5,475 mg/dl. c) Si un individuo presenta 8 días tras la suspensión del tratamiento con diálisis, que sucede con la creatinina (mg/dl). y=-0.0552(8)+5.475 y=5.0334 El nivel de creatinina tras 8 dias de suspensión del tratamiento con diálisis es 5.0334 mg/dl.

PRUEBA DE INDEPENDENCIA

4. Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base de grado de exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias. Los resultados se muestran en la siguiente tabla: Síntomas presentes Si No Total

Alto 185 120 305

Nivel de Exposición Limitado Sin exposición conocida 33 17 73 72 106 89

Total 235 265 500

¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación de 0.05, existe una relación entre el grado de exposición y la presencia de los síntomas de las alteraciones respiratorias? Hipótesis Ho: No hay relacion entre variables H1: Si existe relacion entre variables Nivel de Significancia: 5% Estadístico:

DECISION: X2t= 5.991 Se rechaza la Hipótesis nula por estar en la zona de rechazo CONCLUSION: Hay evidencia estadísticamente suficiente para concluir que las personas con alteraciones respiratorias se deprimen.

5. A un grupo de 350 adultos que participaron en una encuesta de salud, se les preguntó si llevaban a no una dieta. Las respuestas (por sexos) son las siguientes

A dieta Sin dieta Total

Masculino 14 159 173

Sexo Femenino 25 152 177

Total 39 311 350

¿Sugieren estos datos que al estar a dieta depende del sexo? Sea  = 0.05. Hipótesis Ho: No hay relacion entre variables H1: Existe relacion entre variables Nivel de Significancia: 5% Estadístico:

Decisión: X2f= 3.841 No se rechaza la hipótesis alternativa Conclusión: No hay evidencia estadísticamente suficiente para concluir que el estar a dieta depende del sexo.

PRUEBA DE HOMOGENEIDAD 6. En un estudio acerca de la contaminación atmosférica a realizado en dos comunidades, se seleccionó una muestra aleatoria de 200 familias de cada una de dichas comunidades. Se le preguntó a uno de los miembros de cada familia si algún miembro de la misma se sentía afectado por la contaminación atmosférica. Las respuestas son las siguientes: Comunidad I II Total

¿ Algún miembro de la familia ha sido afectado por la contaminación? Si No Total 43 157 200 81 119 200 124 276 400

¿Pueden concluir los investigadores que las dos comunidades difieren variable de interés? Sea  = 0.05 Hipótesis Ho: Existe homogeneidad H1: No existe homogeneidad

con respecto a la

Nivel de significancia: 5% Estadistico:

Decisión: X2f= 3.841 Se rechaza la Hipótesis nula. Conclusión: Hay evidencia estadística para concluir que las muestras no provienen de poblaciones homogeneidad según si algún miembro de la familia ha sido afectado por la contaminación.

7. A cada uno de los varones de una muestra de tamaño 250, extraída de una población que se sospechaba sufría de alguna enfermedad de las articulaciones se les preguntó cuál de tres síntomas lo molestaba mayormente. La misma pregunta se le hizo a una muestra de 300 mujeres que se sospechaba padecían la misma enfermedad. Los resultados fueron los siguientes: ------------------------------------------------------------------------------------Síntoma más molesto Hombres Mujeres -----------------------------------------------------------------------------------Rigidez matutina 111 102 Dolor por la noche 59 73 Hinchazón de las articulaciones 80 125 ------------------------------------------------------------------------------------TOTAL 250 300 -------------------------------------------------------------------------------------Proporcionan estos datos la suficiente evidencia para indicar que las dos poblaciones no son homogéneas con respecto a los síntomas principales?. Sea  = 0.05

Hipótesis Ho: Existe homogeneidad H1: No existe homogeneidad Nivel de significancia: 5% Estadistico:

Decisión: X2f= 3.841 Se rechaza hipótesis nula, no existe homogeneidad entre las variables. Conclusión: Existe evidencia estadísticamente suficiente para concluir comunidades no son homogéneas con respecto a los síntomas principales.

que

ambas

ODDS RATIO, RIESGO RELATIVO

8. Se tiene interés en evaluar si el uso de anticonceptivos orales es un factor de riesgo del infarto miocárdico en mujeres casadas menores de 45 años de edad. Para tal efecto se realiza un estudio comparativo tipo caso control y se obtienen los siguientes resultados: Uso de anticonceptivos orales

Pacientes con infarto Sin infarto Miocárdico Miocárdico (Casos) (Controles) _________________________________________________________________ Si 23 34 Nunca 35 132 _________________________________________________________________ Total 58 166

Se pide calcular e interpretar el odds ratio (OR)

Conclusión: El uso de anticonceptivos orales es un Factor de Riesgo del infarto miocárdio en mujeres casadas menores de 45 años de edad. Si el resultado de ODDS ratio es mayor a 1 la asociación es positiva, es decir que la presencia del factor se asocia a la mayor ocurrencia del evento. Se le considera un Factor de Riesgo. Por lo tanto, en nuestro caso OR=2.551 es mayor a 1, entonces podemos decir que el uso de anticonceptivos orales es un factor de riesgo frente a padecer infarto miocárdico.

9. Evaluar si niveles altos de colesterol sérico (>250) se considera factor de riesgo de un infarto del miocárdio. Por consiguiente se realiza un estudio comparativo de cohortes y se obtiene los siguientes resultados: Niveles de colesterol

Desarrolla IM No desarrolló IM Total Sérico (mg%) _________________________________________________________ >250 10 125 135 250 21 449 470

_________________________________________________________ Se pide calcular e interpretar el riesgo relativo

Conclusión: Niveles altos de colesterol sérico (>250) se considera Factor de Riesgo de un infarto del miocárdio. El riesgo de infarto del miocardio en el grupo con niveles de colesterol sérico mayores a 250 es 0,0741, mientras que el riesgo de infarto del miocardio en el grupo con niveles de colesterol sérico menor o igual a 250 es 0,0447. Por tanto el RR es 1,658 siendo este mayor a 1, entonces podemos decir que, cuánto más probable es que ocurra un infarto de miocardio en las personas que presentan un nivel alto de colesterol sérico frente a las que no.

10. Se realizó un estudio caso- control para encontrar si la vasectomía es un factor de riesgo del cáncer de próstata. Los datos obtenidos se muestran en la tabla cruzada de abajo. VASECTOMIA Casos Controles Si No TOTAL

70 105 175

80 178 258

TOTAL 154 279 433

Calcular el odss ratio. Interpretar los resultados

Conclusión: La vasectomía es un Factor de Riesgo del cáncer de próstata. Por lo tanto, en nuestro caso OR=14.83 es mayor a 1, entonces podemos decir que realizarse la vasectomía es un factor de riesgo frente a padecer cáncer de próstata.