Cigarrillos

TALLER ANOVA Análisis estadístico para el consumo de madres en estado de gestación Daniel Augusto Cano Castro Andrés Fel

Views 53 Downloads 1 File size 208KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TALLER ANOVA Análisis estadístico para el consumo de madres en estado de gestación Daniel Augusto Cano Castro Andrés Felipe Morales Foronda Universidad Nacional de Colombia

Se conjetura que el peso de un niño al nacer está asociado con el nivel de consumo de cigarrillos de la madre durante el primer trimestre del embarazo. Un estudio realizado en una clínica de maternidad dio los siguientes resultados, para madres agrupadas según el hábito de fumar. Los datos son los pesos en gramos de los niños al nacer: Origen de los datos: No fumadoras

Exfumadoras

3400 2800 3120 3350 4170 3760 3440

2620 3300 3710 3210 3530

Fumadoras (menos Fumadoras (más de un paquete) de un paquete) 2670 2800 2800 3080 2630 2580 2130 2220 3760 2800 3260 3200 2800 2630 2450

Descripción de las variables: Factores: Se organizan los datos de acuerdo con el consumo de las madres gestantes que fueron sometidas a pruebas en una clínica de maternidad en el que se halló el peso del niño al momento de nacer, los valores encontrados se estiman en gramos. No fumadoras: Madres gestantes que nunca han fumado. Exfumadoras: Madres gestantes que fumaban con anterioridad. Fumadoras (menos de un paquete): Madres gestantes que consumían menos de un paquete diario. Fumadoras (más de un paquete): Madres gestantes que consumían más de un paquete diario.

Este trabajo ha sido diseñado mediante la implementación del programa R, en el que cabe destacar: Variables cualitativas asignadas: no fumadoras: no_fuma Exfumadoras: exfumadoras Fumadoras (menos de un paquete): fuma_menos Fumadoras (más de un paquete): fuma_más

Los datos trabajados presentan un diseño desbalanceado, es decir que vamos a trabajar con grupos que no tendrán el mismo valor en las muestras asignadas (conteo)

Problema Planteado: Según un nuevo estudio llevado a cabo a través del Instituto Nacional de Abuso de Drogas determinó que el consumo de tabaco es un factor importante al momento de gestar. Causa principal de déficit en el peso de los niños recién nacidos. (abuse, 2020) Bajo esta investigación se planea hacer un estudio en el que se identifique bajo qué factor encontrado con las muestras previamente recibidas influye el consumo de tabaco en el desarrollo del niño.

Una medida de interés para la investigación es corroborar que los datos qué concentración respecto al peso de los niños posee,

Bajo el comando de mean, encontramos una conclusión en la que, al momento de optar por una incubación o desarrollo de un bebé nos interesará saber (con base en la información recaudada), que las mujeres que no fuman presentan un mejor desarrollo gestante respecto al peso y, por otra parte, las mujeres que consumen más de un paquete diario presentan el índice más bajo en relación con el peso del niño recién nacido. Empero, uno de los objetivos de esta búsqueda es tener datos confiables, que la varianza sea mínima, ya que entre mayor sea la concentración de los datos la varianza será mínima

Teniendo en cuenta que nuestra variable cualitativa de las mujeres que no fuman es la que se planea trabajar en la investigación, se sugiera hacer un estudio en una población mayor para corroborar supuestos, esto quiere decir que en estos momentos los datos planteados que presentar mayor credibilidad o que denotan el verdadero comportamiento son los que presenta la variable cualitativa de las madres que fuman más de un paquete. Considerando como propósito para futuras investigaciones en la aplicación pediátrica o desarrollo infantil, que al momento de trabajar con datos en busca de la mejora en la incubación los datos trabajados presenten una media alta y una desviación mínima. Trabajando con los datos obtenidos actualmente, se tiene una manera de demostrarlos gráficamente Los colores asociados para cada variable cualitativa serán

no_fuma: exfumadoras: fuma_menos: fuma_más: colores recuperados de la librería

Asociada la variable cualitativa junto con su color se presenta

Con este grafico se puede concluir que los datos presentados por las madres no fumadoras son mejores para la investigación ya que la concentración de sus valores se encuentra distribuidos en la zona de mayores pesos, cabe resaltar un dato atípico en este caso, este dato atípico se puede tomar de manera positiva pues lo que queremos es tener un nacimiento adecuado para los niños. Por otra parte, están las exfumadoras que siguen siendo un valor adecuado, pero al momento de analizar se tiene un dato atípico que puede indicar una cosa, con el paso del tiempo aún quedan las secuelas del consumo de cigarrillo, los datos se encuentran concentrados en una parte notoriamente buena, pero la media de estos denota que la concentración se encuentra por debajo de la media de los datos muestreados. En los datos muestreados de las madres que fuman menos se tiene que en el cuantil uno, es decir en el 25% de los datos se encuentran los niños que pesan entre 2500-3000gr. Conclusión: Entre menor sea el consumo de cigarrillo mayor será el peso de los niños al nacer. Las cajas presentadas no son grandes, es decir que no hay gran valor en la varianza, lo que resalta que los datos tomados para cada grupo cualitativo pueden ser tomados con certeza en el análisis.

Uno de los requisitos para el ANOVA o Análisis de Varianza, es que los datos tengan una distribución normal, sujeto a esto hace una muestra gráfica de los datos planteados

Al ver el histograma se verifica que estos tienden a seguir una distribución normal, se procede a realizar pruebas para verificar supuestos

Análisis descriptivo: Teniendo como Hipótesis: Ho: No existen diferencias significativas en los datos, no influye el consumo de cigarrillo de las madres gestantes en los niños gestados H1: Si hay diferencia significativa, si influye el consumo

Bajo esto se halla la suma de cuadrados entre los grupos y de los grupos junto a los grados de libertad estimados 3 y 23.

Importante en estos datos es el F value el cual es el estadístico de prueba, su valor es de 4.409 o también conocido como el estadístico de prueba El p valor comparado con el nivel de significancia (0.05) es menos, lo que nos lleva rechazar la Hipótesis nula, para un mayor detalle comparamos el estadístico de prueba respecto al valor del punto crítico generado por la significancia y os grados de libertad así: = 3.027998 El valor del estadístico de prueba cae en la región de rechazo, por ende, se rechaza la Hipótesis nula, lo que quiere decir que el consumo de cigarrillos si influye en el peso del niño al momento de nacer.

El estudio presenta una muestra significativa en los tratamientos lo que llevará acabo identificar las diferencias, se hará un análisis para identificar cuales son los grupos que generan estas diferencias, lo haremos bajo la prueba de Tukey

Generados los intervalos para las diferencias de medias se concluye: Las medias de los pares son iguales para casi todos los intervalos, exceptuando el intervalo generado por no_fuma-fuma_más

Análisis de Supuestos: Para comprobar la normalidad se debe revisar la correlación entre los datos dados y la distribución normal

Se verifica que la mayoría de los puntos generados (27), se encuentren ubicados sobre la línea, la línea teórica representa los cuantiles de la distribución normal. El objetivo es que la mayoría se encuentren sobre la línea lo cual indica que hay normalidad en los datos presentados.

Se utiliza la prueba de Shapiro Wilk para la normalidad, siendo: Ho: Los datos tienen distribución normal H1: Los datos no obedecen una distribución normal Por medio de esta prueba se calcula un estadístico de prueba y un p valor determinado

Siendo el p valor mayor a 0.05 Aceptamos la Hipótesis nula, los datos trabajados tienen una distribución normal verificado por la prueba de Shapiro

Para verificar el supuesto de varianzas iguales y el de independencia se analiza el gráfico de residuos vs valores ajustados

Gracias al gráfico se puede observar la variabilidad de los errores, la línea roja demuestra la tendencia que tienen los datos. El objetivo principal es que la línea se aproxime lo mayor posible al cero, se concluye: La tendencia que tienen los datos no se encuentra dispersos o no obedecen un orden desproporcional. Se concluye gráficamente que las varianzas sí son iguales y que los errores sí son independientes.

Homocedasticidad: Se utiliza la prueba de Bartlett, se plantea la Hipótesis: Ho: La varianza de los tratamientos es igual H1: Existen diferencias significativas entre las varianzas

Se tiene que el p valor es mayor a 0.05 con lo que se acepta la Hipótesis nula, la varianza de los tratamientos es igual, las varianzas poblacionales de los consumidores de cigarrillos es la misma.

Verificados los Supuestos se comprueba que el estudio del análisis de ANOVA es ideal.

Se llega a trabajar y determinar el valor del R^2, el cual mide la proporción de variabilidad en la respuesta (consumo de cigarrillos), que se explicará en términos de la variable cualitativa ¿Qué tanto afecta los grupos escogidos para explicar los datos continuos? = 0.3651214 Se tiene que el valor para R^2 es de 0.3651214, se puede concluir respecto a este valor: El consumo de cigarrillo explica el 36.51% del peso de los niños al nacer. Al momento de nacer el consumo de cigarrillos explica el 36.51% del peso que tendrá el niño, existen otros factores no estudiados que afectan el desarrollo. Estadísticamente hablando hace falta estudiar el 63.49% de las causas por las que se ve afectada el desarrollo de los niños al nacer.

CONCLUSIONES: Al momento de investigar las razones que envuelven el desarrollo de los niños al nacer se tiene que el consumo de cigarrillo pertenece al 36.51% de las razones por las que se ve esta afectación, para una mayor certeza se plantea hacer los diferentes estudios que expliquen el 63.49% de las razones que se tienen en cuenta en el deterioro del peso niño recién nacido. Se determinó estadísticamente que las mujeres no fumadoras llevarán un mejor desarrollo respecto al peso de los niños. Los datos trabajados obedecen un orden esto indica que hay certeza en la toma de los datos, es permitido hacer más investigaciones teniendo en cuenta estas mediciones.

Bibliografía abuse, n. i. (2 de Junio de 2020). ¿Cuáles son los riesgos de fumar durante el embarazo? Obtenido de National Institutes of Health: https://www.drugabuse.gov/es/publicaciones/serie-dereportes/adiccion-al-tabaco/cuales-son-los-riesgos-de-fumar-durante-el-embarazo

Librería utilizada en R, obtenido de: http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf