Grupo 46 Trabajo Colaborativo 2

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2

Views 129 Downloads 0 File size 241KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

TRABAJO COLABORATIVO No. 2 INFERENCIA ESTADISTICA

Presentado por Grupo 46: HUMBERTO PERDOMO TRUJILLO COD 83237201 MILTON FERNEY PARRA MEDINA COD:83169930 MANUEL ALFONSO RINCON MENDEZ COD 83232445

Presentado a: Prof. Danis Brito

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD 2011

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

1/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

INTRODUCCION

La mayoría de las decisiones tomadas por los seres humanos en muchas áreas de su desempeño se hacen con base en creencias que se tienen en relación a un concepto de realidad. Cada una de estas creencias o supuestos origina una hipótesis, que es una proposición avanzada con posibilidad de ser verdadera. Surge entonces la necesidad de que la decisión sea tomada con base en la prueba de dicha hipótesis, mediante un método sistemático de evaluar creencias sobre la realidad que requiere de la confrontación de esa creencia con evidencia y así decidir si es aceptable o por el contrario debe descartarse. Este marco conceptual servirá no solo para la toma de decisiones, sino también para extraer conclusiones sobre las características desconocidas de una población cuando se desea conocer la homogeneidad que existe entre varias medias muéstrales, midiendo la variabilidad entre estas, técnica que se conoce como “análisis de varianza”. De esta manera se determina cuáles son las variables independientes de importancia en un estudio, y en qué forma interactúan y afectan la respuesta, de manera que sirven para determinar si se rechaza una hipótesis o no. El propósito de este trabajo es que como estudiantes nos apropiemos e interactuemos con cada uno de los conceptos de tal forma, que los podamos poner en práctica para un mejor desenvolvimiento en problemas en los que se desee comprobar la efectividad de estándares preestablecidos, como lo es el caso de la prueba de hipótesis que nos permite comprobar con mayor certeza el grado de acierto en la fijación de estas dificultades, por ende la prueba de hipótesis, análisis de varianza y estadística no paramétrica nos servirá de apoyo para el análisis y estudio de la presente unidad. Esta actividad se realizó con la masiva participación de los integrantes de este grupo colaborativo, mostrando dinamismo y armonía.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

2/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

OBJETIVOS

OBJETIVO GENERAL Adquirir y entender los conocimientos básicos de la Unidad 2 que nos servirán de base para solucionar problemas relacionados con esta área en el campo profesional y personal. OBJETIVOS ESPECIFICOS  Conocer las herramientas provenientes de la Inferencia Estadística, con la intención de utilizarlas en campos de la ciencia, la tecnología y en nuestra vida cotidiana.  Aprender a trabajar en grupo, aportando ideas significativas para la solución de problemas asignados, y posteriormente debatir con los compañeros para lograr una respuesta bien estructurada.  Aprender conceptos básicos y útiles la Inferencia Estadística, y con ello alcanzar con los objeticos del curso y poder aplicarlos en nuestros campos profesional, ya que esta herramienta matemática es muy versátil y tiene mucha aplicabilidad.  Trabajar en equipo, para dar los puntos de vistas de cada integrante del grupo y luego debatir la solución de cada problema.  Aplicar los fundamentos teóricos en los que se basa la prueba de hipótesis estadística, considerada como alternativa para toma de decisiones.  Conocer las diversas técnicas que ofrece la inferencia estadística de manera, que sean herramientas poderosas en la evaluación, ratificación y extracción de conclusiones sobre características de una población partiendo del buen trato estadístico que sobre una muestra de la misma se haga.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

3/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

 CUERPO DEL TRABAJO 1. Establezca la diferencia entre: Nivel de significación y potencia de una prueba; pruebas paramétricas y pruebas No paramétricas: NIVEL DE SIGNIFICACION Es un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar. Una "diferencia estadísticamente significativa" solamente significa que hay evidencias estadísticas de que hay una diferencia; no significa que la diferencia sea grande, importante, o significativa en el sentido estricto de la palabra.

POTENCIA DE UNA PRUEBA Es la probabilidad de rechazar la hipótesis nula cuando de hecho esta es falsa y debería ser rechazada. Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra, nos permitirán detectar diferencias incluso muy pequeñas entre las estadísticas de muestra y los parámetros de la población.

2. Para tomar la decisión en un contraste de hipótesis se puede comparar el P-Valor con el nivel de significación. Explique cuáles son las condiciones en términos de magnitud de estos factores para rechazar una hipótesis unilateral derecha o unilateral izquierda. Se debe realizar un procedimiento de contraste‚ por medio del cual se toma una decisión basada en la muestra aleatoria seleccionada de la población en estudio. Para llevar a cabo este procedimiento es necesario seleccionar un estadístico de contraste, calcularlo con base en la muestra y luego tomar la decisión de rechazar o no H0, dependiendo de si este estadístico es o no consistente con H0. Es decir, si el valor calculado del estadístico es muy diferente del valor supuesto en H0, suponiendo que ésta es cierta, entonces se rechaza H0. Sin embargo, si el valor calculado del estadístico de contraste es consistente con lo supuesto en H0, entonces no hay razón suficiente para rechazar H0 en favor de la Ha. En resumen, el estadístico de contraste es una variable aleatoria cuya distribución se conoce, en el supuesto de que H0 es verdadera y sirve para tomar la decisión de rechazar o no H0. 3. Qué significan el error tipo I y el error tipo II. Explique su interpretación con un ejemplo: Error Tipo I: Es el error que se comete cuando el investigador no acepta la hipótesis UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

4/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

nula (Ho) siendo ésta verdadera en la población. Ejemplo: Cuando un investigador necesita saber las causas por las cuales una población determinada presenta altos niveles de deserción escolar. Plantea como hipótesis nula que se debe a causas culturales; sin embargo, este mismo investigador rechaza su propia hipótesis; sin embargo, se comprueba que era cierta. 4. Explique cuáles son los supuestos de homogeneidad, homocedasticidad, independencia y Normalidad, que deben cumplirse para validar un análisis de varianzas. La noción de homogeneidad define a la igualdad mayor o menor de los valores de una variable o de una combinación de características en un conjunto geográfico. Los parámetros de dispersión estadística, en particular la varianza, miden su inversa, la heterogeneidad. Dos variables estadísticas son estadísticamente independientes cuando el comportamiento estadístico de una de ellas no se ve afectado por los valores que toma la otra; esto es cuando las relativas de las distribuciones condicionadas no se ven afectadas por la condición, y coinciden en todos los casos con las frecuencias relativas marginales. La homocedasticidad se presenta en un modelo cuando los errores presentan en todas las observaciones de la variable endógena la misma varianza. Dado que hablamos de varianza, la homocedasticidad es un concepto estadístico. Un modelo estadístico relaciona el valor de una variable a predecir con el de otras. Si el modelo es insesgado, el valor predicho es la media de la variable a predecir. En cualquier caso, el modelo nos da una idea del valor que tomará la variable a predecir. La normalidad es una de las distribuciones de muestreo más utilizadas. Caracterizada por una media poblacional μ y una varianza poblacional σ2. Estos parámetros se aproximan por los estadísticos y S2. Muchos datos en realidad siguen una distribución normal y los que no, si se tienen suficientes datos, se pueden “agregar” para que los datos agregados sigan una distribución aproximadamente normal (Teorema del Límite Central) 5. Comprueben a partir de dos muestras independientes de igual tamaño de

hombres y mujeres, la opinión de acuerdo o desacuerdo con algún tema de su interés, a través del contraste de una hipótesis, en la que se establezca si existen diferencias de opinión entre los hombres y mujeres sobre el tema de interés consultado. Interprete los resultados a que quiere llegar este caso. Para dar respuesta a este caso utilice los pasos para el contraste de una hipótesis. CONTRASTE DE HIPOTESIS EJEMPLO. 1. Establecimiento de las hipótesis nula y Hipótesis nula: Las mujeres hablan UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

5/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

alternativa. - La hipótesis nula H0 será aceptada si los datos de la muestra no evidencian que es falsa. - La hipótesis alternativa H1 es la afirmación que se acepta si se rechaza la hipótesis nula. 2. Determinación del criterio de contraste. Se debe especificar el nivel de significación, el tipo de distribución y los valores críticos. Al tomar una decisión respecto a una hipótesis, existen las cuatro situaciones posibles que se indicaron en la tabla anterior. 3. Cálculo del estadístico de prueba. El estadístico de prueba es un valor obtenido a partir de la información de la muestra para compararlo con el criterio de contraste y rechazar o aceptar la hipótesis. Depende de la distribución que se utilice, de modo que los más utilizados en el ámbito de laboratorios para la media y la desviación estándar de la muestra son los siguientes: Toma de la decisión y conclusiones de tipo estadístico. Una regla de decisión supone establecer las condiciones sobre las cuales la hipótesis nula es rechazada o no rechazada. - Si el estadístico de prueba queda dentro de la zona crítica, la hipótesis nula deberá ser aceptada. - Si el estadístico de prueba queda fuera de la zona crítica, la hipótesis nula deberá ser rechazada.

más que los hombres. Hipótesis alterna: Los dos géneros hablan por igual.

El criterio de contraste son la cantidad de palabras promedio que cada uno de los géneros utiliza diariamente. Que ambos géneros hablan en promedio 16.000 palabras por día mientras está despierto. Según estudio realizado en EEUU y Mexico. Cantidad de palabras por minuto en una muestra de 400 personas durante todo un día, dando como resultado: 16.215 para mujeres 15.669 para hombres Siendo iguales

resultados

estadísticamente

Se rechaza la hipótesis nula, debido a los resultados estadísticos del estudio. Se acepta la hipótesis alterna, ya que los resultados la corroboran.

6. Establezca las consideraciones que deben hacerse para seleccionar entre un modelo paramétrico o sus correspondiente no paramétrico. Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. La UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

6/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1). La situación se puede esquematizar: H0 cierta H0 rechazada H0 no rechazada. Ejemplo Se toman datos sobre un nuevo parque de diversiones, calificando el parque de diversiones de 1 a 10, donde 1 es muy malo y 10 es muy bueno. Tema encuestado: Calificación del parque de diversiones Respuestas posibles: Valores entre 1 y 10 Cantidad de hombres:20 Cantidad de mujeres: 20 Mujeres 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Calificación 8 9 7 10 7 6 5 9 8 8 9 5 6 5 6 6 8 6 7 6

Hombres 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Calificación 3 9 10 6 8 9 7 8 4 6 9 8 9 9 8 8 8 8 8 7

Se desea probar la diferencia de opinión entre hombres y mujeres, con un nivel de significancia del 0.05 Definiendo las medias poblacionales: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

7/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

1 = 7.05 2 = 7.6 Desarrollo  Paso 1: Se plantean las hipótesis Nula H0 y la Alternativa H1 H0: 1 = 2 Las dos medias son iguales H1: 1 ≠ 2 Las dos medias son diferentes  Paso 2: Se elige el nivel de significancia, que en este caso se ha planteado en 0.05 y se utiliza la distribución t student ya que las muestras son menores que 30. Los grados de libertad para este caso son: 20 + 20 – 2 = 38 Ahora, como la hipótesis alternativa H1 está planteada como diferente, la prueba es de dos colas.  Paso 3: Como son dos muestras se debe calcular las medias y las varianzas de cada grupo:

n S

Hombres 7.6 20 1.73

Mujeres 7.05 20 1.50

Para el cálculo del valor estadístico se usa la siguiente fórmula:

El valor estadístico aplicando la fórmula es: UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

8/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

 Paso 4: Debido a que el nivel de significancia es de 0.05 y dado que la hipótesis alternativa planteada no señala una dirección, se debe trabajar con una prueba de dos colas. La gráfica entonces es:

 Paso 5: Después de hacer el respectivo análisis se decide no rechazar la hipótesis nula (H0) dado que el valor del estadístico de prueba 1.07 y se ha ubicado en la zona de aceptación de dicha hipótesis; se concluye entonces que no existe diferencia en la opinión (de acuerdo o desacuerdo) entre los 20 hombres y las 20 mujeres con relación al gusto por del parque de diversiones, con un nivel de significancia del 5%. 7. Una de las opciones que tiene la estadística para realizar inferencia sobre los parámetros de una población es la prueba de hipótesis. Explique las ventajas y desventajas con respecto al otro método de estimación. VENTAJAS DESVENTAJAS No incorpora los supuesto restrictivos El uso de pruebas no paramétricas con UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

9/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

de las pruebas paramétricas.

datos que pueden manejarse con pruebas paramétricas produce un desperdicio de información. No requiere que la población subyacente La aplicación de algunas de las pruebas este normalmente distribuido. no paramétricas puede ser laboriosa para muestras grandes. El uso de rangos permite menos errores. 8. Los dos métodos No paramértico para realizar una bondad de ajuste de los datos de una variable con respecto a una distribución de probabilidad son: El de Chicuadrado y el de Kolmogorov - Smirnov . Explique en qué condiciones debe usarse cada uno de ellos. La prueba Chi-cuadrado es otro tipo de prueba que se utiliza para contrastar hipótesis, usada en aquellos casos en que se asume que la distribución de datos no se ajusta a la distribución normal, y por lo tanto no es significativo usar t de Student. Se asume que cuanto menor sea el valor de chi-cuadrado calculado más se aproximan entre si los comportamientos de las dos muestras (cuando son dos), o mejor se aproxima el comportamiento de una sola muestra al valor hipotético de la media asumido para la población. La prueba Kolmogorov - Smirnov debe usarse cuando la variable de análisis es continua. Sin embargo, si la prueba se usa cuando la distribución de la población no es continua, el error que ocurre en la probabilidad resultante está en la dirección segura. Es decir, cuando se rechaza la hipótesis nula, tenemos verdadera confianza en la decisión. También puede aplicarse para tamaños demuestra pequeños, lo que no sucede con la chi cuadrado. 9. El análisis de varianza es una técnica estadística utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones realizadas una experimentación. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta técnica. Para utilizar el ANOVA de forma satisfactoria deben cumplirse tres tipos de hipótesis, aunque se aceptan ligeras desviaciones de las condiciones ideales:1. Cada conjunto de datos debe ser independiente del resto. 2. Los resultados obtenidos para cada conjunto deben seguir una distribución normal. 3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa. Cuando se utiliza la técnica anova se deben cumplir los siguientes supuestos: 1. Las personas de los diversos subgrupos deben seleccionarse mediante el muestreo aleatorio, a partir de poblaciones normalmente distribuidas. 2. La varianza de los subgrupos debe ser homogénea. 3. Las muestras que constituyen los grupos deben UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

10/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

ser independientes. Amenos de que las muestras sean independientes, y que por lo tanto, generen estimaciones de varianza independientes, la razón de las varianzas inter e intra no adoptará la distribución F. 10. Existen dos tipos de modelo de análisis de varianza: de efectos fijos y de efectos aleatorios. Explique el significado cada uno de ellos en un análisis de varianza. Análisis de varianza de efectos fijos El modelo de efectos fijos de análisis de la varianza se aplica a situaciones en las que el experimentador ha sometido al grupo o material analizado a varios factores, cada uno de los cuales le afecta sólo a la media, permaneciendo la "variable respuesta" con una distribución normal. Este modelo se supone cuando el investigador se interesa únicamente por los niveles del factor presentes en el experimento, por lo que cualquier variación observada en las puntuaciones se deberá al error experimental.

Análisis de varianza de efectos aleatorios Los modelos de efectos aleatorios se usan para describir situaciones en que ocurren diferencias incomparables en el material o grupo experimental. El ejemplo más simple es el de estimar la media desconocida de una población compuesta de individuos diferentes y en el que esas diferencias se mezclan con los errores del instrumento de medición. Este modelo se supone cuando el investigador está interesado en una población de niveles, teóricamente infinitos, del factor de estudio, de los que únicamente una muestra al azar (t niveles) están presentes en el experimento.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

11/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

CONCLUSIONES

Del anterior trabajo se puede concluir no solo la importancia que tiene la inferencia estadística hoy día sino también como podemos llegar a aplicar dichos conceptos en las diferentes ciencias del saber. Después de haber realizado a plenitud este trabajo, se ha visto más detalladamente y con más exactitud las pruebas de hipótesis, análisis de varianza y estadística no paramétrica; estos temas están relacionados en cierta forma ya que para dar solución a algunos de los problemas planteados se necesita de la unión de todos los conceptos adquiridos en el curso. Se debe entender que el desarrollo dinámico de estos ejercicios entre los compañeros del grupo es una gran herramienta y oportunidad de aprendizaje e intercambio de opiniones. El trabajo realizado permitió poder interpretar y aplicar los conceptos adquiridos en el transcurso del curso, facilitando el entendimiento y desarrollo de los ejercicios propuestos.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

12/13

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA Escuela de ciencias básicas tecnologías e Ingeniería Inferencia Estadística 2011 Intersemestral

REFERENCIAS

 Rondón Duran, Jorge Eliecer (2010). Módulo de Calculo Diferencial. Segunda Edición, Bogotá – Colombia. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA.  Pruebas no paramétricas. Recuperado el día 10 de Julio de 2011 de: http://www.slideshare.net/freddygarcia/pruebas-no-parametricas-presentation  Errores de Tipo I y de Tipo II. Recuperado el día 13 de Julio de 2011 de: http://es.wikipedia.org/wiki/Errores_de_tipo_I_y_de_tipo_II  Pruebas paramétricas. Recuperado el día 15 de Julio de 2011 de: http://members.fortunecity.com/bucker4/estadistica/paramdesc.htm  El análisis de la varianza. Recuperado el día 19 de Julio de 2011 de: http://www.quimica.urv.es/quimio/general/anovacast.pdf  Kelsey IL, Thompson WD, Evans A. Methods in observational epidemiology. New York. Oxford University Press 1986.  Anderson D. Sweeney D. Williams T. Estadística para administración y economía, International Thomson Editores. México. 1999.  Montgomery D.Runger G. Probabilidad y estadística aplicadas a la ingeniería, McGraw-Hill. México 1996.  Criterios para seleccionar una prueba estadística. Recuperado el día 12 de Julio de 2011 de: http://members.fortunecity.com/bucker4/estadistica/criteriosselecprueb.htm.

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD - www.unad.edu.co

13/13