Colaborativo

Open and distance national university Unad School of educational sciences Inferencia estadística Paso 3 Actividad sobre

Views 226 Downloads 0 File size 544KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Open and distance national university Unad School of educational sciences Inferencia estadística

Paso 3 Actividad sobre prueba de hipótesis

Presentado por Yesenia ocupa Castillo - Código: 1121212073 María Judith Ruiz - Código: 1045683998 Niver Orujuela - Código: 1010099724 Gyra Virgelina Diaz - Código: 1111197264 Luz Adriana Osorio Cardona - Código: 1055918749

Tutor. Víctor Manuel Mendoza Grupo: 551112_9

Universidad Nacional Abierta y A Distancia Unad Licenciatura en matemáticas

Open and distance national university Unad School of educational sciences Inferencia estadística

Introducción La inferencia estadística es un tipo de razonamiento que procede de lo concreto a lo general, intentando extraer conclusiones sobre los parámetros de una población a partir de la información contenida en los estadísticos de una muestra de esa población (Pardo y San Martín, 2001). Existen dos métodos de inferencia estadística, el de estimación de parámetros y métodos de contraste de hipótesis. Ambos métodos se basan en el conocimiento teórico de la distribución de probabilidad del estadístico muestral que se utiliza como estimador de un parámetro. A continuación, este trabajo presentará un análisis sobre los métodos de inferencia paramétricos y no paramétricos, expondrá definiciones de: prueba estadística, hipótesis y parámetros poblacionales, hipótesis de investigación, hipótesis alternativa, hipótesis nula, Estadístico de prueba, bondad de la prueba, entre otros. Además, se presentaran ejemplos gráficos y matemáticos.

Open and distance national university Unad School of educational sciences Inferencia estadística

Parte A 1. Realizar un análisis sobre los métodos de inferencia paramétricos y no paramétricos identificando sus ventajas y desventajas en términos de la información muestral. La diferencia entre estadística paramétrica y no paramétrica está basada en el conocimiento o desconocimiento de la distribución de probabilidad de la variable que se pretende estudiar. La estadística paramétrica utiliza cálculos y procedimientos asumiendo que conoce cómo se distribuye la variable aleatoria a estudiar. Por el contrario, la estadística no paramétrica utiliza métodos para conocer cómo se distribuye un fenómeno para, más tarde, utilizar técnicas de estadística paramétrica. Las definiciones de ambos conceptos se ilustran a continuación:  Estadística paramétrica: Hace referencia a una parte de la inferencia estadística que utiliza estadísticos y criterios de resolución fundamentados en distribuciones conocidas.  Estadística no paramétrica: Se trata de una rama de la inferencia estadística cuyos cálculos y procedimientos están fundamentados en distribuciones desconocidas. (López, s,f) Ventajas La ventaja de usar una prueba paramétrica en lugar de una no paramétrica consiste en que la primera tiene más potencia estadística que la segunda. En otras palabras, una prueba Estadística paramétrica tiene mayor capacidad para paramétrica conducir a un rechazo de H0. La mayoría de las veces, el valor p asociado a una prueba paramétrica es menor que el valor p asociado a su equivalente no paramétrica ejecutada sobre los mismos datos. (XLSTAT, s.f) Estadística no Las pruebas no paramétricas son más robustas paramétrica que las paramétricas. En otras palabras, son válidas en un rango más amplio de situaciones (exigen menos condiciones de validez). (XLSTAT, s.f)

Desventajas

Son más complicadas de calcular

Fundamentalmente cuando las muestras son muy grandes las pruebas no paramétricas tienen una eficiencia relativa baja con relación a las paramétricas cuando se cumplen los supuestos. (PRIA, 2001, cap. 1)

Open and distance national university Unad School of educational sciences Inferencia estadística

Las hipótesis que se plantean en las pruebas no paramétricas son menos precisas, lo que hace que la interpretación de los resultados sea más ambigua. (PRIA, 2001, cap. 1)

La propia naturaleza de las pruebas no paramétricas las hace particularmente útiles para comparar variables cualitativas ordinales, Su aplicación en muestras grandes se hace cuyo tratamiento mediante métodos muy laboriosa. (PRIA, 2001, cap. 1) paramétricos clásicos entraña problemas conceptuales ya que estas variables carecen Para un problema particular pueden existir de interpretación numérica. (Laguna, s.f) varias pruebas, por lo que en ocasiones se hace difícil seleccionar la mejor. (PRIA, 2001, cap. 1)

2. Consultar la definición, propiedades, cuando o para qué se utiliza de las siguientes palabras: 



Prueba estadística, hipótesis y parámetros poblacionales Prueba estadística: Las pruebas estadísticas se emplean con la finalidad de establecer la probabilidad de que una conclusión obtenida a partir de una muestra sea aplicable a la población de la cual se obtuvo. (Flores-Ruiz, 2017) Hipótesis estadística: Una hipótesis estadística es una afirmación que se hace sobre una o más características de una población (decir que la vida media de una batería son x horas, que un tratamiento reduce el dolor, que un determinado producto hace adelgazar, que a la gente le gusta mayoritariamente el morbo…). (Quíntela, 2019, p.) Prueba de hipótesis: Una prueba de hipótesis es un procedimiento, con el que se busca tomar una decisión sobre el valor de verdad de una hipótesis estadística. Al realizar una prueba de hipótesis decidimos si rechazar o no rechazar esa hipótesis estadística. Basamos la decisión en la evidencia muestral. (FEDE, 2016) Parámetros poblacionales: Se denomina parámetro poblacional X al valor de la distribución de una característica ó variable en una población. Es interesante considerar que para una población dada, el valor de cada parámetro es constante. Hipótesis de investigación, hipótesis alternativa, hipótesis nula, ¿Cómo usamos esos datos para decidir entre la hipótesis nula y la hipótesis alternativa? Hipótesis de investigación: Es una declaración o teoría que realizan los investigadores cuando especulan sobre el resultado de una investigación o experimento. Hipótesis alternativa: La hipótesis alternativa es la suposición alternativa a la hipótesis nula formulada en un experimento y/o investigación. Esta surge como resultado de una determinada investigación realizada sobre una población o muestra. (Marco, s.f)

Open and distance national university Unad School of educational sciences Inferencia estadística

 



Hipótesis nula: Una hipótesis nula es una suposición que se utiliza para negar o afirmar un suceso en relación a algún o algunos parámetros de una población o muestra. (Marco, s.f) El apoyo para la hipótesis de investigación, también llamada hipótesis alternativa, se obtiene mostrando (usando los datos muestrales como evidencia) que lo contrario de la hipótesis alternativa, llamado hipótesis nula, es falso. Entonces, una teoría se comprueba demostrando que no hay evidencia que sustente la teoría opuesta. (Wackerly, 2009, p.489) Estadístico de prueba: El estadístico de prueba es una función de las mediciones muestrales en las que la decisión estadística estará basada. (Wackerly, 2009, p.490) Nivel de la prueba y bondad de una prueba: Nivel de la prueba: El nivel de significancia, también denotado como alfa o α, es la probabilidad de rechazar la hipótesis nula cuando es verdadera. Bondad de una prueba: Las medidas de bondad en general resumen la discrepancia entre los valores observados y los valores esperados en el modelo de estudio. Región de rechazo de cola superior, región de rechazo de cola inferior y región de rechazo de dos colas La región de rechazo especifica los valores del estadístico de prueba para el cual la hipótesis nula ha de ser rechazada a favor de la hipótesis alternativa. (Wackerly, 2009, p.490) Su localización depende de la forma de la Hipótesis Alternativa: Región de rechazo de cola superior: Si H 1 : μ> μ 0entonces la región se encuentra en la cola derecha de la distribución de la estadística de prueba. (Rohen, s.f) Región de rechazo de cola inferior: Si Si H 1 : μ< μ 0entonces la región se encuentra en la cola izquierda de la distribución de la estadística de prueba. (Rohen, s.f) Región de rechazo de dos colas: Si H 1 : μ ≠ μ0entonces la región se divide en dos partes, una parte estará en la cola derecha de la distribución de la estadística de prueba y la otra en la cola izquierda de la distribución de la estadística de prueba. (Rohen, s.f)

Open and distance national university Unad School of educational sciences Inferencia estadística

Parte B 1

Se sabe que la proporción de artículos defectuosos en un proceso de manufactura es de 0.15. El proceso de vigila en forma periódica tomando muestras aleatorias de tamaño 20 e inspeccionando las unidades. Si se encuentran dos o más unidades defectuosas en la muestra, el proceso se detiene y se considera como “fuera de control”.

A. Enunciar las hipótesis nula y alternativa apropiadas.

Ho = P < 01 H1= P ≥01

Estadístico de prueba

Zp=



¿P – Po P o(1−P o) n

0.15 – 0.1 Zp= 0.1(1−0.1) 20



Zp= 0.745 Tomemos α = 0.05 96% NC – Estadístico de tabla Zt = 1.96 Como Zp < Zt se acepta Ho

Open and distance national university Unad School of educational sciences Inferencia estadística

B. Da probabilidad de cometer un error tipo I en α (Nivel de significancia). En este caso:

P = α = 0.05 = 5%

C. Gráfica

2. Una muestra aleatoria de 100 muertes registradas en Estados Unidos durante el año pasado mostro una vida promedio de 71.8 años. Suponiendo una desviación estándar poblacional de 8.9 años y un nivel de significancia de 0.05. ¿Es apropiado indicar que la vida promedio hoy en día es mayor que 70 años? Justifique su respuesta. -El ejercicio es una distribución muestral de medias con desviación estándar desconocida. -Datos: μ=70 años σ =8.9 años ´x =71,8 años n=100 α =0.05

-Ensayo de hipótesis: H 0: μ=70 años

Open and distance national university Unad School of educational sciences Inferencia estadística

H 1: μ>70 años

-Raga de decisión. Si Z R ≤1.645 no se rechaza H 0 Si Z R >1.645 se rechaza H 0 -Calculando: Z R=

´x R −μ 71.8−70 = =2.02 σ 8.9 √n √ 100

Respuesta: Como 2.02¿ 1.645 se rechaza H 0 y se concluye con un nivel de significancia del 0.05 que la vida media hoy en día es mayor que 70 años.

3. Para justificar su petición de aumento de salario, los empleados del Depto. de despachos de una firma de ventas por correo, sostienen que en promedio el Depto. completa una orden en 13 min. Si Ud. es el gerente general de firma, Que conclusión obtiene si en una muestra de 400 órdenes, da un tiempo medio de terminación del pedido de 14 min, con una desviación estándar de 10 min y un nivel de significancia del 0.05.

4. La cantidad promedio que se coloca en un recipiente en un proceso de llenado se supone que es de 20 onzas. En forma periódica, se escogen al azar 25 recipientes y el contenido de cada uno de éstos se pesa. Se juzga al proceso como fuera de control cuando la media muestral 𝑋̅ es menor o igual a 19.8 o mayor o igual a 20.2 onzas. Se supone que la cantidad

Open and distance national university Unad School of educational sciences Inferencia estadística

que se vacía en cada recipiente se encuentra aproximada, en forma adecuada, por una distribución normal con una desviación estándar de 0.5 onzas. a. Enunciar las hipótesis nula y alternativa que son propias para esta situación. b. Obtener la probabilidad del error de tipo I. c. Obtener y graficas la función de potencia para los siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5. Solución:

c. Obtener y graficas la función de potencia para los siguientes valores medios de llenado: 19.5, 19.6, 19.7, 19.8, 19.9, 20.0, 20.1, 20.2, 20.3, 20.4 y 20.5.

Open and distance national university Unad School of educational sciences Inferencia estadística

5. La media de llenado de las cajas de un cereal determinado en una empresa de empacados es de 368 gr. El proceso es tan rápido que en algunas cajas hay excesos y en otras hay faltante. Supóngase que en una muestra de 25 cajas la desviación estándar de la población es de 15 gr. Y la media muestral es de 372.5 gr. Se rechaza o se acepta la prueba de hipótesis nula, teniendo en cuenta un nivel de significancia del 5%. Es equivalente al Intervalo de confianza del 95%. Iniciamos planteando la hipótesis nula y la hipótesis alternativa: Hipótesis nula: “la media es de 368gr” → H o : μ=368 gr Hipótesis alternativa: “la media es diferente o no es 368 gr” → H o : μ≠ 368 gr Ahora sabemos que esta es una prueba de dos colas porque la hipótesis alternativa no establece una dirección, es decir, no indica si la media es mayor o menor que 368 gr. Solo establece la condición de que es diferente de 368 gr. Se selecciona el nivel de significancia: El enunciado estable un nivel de significancia del 5%, como es una prueba de dos colas: →

5% =2,5=0,025 2

Se establecen los estadísticos de prueba para: ´ Media muestral : X=372.5 Desviación estándar :σ =15 Muestra :n=25 Tenemos que:

Open and distance national university Unad School of educational sciences Inferencia estadística

Entonces según la tabla de valores de la Distribución Normal, para 0,475: Z1 =−1,96 y Z2 =1,96

Intervalo de valores críticos para Z: −1,96< Z