Prueba 2 Proporciones y 2 Varianzas Resuelto

Prueba de hipótesis para dos muestras: dos varianzas Con la distribución F se pone a prueba la hipótesis de que la varia

Views 212 Downloads 194 File size 423KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Prueba de hipótesis para dos muestras: dos varianzas Con la distribución F se pone a prueba la hipótesis de que la varianza de una población normal es igual a la varianza de otra población normal. En los siguientes ejemplos se muestra el uso de la prueba: 

El índice de rendimiento medio de los dos tipos de acciones comunes puede ser el mismo, pero quizás haya más variación en el índice de rendimiento en un tipo que en otro. Una muestra de 10 acciones relacionadas con la tecnología y 10 acciones de compañías de servicios presentan el mismo índice de rendimiento medio, pero es probable que haya más variación en las acciones vinculadas a la tecnología.



Un estudio del departamento de marketing de un periódico importante revelo que los hombres y las mujeres pasan cerca de la misma cantidad de tiempo por día navegando por la Web. Sin embargo, en el mismo reporte se indica que había casi el doble de variación en el tiempo pasado por día entre los hombres que las mujeres.

Sin importar si se desea determinar si una población tiene más variación que otra o validar una suposición para una prueba estadística, primero se formula la hipótesis nula. La hipótesis nula es que la varianza de una población normal, σ 21, es igual a la varianza de otra población normal, σ22. La hipótesis alternativa podría ser que las varianzas difieran. Para realizar la prueba, se selecciona una muestra aleatoria de n 1 observaciones de una población y una muestra aleatoria de n2 observaciones de la segunda población. El estadístico de prueba se define como sigue.

Los términos s21 y s22 son las varianzas muéstrales respectivas. Si la hipótesis nula es verdadera, el estadístico de prueba sigue la distribución F con n 1 – 1 y n2 – 1 grados de libertad. A fin de reducir el tamaño de la tabla de valores críticos, la varianza más grande de la muestra se coloca en el numerador; de aquí, la razón F que se indica en la tabla siempre es mayor que 1.00. Así, el valor crítico de la cola derecha es el único que se requiere. El valor critico de F para una prueba de dos colas se determina dividiendo el nivel de significancia entre dos (α/2) y después se consultan los grados de libertad apropiados en la tabla de distribución F. Un ejemplo servirá de ilustración.

1

1. Lammers Limos ofrece servicio de transporte en limusina del ayuntamiento de Toledo, Ohio, al aeropuerto metropolitano de Detroit. Sean Lammers, presidente de la compañía, considera dos rutas. Una por la carretera 25 y la otra por la autopista I-75. Lammers desea estudiar el tiempo que tardaría en conducir al aeropuerto por cada ruta y luego comparar los resultados. Recopilo los siguientes datos muéstrales, reportados en minutos. Mediante el nivel de significancia 0.10, ¿hay alguna diferencia en la variación en los tiempos de manejo para las dos rutas?

En otras palabras, se obtuvo la media y la desviación estándar de cada una de las muestras de los tiempos de manejo en cada una de las rutas.

2

Utilizará el procedimiento usual de prueba de hipótesis de cinco pasos. Paso 1. Formule H0 y H1: Cabe hacer notar, que en la práctica habitual se determina la razón F poniendo la mayor de las dos varianzas muéstrales en el numerador. De acuerdo a los datos obtenidos la desviación estándar en la carretera 25 es mayor que en la autopista I-75, por lo que variación será mayor en la carretera que en la autopista. Entonces tenemos que: S21: variación en la carretera 25 S22: variación en la autopista I-75 En este ejercicio lo que desea conocer la empresa es si existe alguna diferencia en la variación en los tiempos de manejo para las dos rutas. En otras palabras, se busca una diferencia en la variación de las dos rutas. No se trata de demostrar que una ruta tiene más variación que la otra. Por lo que se tiene: S21 ≠ S22, siendo esta la hipótesis alternativa o alterna debido a que no contiene al signo igual (=). H1: S21 ≠ S22 Por lo que la hipótesis nula y que si contiene al signo igual (=) es: H0: S21 = S22 Ordenando lo anterior se tiene: H0: S21 = S22 H1: S21 ≠ S22 Paso 2. Seleccione el nivel de significancia: Como en la información que se nos proporciona se específica el nivel de significancia es del 10%, por lo que: α = 10% = 0.1 De lo anterior se deduce que el nivel de confianza es del 90%: 1 - α = 90% = 0.90

3

Paso 3. Determine el estadístico de prueba: El estadístico de prueba apropiado sigue la distribución F. Paso 4. Formule la regla de decisión: El valor crítico lo obtiene de la tabla F, del cual se reproduce una parte como se muestra en la siguiente tabla:

Cabe hacer notar, que en la práctica habitual se determina la razón F poniendo la mayor de las dos varianzas muéstrales en el numerador. Esto hará que la razón F sea al menos 1.00. Esto permite utilizar siempre la cola derecha de la distribución F, y así evitar la necesidad de requerir tablas F más extensas. Puesto que conduce una prueba de dos colas, el nivel de significancia en la tabla es 0.05, determinado mediante α/2 = 0.10/2 = 0.05. En la primera muestra hay 6 grados de libertad que de acuerdo a la fórmula del estadístico a calcular este sería el numerador: n1 -1 = 7 – 1 = 6 en donde n1 es el número de elementos en la primera muestra. En la segunda muestra hay 7 grados de libertad que de acuerdo a la fórmula del estadístico a calcular este se encuentra en el denominador: n2 -1 = 8 – 1 = 7 en donde n2 es el número de elementos en la segunda muestra.

4

Para encontrar el valor crítico, recorre en forma horizontal la parte superior de la tabla F para el nivel de significancia 0.05 para 6 grados de libertad en el numerador. Después va hacia abajo por esa columna hasta el valor crítico opuesto a 7 grados de libertad en el denominador. El valor crítico es 3.87. Por tanto, la regla de decisión es: rechazar la hipótesis si la razón de las varianzas muéstrales es mayor que 3.87. De Minitab se tiene:

Gráfica de distribución F; df1=6; df2=7

0,7 0,6

Densidad

0,5 0,4 0,3 0,05 0,2 0,1 0,0

0,05 0 0,2377 X

3,866

Siendo los valores críticos para Minitab 0.2377 y 3.866. Entonces la regla de decisión para Minitab será: si el valor calculado de F se encuentra en la región entre 0.2377 y 3.866, no se rechaza la hipótesis nula. Paso 5. Calcule el estadístico de prueba: a) Calcula el valor del estadístico de prueba: Por ultimo debe tomar la razón de las dos varianzas muéstrales, determinar el valor del estadístico de prueba y tomar una decisión respecto de la hipótesis nula. Observe que la formula se refiere a las varianzas muéstrales, pero se calcularon las desviaciones estándar de las muestras. Es necesario elevar al cuadrado las desviaciones estándar para determinar las varianzas.

5

b) A partir de lo anterior, ¿Cuál es tu conclusión? La decisión es rechazar la hipótesis nula, debido a que el valor F calculado (4.23) es mayor que el valor critico (3.87). Se concluye que hay una diferencia en la variación de los tiempos de recorrido por las dos rutas.

Gráfica de distribución F; df1=6; df2=7

4,23

0,7 0,6

Densidad

0,5 0,4 0,3 0,2

0,05

0,1 0,0

0,05 0 0,2377

X

3,866

6