Tema8

Capítulo 8 Contrastes de Hipótesis 8.1. Introducción. Conceptos básicos Una hipótesis estadística es una afirmación a

Views 70 Downloads 58 File size 187KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Capítulo 8

Contrastes de Hipótesis 8.1.

Introducción. Conceptos básicos

Una hipótesis estadística es una afirmación acerca de una característica poblacional formulada en base a los parámetros de su distribución. Existen diversos tipos de hipótesis: - Hacen referencia a un parámetro de una población. Por ejemplo, consideremos el rendimiento obtenido en un proceso químico,X, con distribución N (µ, σ), siendo µ desconocido. Podríamos plantear las siguientes hipótesis: µ = 90 µ 6= 90 µ > 90 µ < 90 Si la hipótesis asigna un único valor al parámetro se le llama hipótesis simple, en caso contrario, hipótesis compuesta. En este ejemplo, la primera es simple y el resto son compuestas. - Comparan parámetros de varias poblaciones. Por ejemplo, supongamos que queremos contrastar si el fumar provoca cáncer. Esto equivale a contrastar si la proporción de fumadores con cáncer, p1 , es significativamente mayor que la proporción de no fumadores con cáncer, p2 . 119

120

Capítulo 8. Contrastes de Hipótesis

Contrastar una hipótesis es comparar lo que dice la hipótesis con la información que nos proporciona una muestra. Si hay coincidencia, dentro de un margen de error admisible entre la hipótesis planteada (hipótesis nula, H0 ) y la información muestral entonces la mantendremos como cierta, en caso contrario la rechazaremos. Rechazar una hipótesis es sustituirla por otra que sea capaz de explicar la realidad observada en la muestra (hipótesis alternativa, H1 ). Por ejemplo, supongamos que nos planteamos si el rendimiento del proceso puede ser en media del 90 %, H0 : µ = 90. Realizamos una serie de pruebas y el rendimiento medio muestral −

resulta ser x = 75, menor que 90. La información muestral parece ir más a favor de H1 : µ < 90 que de H0 : µ = 90. Una cosa en la que hay que hacer hincapié es la siguiente: nunca podemos afirmar el que una hipótesis sea verdadera o falsa, ya que para ello tendríamos que tener observaciones de toda la población. Por lo tanto, al realizar un contraste y tomar una decisión siempre cabe la posibilidad de equivocarnos. Existen dos tipos de errores asociados a cualquier contraste: error tipo I, que tiene lugar cuando rechazamos H0 siendo cierta, y error tipo II, que ocurre si aceptamos H0 siendo falsa. H0 cierta

H0 falsa

Acepto H0

No hay error

Error tipo II

Rechazo H0

Error tipo I

No hay error

A la probabilidad de que ocurra el error tipo I se le llama nivel de significación del contraste, que denotamos por α y que fijamos antes de realizar un contraste. A la probabilidad de error tipo II la denotamos por β. A 1 − α se le llama nivel de confianza, y a 1 − β potencia del test. α = P (error tipo I)=P (rechazar H0 /H0 es cierta ) , β

= P (error tipo II)=P (aceptar H0 /H0 es falsa )

Lógicamente, a medida que uno disminuye el otro aumenta. Un ejemplo clásico es el siguiente: supongamos que un juez tiene que declarar a un individuo culpable o inocente. H0

: inocente

H1

: culpable

121

8.2. Pasos a seguir para realizar un contraste

Si rechaza H0 declara culpable al individuo, y si la acepta lo declara inocente. Comete un error de tipo I si declara culpable al acusado siendo inocente, y un error de tipo II si lo declara inocente siendo culpable. Desde el punto de vista moral parece más grave el primer error, de ahí que en un contraste se fije el nivel de significación α y se minimice β.

8.2.

Pasos a seguir para realizar un contraste

1. Planteamos la hipótesis nula H0 (de tipo igualdad) y la alternativa H1 (a favor de la información muestral). H0 :

θ = θ0

H1 :

θ 6= θ0 θ < θ0 θ > θ0

2. Fijamos el nivel de significación del contraste α.Generalmente se fija en 0.05, 0.01 o 0.1. 3. Determinamos una medida de discrepancia entre la hipótesis nula y la información muestral. Esta medida estará en función de la diferencia del valor que especifica H0 para el parámetro y el estimador muestral del parámetro, y tendrá distribución conocida. A tal medida la llamamos estadístico de contraste bajo H0 . 4. Determinamos la discrepancia máxima que estamos dispuestos a admitir para aceptar H0 . Este valor dependerá de la distribución del estadístico de contraste bajo H0 , del nivel de significación α especificado y del tipo de hipótesis alternativa que tengamos. Delimita las regiones de aceptación y rechazo de H0 . 5. Concluimos: si el estadístico de contraste observado (empírico) cae en la región de rechazo, rechazamos H0 , en caso contrario, la mantendremos como cierta. Ejemplo 8.1: Sea X → N (µ, σ) con µ, σ desconocidas, y sobre µ planteamos el siguiente contraste:

Delia Montoro Cazorla.

Dpto.

H0

: µ = 90

H1

: µ > 90

de Estadística e I.O. Universidad de Jaén.

122

Capítulo 8. Contrastes de Hipótesis

Seleccionamos una muestra de tamaño n y el estadístico de contraste bajo H0 (suponiendo H0 cierta) es: −

X − 90 T = → tn−1 , S √ n −

2 ya que Z = X−µ σ → N (0, 1), χ = √ n

(n − 1)S 2 Z → χ2n−1 , son independientes, y T = r 2 . σ2 χ n−1 −

Observemos que valores observados en X mucho mayores que 90 irían claramente a favor de H1 (en contra de H0 ). A su vez tales valores llevarían a un estadístico de contraste T muy grande y positivo. En consecuencia, valores muy grandes y positivos en T nos llevarían a rechazar H0 .(siendo cierta). De ahí que la región de rechazo esté en este caso en la cola de la derecha (de la distribución tn−1 ) y presente un aréa igual a α (probabilidad de rechazar H0 siendo cierta). El valor que delimita la región de rechazo es por lo tanto t1−α,n−1 . Entonces rechazaremos H0 si el estadístico de contraste observado, t, es mayor o igual que t1−α,n−1 . A la probabilidad de que el estadístico de contraste teórico, este caso T, sea mayor que el observado, en este caso t, se le llama p-valor. Por lo tanto, el criterio de rechazo en base al p-valor será: rechazar H0 siempre que el p-valor sea menor o igual que α. −

Supongamos que una muestra seleccionada de tamaño 20 nos proporciona una media x = 98 y una desviación típica s = 2,21. El estadístico observado es por tanto t=

98 − 90 = 16,188 2,21 √ 20

Para un nivel de significación α = 0,05, t1−α,n−1 = t0,95,19 = 1,73. Como 16,188 no es mayor que 1,73 no podemos rechazar H0 . Ejemplo 8.2: Sobre el ejemplo anterior, consideremos ahora la hipótesis alternativa H1 : µ < 90. H0

: µ = 90

H1

: µ < 90



En este caso, valores en X mucho menores que 90 irían a favor de H1 (en contra de H0 ). Por lo tanto, valores muy grandes en valor absoluto y negativos en el estadístico de contraste llevarían a rechazar H0 . La región de rechazo está ahora en la cola de la izquierda, y el valor que la delimita es tα,n−1 . Rechazamos entonces H0 si t ≤ tα,n−1 .

123

8.3. Contrastes de hipótesis clásicos −

Si observamos una muestra de tamaño 20 y se obtiene una media muestral x = 83 y una desviación típica s = 1,96, el estadístico observado es: t = −3,068, y tα,n−1 = t0,05,19 = −1,73. Como −3,068 es menor que −1,73, rechazamos H0 para un nivel de significación del 5 %. Por lo tanto, el rendimiento medio es significativamente menor que 90. Ejemplo 8.3: Consideremos por último la hipótesis alternativa H1 : µ 6= 90. H0

: µ = 90

H1

: µ 6= 90

En este caso valores en el estadístico muy grandes en valores absoluto, negativos y positivos, llevarían a rechazar H0 . Existen ahora por lo tanto dos regiones de rechazo, una a la izquierda y otra a la derecha, cada una de las cuales engloba un área de α/2. Los valores que las delimitan son respectivamente tα/2,n−1 =-t1−α/2,n−1 y t1−α/2,n−1 . Rechazamos H0 si t ≤-t1−α/2,n−1 o t ≥ t1−α/2,n−1 .



Para una muestra de tamaño 20 con media x = 80 y desviación muestral s = 1,86, t = −24,044, y t1−α/2,n−1 = t0,975,19 = 2,09. Como −24,044 es menor que −2,09, rechazamos H0 para un nivel de significación del 5 %. El rendimiento medio es significativamente distinto de 90.

8.3.

Contrastes de hipótesis clásicos

8.3.1.

Contraste para la media de una normal con varianza conocida

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X → N (µ, σ), σ conocida. Hipótesis nula

Estadístico de contraste ¯ − µ0 X √ Z= σ/ n

H0 : µ = µ0 Hipótesis alternativa

Criterios de rechazo

H1 : µ 6= µ0

Z ≤ zα/2 o Z ≥ z1−α/2

H1 : µ > µ0

Z ≥ z1−α

H1 : µ < µ0

Z ≤ zα

Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

124

Capítulo 8. Contrastes de Hipótesis

Ejemplo 8.4: Los sistemas de escape de emergencia para las tripulaciones de aeronaves son impulsados por un combustible sólido. Una de las características de este producto es la rapidez de combustión, que se supone con distribución Normal. Las especificaciones requieren que la rapidez promedio de combustión sea de 50 cm/s. Se sabe que la rapidez estándar de la rapidez de combustión es σ = 2cm/s. El experimentador decide especificar una probabilidad para el error tipo I de α = 0,05. Selecciona una muestra aleatoria de tamaño 25 y se obtiene una media muestral de 53.1 cm/s. ¿A qué conclusiones llega?. Planteamos el siguiente contraste: H0

: µ = 50

H1

: µ 6= 50

con varianza conocida. El estadístico de contraste es: Z=

53,1 − 50 √ = 7,75 2/ 25

Rechazamos H0 si Z ≤ zα/2 o Z ≥ z1−α/2 , siendo zα/2 = z0,025 = −1,96 y z1−α/2 = z0,975 = 1,96. Por lo tanto, rechazamos H0 para un nivel de significación del 5 %. La rapidez de combustión es significativamente distinta de 50 cm/s.

8.3.2.

Contraste para la media de una normal con varianza desconocida

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X → N (µ, σ), σ desconocida. Hipótesis nula H0 : µ = µ0

Estadístico de contraste ¯ − µ0 X √ T = S/ n

Hipótesis alternativa

Criterios de rechazo

H1 : µ 6= µ0

T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1

H1 : µ > µ0

T ≥ t1−α,n−1

H1 : µ < µ0

T ≤ tα,n−1

125

8.3. Contrastes de hipótesis clásicos

Ejemplo 8.5: Un artículo publicado en la revista Materials Engineering describe los resultados de pruebas de resistencia a la adhesión de 22 especímenes de aleación U-700. La carga para la que cada especimen falla es la siguiente (en MPa): 19.8

18.5

17.6

16.7

15.8

15.4

14.1

13.6

11.9

11.4

11.4

8.8

7.5

15.4

15.4

19.5

14.9

12.7

11.9

11.4

10.1

7.9

¿Sugieren los datos que la carga promedio de fallo es mayor que 10 MPa?. Realizar el contraste a un 10 % de significación. El contraste a realizar es:

H0

: µ = 10

H1

: µ > 10

con varianza σ2 desconocida. La media y desviación típica muestrales resultan 13.71 y 3.55 respectivamente, con lo cual: t=

13,71 − 10 √ = 4,90 3,55/ 22

Dado que t = 4,90 > t1−α,n−1 = t0,95,21 = 1,72, rechazamos H0 al 5 % de significación. La carga promedio de fallo es significativamente mayor que 10.

8.3.3.

Contraste para la varianza de una normal con media conocida

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X → N (µ, σ), con µ conocida. Hipótesis nula H0 : σ 2 = σ 20

Estadístico de contraste Pn (xi − µ)2 2 χ = i=1 2 σ0

Hipótesis alternativa

Criterios de rechazo

H1 : σ 2 6= σ 20

χ2 ≤ χ2α/2,n o χ2 ≥ χ21−α/2,n

H1 : σ 2 < σ 20

χ2 ≤ χ2α,n

H1 : σ 2 > σ 20

Delia Montoro Cazorla.

Dpto.

χ2 ≥ χ21−α,n

de Estadística e I.O. Universidad de Jaén.

126

Capítulo 8. Contrastes de Hipótesis

8.3.4.

Contraste para la varianza de una normal con media desconocida

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X → N (µ, σ), con µ desconocida. Hipótesis nula

Estadístico de contraste

H0 : σ 2 = σ 20

χ2 =

(n − 1) S 2 σ20

Hipótesis alternativa

Criterios de rechazo

H1 : σ 2 6= σ 20

χ2 ≤ χ2α/2,n−1 o χ2 ≥ χ21−α/2,n−1

H1 : σ 2 < σ 20

χ2 ≤ χ2α,n−1

H1 : σ 2 > σ 20

χ2 ≥ χ21−α,n−1

Ejemplo 8.6: Un fabricante de detergente líquido está interesado en la uniformidad de la máquina que utiliza para llenar las botellas. De manera específica, es deseable que la varianza del proceso de llenado sea menor que 0.01, de otro modo existe un porcentaje mayor que el deseable de botellas con un contenido menor de detergente. Supóngase que la distribución del volumen de llenado es aproximadamente Normal. Al tomar una muestra aleatoria de 20 botellas se obtiene una varianza muestral de 0.0153. ¿Tiene el fabricante problemas en el proceso de llenado de las botellas?. Realizar el contraste al 5 % de significación. El contraste a realizar es:

H0

: σ 2 = 0,01

H1

: σ 2 > 0,01

con media desconocida. El estadístico de contraste resulta: χ2 =

19 ∗ 0,0153 = 29,07 0,01

Puesto que 29.07 no es mayor que χ21−α,n−1 = χ20,95,19 = 30,14, no podemos rechazar H0 , no hay suficiente evidencia empírica para concluir que la varianza del proceso de llenado es superior a la deseada.

127

8.3. Contrastes de hipótesis clásicos

8.3.5.

Contraste para el cociente de varianzas de dos normales independientes con medias conocidas

Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una población X → N (µ1 , σ 1 ), y Y1 , Y2 , ..., Yn2 una muestra aleatoria de una población Y → N (µ2 , σ 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula

Hipótesis alternativa

Estadístico de contraste Pn1 (xi − µ1 )2 /n1 F = Pi=1 n2 2 i=1 (yi − µ2 ) /n2

H1 : σ 21 6= σ 21

F ≤ 1/f1−α/2,n2 ,n1 o F ≥ f1−α/2,n1 ,n2

H0 : σ 21 = σ 22

H1 : σ 21 > σ 22 H1 :

8.3.6.

σ 21




σ 22

F ≥ f1−α,n1 −1,n2 −1

H1 : σ 21 < σ 22

8.3.7.

S 21 S 22

F ≤ 1/f1−α,n2 −1,n1 −1

Contraste para la diferencia de medias de dos normales independientes con varianzas conocidas

Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

128

Capítulo 8. Contrastes de Hipótesis

Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una población X → N (µ1 , σ 1 ), y Y1 , Y2 , ..., Yn2 una muestra aleatoria de una población Y → N (µ2 , σ 2 ). Ambas poblaciones se suponen independientes. Hipótesis nula

8.3.8.

H0 : µ1 − µ2 = δ 0

Estadístico de contraste ¯ − Y¯ − δ 0 X Z= s σ2 σ21 + 2 n1 n2

Hipótesis alternativa

Criterios de rechazo

H1 : µ1 − µ2 6= δ 0

Z ≤ zα/2 o Z ≥ z1−α/2

H1 : µ1 − µ2 > δ 0

Z ≥ z1−α

H1 : µ1 − µ2 < δ 0

Z ≤ zα

Contraste para la diferencia de medias de dos normales independientes con varianzas desconocidas pero iguales

Sea X1 , X2 , ..., Xn1 una muestra aleatoria de una población X → N (µ1 , σ), y Y1 , Y2 , ..., Yn2 una muestra aleatoria de una población Y → N (µ2 , σ). Ambas poblaciones se suponen independientes. Hipótesis nula H0 : µ1 − µ2 = δ 0

Estadístico de contraste ¯ − Y¯ − δ 0 X T =s µ ¶ 1 1 Sp2 + n1 n2

Hipótesis alternativa

Criterios de rechazo

H1 : µ1 − µ2 6= δ 0

T ≤ tα/2,n o T ≥ t1−α/2,n

H1 : µ1 − µ2 > δ 0

T ≥ t1−α,n

H1 : µ1 − µ2 < δ 0

T ≤ tα,n

donde n = n1 + n2 − 2 (n1 − 1) S 21 + (n2 − 1) S 22 Sp2 = n

,

129

8.3. Contrastes de hipótesis clásicos

Ejemplo 8.7: Se analizan dos catalizadores para determinar la forma en la que afectan el rendimiento promedio de un proceso químico. De manera específica, el catalizador 1 es el que se está empleando en este momento, pero el catalizador 2 también es aceptable. Como el catalizador 2 es más caro, sólo interesará emplearlo siempre y cuando aumente el rendimiento promedio del proceso. Se hace una prueba piloto, y los rendimientos obtenidos en % son los siguientes: Catalizador 1

Catalizador 2

91.5

89.19

94.18

90.95

92.18

90.46

95.39

93.21

91.79

97.19

89.07

97.04

94.72

91.07

89.21

92.75

(a) Contrastar al 10 % de significación si la variabilidad en el rendimiento del proceso puede considerarse independiente del catalizador empleado. El contraste es: H0

: σ21 = σ 22

H1

: σ21 6= σ 22

con medias desconocidas. El estadístico de contraste resulta: F =

S 21 5,688 = = 0,639 S 22 8,901

Como F no es menor que 1/f1−α/2,n2 −1,n1 −1 = 1/f0,95,7,7 = 0,264 ni F es mayor que f1−α/2,n1 −1,n2 −1 = f0,95,7,7 = 3,79, no podemos rechazar H0 , por lo tanto, la variabilidad en el rendimiento del proceso puede considerarse independiente del catalizador empleado. (b) Contrastar al 5 % si interesa emplear el catalizador 2. Veamos si el catalizador 2 aumenta el rendimiento promedio del proceso. Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

130

Capítulo 8. Contrastes de Hipótesis

Planteamos entonces el siguiente contraste: H0

: µ1 − µ2 = 0

H1

: µ1 − µ2 < 0

con varianzas desconocidas pero iguales (según el contraste realizado anteriormente). ¯ − Y¯ − δ 0 92,255 − 92,733 − 0 X µ µ ¶= s ¶ = −0,354 1 1 1 1 Sp2 + 7,295 + n1 n2 8 8

T =s

Como T no es menor que tα,n = t0,05,14 = −1,761 no podemos rechazar H0 para un nivel de significación del 5 %. Por lo tanto, el catalizador 2 no aumenta significativamente el rendimiento promedio del proceso.

8.3.9.

Contraste para la diferencia de medias de dos normales relacionadas (muestras apareadas) con varianzas desconocidas pero iguales

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X → N (µ1 , σ), apareada con una muestra Y1 , Y2 , ..., Yn de una población Y → N (µ2 , σ). Hipótesis nula

Hipótesis alternativa

Estadístico de contraste ¯ − δ0 D T = q 2

H1 : µ1 − µ2 6= δ 0

T ≤ tα/2,n−1 o T ≥ t1−α/2,n−1

H1 : µ1 − µ2 > δ 0

T ≥ t1−α,n−1

H1 : µ1 − µ2 < δ 0

T ≤ tα,n−1

H0 : µ1 − µ2 = δ 0

SD n

Criterios de rechazo

donde D = X − Y . Ejemplo 8.8: Se desea comparar dos métodos para predecir la resistencia al corte de vigas de placa de acero. Con este fin se selecciona una muestra de 9 vigas, a las que se aplican los

131

8.3. Contrastes de hipótesis clásicos

dos métodos. Los datos se presentan en la siguiente tabla: Mét. 1

1.186

1.151

1.322

1.339

1.2

1.402

1.365

1.537

1.559

Mét. 2

1.061

0.992

1.063

1.062

1.065

1.178

1.037

1.086

1.052

Contrastar al 5 % de significación si existe alguna diferencia entre estos dos métodos. Claramente se trata de un contraste de igualdad de medias en muestras apareadas (se aplica a las mismas vigas los dos métodos). Llamamos D a la diferencia de resistencia entre el método 1 y el método 2 y el contraste es: H0

: µD = 0

H1

: µD 6= 0

0.277

0.138

Los valores muestrales de D son: D

0.119

0.159

0.259

0.224

0.328

0.451

0.507 ,

que proporcionan una media de 0.2736 y una desviación de 0.1356. El estadístico de contraste observado es: 0,2736 = 6,05, T =q 0,13562 9

tα/2,n−1 = t0,025,8 = −2,306 y t1−α,n−1 = t0,975,8 = 2,306.

Al ser 6.05 mayor que 2.306, rechazamos H0 , es decir, los métodos proporcionan resultados diferentes.

8.3.10.

Contraste para una proporción

Sea X1 , X2 , ..., Xn una muestra aleatoria de una población X →Bernoulli(p). Hipótesis nula H0 : p = p0

Estadístico de contraste pˆ − p0 Z=r p0 (1 − p0 ) n

Hipótesis alternativa

Criterios de rechazo

H1 : p 6= p0

Z ≤ zα/2 o Z ≥ z1−α/2

H1 : p > p0

Z ≥ z1−α

H1 : p < p0

Z ≤ zα

Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

132

Capítulo 8. Contrastes de Hipótesis

Ejemplo 8.9: Un distribuidor adquirirá un lote de equipos si el porcentaje de defectuosos no es mayor que el 3 %, y se quiere una probabilidad del 5 % de rechazar la compra aunque verifique la condición requerida. Prueba 30 equipos y 2 de ellos resultan defectuosos. ¿Qué decisión debe adoptar?. Llamamos p a la proporción de equipos defectuosos en el lote, y queremos comprobar si es mayor que 0.03. Realizamos para ello el siguiente contraste: H0

: p = 0,03

H1

: p > 0,03

En este caso el nivel de significación viene dado por: α = P (Rechazar H0 /H0 cierta ) = P (Rechazar el lote/no contiene más del 3 % de defectuosos)=0.05 ˆ

La proporción de defectuosos en la muestra es p = 2/30 = 0,067,con lo cual: 0,067 − 0,03 = 1,188 Z=r 0,03 ∗ 0,97 30 Al ser no ser Z mayor que z1−α = z0,95 = 1,65 no se rechaza H0 . Es decir, no hay suficiente evidencia empírica para concluir que el porcentaje de defectuosos por lote es superior al 3 %.

8.3.11.

Contraste para la comparación de dos proporciones

Sean X1 , ..., Xn1 una m.a.s. de X → Bernoulli(p1 ) y Y1 , ..., Yn2 una m.a.s. de Y → Bernoulli(p2 ). Ambas poblaciones se suponen independientes. Hipótesis nula H0 : p1 = p2

Hipótesis alternativa

Estadístico de contraste pˆ1 − pˆ2 Z=r ³ ´ ³ ´ ˆ ˆ ˆ ˆ pT 1 − pT /n1 + pT 1 − pT /n2 Criterios de rechazo

H1 : p1 6= p2

Z ≤ zα/2 o Z ≥ z1−α/2

H1 : p1 > p2

Z ≥ z1−α

H1 : p1 < p2

Z ≤ zα

133

8.3. Contrastes de hipótesis clásicos

donde pˆT =

n1 pˆ1 + n2 pˆ2 n1 + n2

Ejemplo 8.10: Una central de productos lácteos recibe diariamente la leche de dos granjas A y B. Con el fin de estudiar la calidad de los productos recibidos se extraen dos muestras, una de cada granja, y se analiza el contenido de materia grasa de cada producto. Se obtienen los siguientes resultados: Granja A

Granja B

0.32

0.28

0.29

0.30

0.30

0.33

0.28

0.29

0.33

0.31

0.31

0.29

0.30

0.33

0.29

0.32

0.33

0.29

0.32

0.32

0.30

0.31

0.29

0.32 0.29 0.33

Si la central rechaza aquellos productos con un contenido graso superior a 0.32, ¿existen diferencias significativas entre los porcentajes de productos de A y B que se tendrían que rechazar?. Realizar el contraste al 5 % de significación. El contraste es: H0

: p1 = p2

H1

: p1 6= p2

donde el subíndice 1 hace refencia a la granja A y el 2 a la B. Las proporciones de productos que superan un contenido graso de 0.32 en las muestras son pˆ1 = 0,167 y pˆ2 = 0,214, y la Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

134

Capítulo 8. Contrastes de Hipótesis

proporción muestral total es pˆT = 0,192. Por lo tanto, el estadístico de contraste resulta: 0,167 − 0,214 = −0,303 Z=p 0,192 (1 − 0,192) /12 + 0,192 (1 − 0,192) /14

Como Z no es menor que z0,025 = −1,96 ni Z es mayor que z0,975 = 1,96 no podemos rechazar H0 . No existen diferencias significativas en las proporciones de productos a rechazar en ambas granjas.

8.4.

Relación entre intervalos de confianza y contrastes de hipótesis

Existe una estrecha relación entre la prueba de una hipótesis estadística sobre un parámetro θ y el intervalo de confianza de θ. Si denotamos por [θL , θU ] el intervalo de confianza para θ a un nivel de confianza del (1 − α)100 %, entonces el contraste bilateral (dos colas) H0

: θ = θ0

H1

: θ 6= θ0

a un nivel de significación α conduce a rechazar H0 si θ0 no pertenece al intervalo [θL , θU ].

8.5.

Ejercicios

1. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias, ambas de tamaño 300, y se encuentan 15 piezas defectuosas en la muestra de la máquina 1 y 8 defectuosas en la muestra de la máquina 2. ¿Podemos concluir que la máquina 2 produce menos piezas defectuosas que la máquina 1?. Realizar el contraste para un nivel de significación a = 0,05. Suponer que sendas muestras proceden de poblaciones normales e independientes. 2. En un proceso de fabricación de tubos de aluminio, la longitud de éstos se distribuye según una normal de media 100 cm y varianza 16 cm2 . Se realiza una reparación y ahora se desea discernir si ha habido un cambio en la longitud media de los tubos. Para ello se

135

8.5. Ejercicios

selecciona una muestra de tamaño 9, obteniéndose una media muestral de 102 cm. Para un nivel de significación del 5 %, ¿a qué conclusión se llega?. 3. Dos laboratorios farmacéuticos presentan sendas vacunas contra la alergia en el mercado al mismo tiempo. Una organización de consumidores desea comprobar cuál es más efectiva de las dos. Con este fin, aplican cada vacuna a una muestra de 10 personas alérgicas y se mide el nivel de alergia (de 0 a 3) que presentan en la primavera del año siguiente. Los resultados son: Vacuna 1

1

2

1

2

1

1

2

1

1

2

Vacuna 2

2

3

3

2

1

3

2

2

2

3

¿Es la vacuna 1 significativamente más eficaz que la 2? Realizar el contraste al 5 % de significación. 4. Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo de corriente distinto. El departamento de ingeniería ha obtenido los datos siguientes: Diseño 1 Diseño 2



n1 = 15

x1 = 24,2

S21 = 10

n2 = 10

− x2

S22 = 10,89

= 23,9

Determinar si existe alguna diferencia significativa en el flujo de corriente de los dos diseños. Tomar α = 0,05. 5. Dos compañías de compuestos químicos pueden surtir materia prima, y la concentración de un elemento en particular en este material es importante. La concentración promedio de ambos proveedores es la misma, pero se sospecha que la variabilidad en la concentración puede diferir en las dos compañías. La desviación estándar de la concentración en una muestra aleatoria de 15 lotes producidos por la compañía 1 es 4.7g/l, mientras para la compañía 2, una muestra de 20 lotes proporciona una desviación estándar de 5.8 g/l. ¿Existe suficiente evidencia en los datos para concluir que la variabilidad en la compañía 1 es mayor que la variabidad de la compañía 2? Realizar el constraste para un nivel de significación del 5 %. 6. Un fabricante de lentes intraoculares evalúa una nueva máquina pulidora. El fabricante aprobará la máquina si el porcentaje de lentes pulidos que contienen defectos en la superficie no es mayor del 2 %. Se toma una muestra aleatoria de 250 lentes y se encuentra Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

136

Capítulo 8. Contrastes de Hipótesis

que 6 de ellos tienen defectos. ¿Aprueba el fabricante la nueva máquina pulidora?. Tomar α = 0,1 7. Se utilizan dos máquinas diferentes de moldeo por inyección para la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias, cada una de tamaño 300, y se encuentran 15 defectuosas en la primera y 8 en la segunda. ¿Es razonable concluir que la proporción de defectuosas es la misma en ambas máquinas?. Realizar el contraste al 5 % de significación. 8. Quince hombres adultos con edades comprendidas entre 35 y 50 años participan en un estudio para evaluar el efecto de la dieta y el ejercicio sobre el nivel de colesterol en la sangre. Los niveles de colesterol medidos sobre cada individuo antes y después de haber realizado el programa (dieta baja en grasas y ejercicio) aparecen en la siguiente tabla: Sujeto

Antes

Después

1

265

229

2

240

231

3

258

227

4

295

240

5

251

238

6

245

241

7

287

234

8

314

256

9

260

247

10

279

239

11

283

246

12

240

218

13

238

219

14

225

226

15

247

233

Contrastar con un nivel de significación del 5 % si el programa reduce el nivel de colesterol. 9. En la fabricación de semiconductores, a menudo se utiliza una sustancia química para quitar el sicilio de la parte trasera de las obleas antes de la metalización. En este proceso

137

8.5. Ejercicios

es importante la rapidez con la que actúa la sustancia. Se han comparado dos soluciones químicas, utilizando para ello dos muestras aleatorias de 10 obleas para cada solución. La rapidez de acción observada es la siguiente (en mils/min): Solución 1

9.9

9.4

9.3

9.6

10.2

10.1

10.3

10.0

9.3

10.1

Solución 2

10.2

10.6

10.7

11.4

10.5

11.0

10.2

10.7

10.4

10.3

a) Contrastar la igualdad de varianzas para un nivel de significación del 10 %. b) ¿Es significativamente mayor la rapidez (media) de actuación de la sustancia empleada en la solución 2 ?. Realizar el contraste para un nivel de significación del 5% 10. Se mide la producción diaria de 2 máquinas durante 9 días seleccionados al azar. Los datos obtenidos se recogen en la siguiente tabla:

Máquina 1

Máquina 2

103

101

115

98

101

110

105

99

107

98

110

110

105

109

110

99

115

100

a. Obtener un intervalo de confianza para la producción media de cada máquina con un nivel de confianza del 95 %. b. Contrastar si las varianzas pueden suponerse iguales al 10 % de significación. c. Contrastar si la producción media diaria de la máquina 1 es significativamente mayor que la producción media diaria de la máquina 2. Realizar el contraste para un nivel de significación del 5 %. Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.

138

Capítulo 8. Contrastes de Hipótesis

11. Un sindicato pretende analizar los accidentes laborales en los sectores de la construcción y la siderometalurgia. Para ello, toma una muestra aleatoria de 125 empresas dedicadas a la construcción y otra de 75 pertenecientes al sector de la siderometalurgia. Una vez analizados los porcentajes de accidentes en cada una de estas empresas, se obtienen los siguientes datos:

N o de empresas p or sector con un % de accidentes menor del 10 %

N o de empresas p or sector con un % de accidentes mayor o igual del 10 %

Construcción

98

27

Siderometalurgia

54

21

¿Puede afirmarse al 5 % de significación que el porcentaje de accidentes laborales es independiente del sector al que pertenece la empresa?.

12. La Consejería de Obras Públicas y Urbanismo de una Comunidad engarga un estudio para comparar el precio de las viviendas nuevas de dos municipios, A y B. Con tal fin, se recoge información sobre el precio del m2 de 42 viviendas de promotoras distintas, seleccionadas al azar en el municipio A y de 40 viviendas en el municipio B. En la muestra de viviendas del municipio A, el precio medio del m2 ha resultado ser de 0.98 miles de euros con una desviación típica de 0.09 miles de euros, mientras que en la muestra de viviendas del municipio B, el precio medio del m2 es de 0.95 y la desviación típica de 0.07. A partir de esta información, ¿puede aceptarse que en los dos municipios no hay diferencias significativas en el precio medio de las viviendas de nueva construcción para un nivel de significación del 5 %?.

13. Se investiga la temperatura de deflexión bajo carga para dos tipos diferentes de tubería de plástico. Para ello se toman dos muestras aleatorias, cada una de 10 unidades, anotando

139

8.5. Ejercicios

las temperaturas de deflexión observadas (o F). Los resultados son los siguientes. Tipo 1

Tipo 2

206

177

188

197

205

206

187

201

194

180

193

176

207

185

185

200

189

197

213

192

Suponiendo que sendas muestras proceden de poblaciones normales e independientes, a. Obtén un intervalo de confianza para el cociente de varianzas con un nivel de confianza del 95 %. ¿Pueden considerarse iguales las varianzas? b. ¿Apoyan los datos la afirmación de que la temperatura de deflexión bajo carga para la tubería de tipo 2 es mayor que para la tubería de tipo 1?. Tomar α = 0,05.

Delia Montoro Cazorla.

Dpto.

de Estadística e I.O. Universidad de Jaén.