Estadistica Tema6b Contrastes

Bloque III. Inferencia estad´ıstica Tema 6. Inferencia. Parte II: contrastes de hip´otesis ´ Asignatura: MATEMATICAS II

Views 39 Downloads 0 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Bloque III. Inferencia estad´ıstica Tema 6. Inferencia. Parte II: contrastes de hip´otesis

´ Asignatura: MATEMATICAS III

Bloque III/Tema 6)

Matematicas III

1 / 82

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

2 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

3 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Contrastes de hip´otesis: introducci´on Un contraste de hip´ otesis es un procedimiento que: bas´andose en datos muestrales, proporciona informaci´ on para tomar una decisi´on sobre la validez de una conjetura o hip´ otesis sobre una poblaci´ on X ; t´ıpicamente, el valor de un par´ametro de la poblaci´ on θ (θ puede ser uno cualquiera de los par´ametros que hemos considerado hasta ahora: µ, p, σ 2 , etc) Esta hip´ otesis a confrontar se conoce como la hip´ otesis nula (H0 ): Podemos pensar en ella como la hip´ otesis considerada correcta (antes de llevar a cabo el test). Ser´a mantenida a menos que la muestra aporte suficiente evidencia contraria. La informaci´ on recogida en la muestra se emplea para confrontar (o contrastar) esta hip´ otesis.

Bloque III/Tema 6)

Matematicas III

4 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

La hip´otesis nula: ejemplos 1

2

Un fabricante de paquetes de cereales afirma que, en promedio, cada paquete pesa al menos 400 g. Quieres contrastar esta informaci´ on a partir de los pesos de los paquetes en una muestra aleatoria. Poblaci´ on: X = ’peso de un paquete de cereales (en g)’ µ0 z}|{ Hip´ otesis nula, H0 : µ ≥ 400 ¿Proporciona la muestra suficiente evidencia para dudar de (rechazar) H0 ?

Una compa˜n´ıa recibe env´ıos de componentes, que acepta si el porcentaje de componentes defectuosos es como m´aximo del 5 %. La decisi´on se basa en una muestra aleatoria de estos componentes. Poblaci´ on: X = 1 si un componente es defectuoso y 0 en otro caso X ∼ Bernoulli(p), p = proporci´ on de componentes defectuosos en todo el env´ıo p0 z}|{ Hip´ otesis nula, H0 : p ≤ 0.05 ¿Proporciona la muestra evidencia suficiente para rechazar H0 ? Bloque III/Tema 6)

Matematicas III

5 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

La hip´otesis nula, H0 Define la hip´ otesis a contrastar. Se asume inicialmente que la hip´ otesis nula es correcta (semejante a suponer inocencia a menos que se pruebe la culpa). Habitualmente corresponde al estatus quo. Su definici´ on matem´ atica siempre contiene los s´ımbolos ’=’, ’≤’ o ’≥’ (conjunto cerrado) Puede ser rechazada como resultado del contraste, o no serlo Hip´ otesis simples: µ0 √0 σ02 z}|{ z}|{ z}|{ H0 : µ = 5 , H0 : p = 0.6 , H0 : σ 2 = 9 En general: H0 : θ = θ0

Espacio param´etrico asociado a esta hip´ otesis nula: Θ0 = {θ0 }

Hip´ otesis compuestas (especificadas mediante un rango de valores): µ0 √0 z}|{ z}|{ H0 : µ ≤ 5 , H0 : p ≥ 0.6 En general: H0 : θ ≤ θ0 ´ o H0 : θ ≥ θ0

Espacio param´etrico asociado a esta hip´ otesis nula: Θ0 = (−∞, θ0 ] o Θ0 = [θ0 , ∞) Bloque III/Tema 6)

Matematicas III

6 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Hip´otesis alternativa, H1 Si la hip´ otesis nula no es v´ alida, alguna alternativa debe ser correcta. Para realizar el contraste, el investigador debe especificar una hip´ otesis alternativa frente a la que se contrasta la hip´ otesis nula. La hip´ otesis alternativa H1 : Es la opuesta a la hip´ otesis nula. Habitualmente confronta el estatus quo. Su formulaci´ on matem´ atica no contiene los s´ımbolos ’=’, ’≤’ o ’≥’ Puede ser soportada por los datos o no serlo Habitualmente es la hip´ otesis por la que se inclina el investigador Hip´ otesis unilaterales: (cola derecha) H1 : µ > 5, (cola izquierda) H0 : p < 0.6 En general: H1 : θ > θ0 ´ o H1 : θ < θ0 Espacio param´etrico bajo esta alternativa: Θ1 = (θ0 , ∞) ´ o Θ1 = (−∞, θ0 ) Hip´ otesis bilaterales: H1 : σ 2 6= 9

En general: H1 : θ 6= θ0

Espacio param´etrico bajo esta alternativa: Θ1 = (−∞, θ0 ) ∪ (θ0 , ∞) Bloque III/Tema 6)

Matematicas III

7 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

La hip´otesis alternativa: ejemplos 1

Un fabricante de paquetes de cereales afirma que, en promedio, cada paquete pesa al menos 400 g. Quieres contrastar esta informaci´ on a partir de los pesos de los paquetes en una muestra aleatoria. Poblaci´ on: X = ’peso de un paquete de cereales (en g)’ Hip´ otesis nula, H0 : µ ≥ 400 frente a Hip´ otesis alternativa, H1 : µ < 400 ¿Proporciona la informaci´ on de la muestra suficiente evidencia en contra de H0 y a favor de H1 ?

2

Una compa˜ n´ıa recibe env´ıos de componentes, que acepta si el porcentaje de componentes defectuosos es como m´ aximo del 5 %. La decisi´ on se basa en una muestra aleatoria de estos componentes. Poblaci´ on: X = 1 si un componente es defectuoso y 0 en otro caso X ∼ Bernoulli(p), p = proporci´ on de componentes defectuosos en el env´ıo Hip´ otesis nula, H0 : p ≤ 0.05 frente a Hip´ otesis alternativa, H1 : p > 0.05 ¿Proporciona la informaci´ on de la muestra suficiente evidencia contra H0 y a favor de H1 ? Bloque III/Tema 6)

Matematicas III

8 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Procedimiento de contraste de hip´otesis

Poblaci´ on: X = ’altura de un estudiante de la URJC (en metros)’

xyyxxxxyy

Afirmaci´ on: en promedio, los estudiantes miden menos de 1.6 m ⇒ Hip´ otesis: H0 : µ ≤ 1.60 frente a H1 : µ > 1.60 Se toma una MAS de alumnos:

yyxx

La media muestral es 1.65 m, x¯ = 1.65 ¿Es extra˜no observar una media muestral igual a x¯ = 1.65 si la media de la poblaci´ on es µ ≤ 1.60? Si no es razonable, rechazamos la hip´ otesis nula en favor de la alternativa.

Bloque III/Tema 6)

Matematicas III

9 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Procedimiento de contraste de hip´otesis Una vez especificadas las hip´ otesis nula y alternativa y recogida la otesis nula (rechazar informaci´ on muestral, se toma una decisi´on sobre la hip´ o no rechazar H0 ). La regla de decisi´on se basa en el valor de una “distancia” entre los datos muestrales y los valores m´as probables si la hip´ otesis nula fuera cierta. Esta distancia se calcula como el valor de un estad´ıstico del contraste, relacionado con las cantidades pivotales mencionadas en el tema anterior. Para cualquier decisi´on que pueda tomarse, existe la posibilidad de llegar a on, una conclusi´on equivocada sobre el valor del par´ametro de la poblaci´ porque no disponemos m´as que de una muestra aleatoria y con ella no podemos tener la certeza de que la hip´ otesis nula sea correcta o no. Existen dos posibles estados en la naturaleza y por tanto se pueden cometer dos errores: los errores de Tipo I y de Tipo II.

Bloque III/Tema 6)

Matematicas III

10 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Errores de Tipo I y de Tipo II, potencia

Error de Tipo I: rechazar una hip´ otesis nula correcta. El error de Tipo I se considera importante. La probabilidad de un error de Tipo I es igual a α y se denomina nivel de significaci´ on, α = P(rechazar la nula|H0 es correcta) Error de Tipo II: no rechazar una hip´ otesis nula incorrecta. La probabilidad de un error de Tipo II es igual a β. β = P(no rechazar la nula|H1 es correcta)

Bloque III/Tema 6)

Matematicas III

11 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Errores de Tipo I y de Tipo II, potencia

Potencia: probabilidad de rechazar una hip´ otesis nula (cuando es incorrecta). potencia = 1 − β = P(rechazar la nula|H1 es correcta)

Decisi´ on No Rechazar H0 Rechazar H0

Situaci´ on actual H0 correcta H0 incorrecta Sin error Error de Tipo II (1 − α) (β) Error de Tipo I Sin error (α) (1 − β = potencia)

Bloque III/Tema 6)

Matematicas III

12 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Errores de Tipo I y de Tipo II, potencia Los errores de Tipo I y de Tipo II no se pueden cometer simult´aneamente El error de Tipo I solo puede darse si H0 es correcta El error de Tipo II solo puede darse si H0 es incorrecta

Si la probabilidad del error de Tipo I, α ⇑, entonces la probabilidad del error de Tipo II, β ⇓ Si todo lo dem´as no cambia: β ⇑ cuando real ⇓ β ⇑ cuando β ⇑ cuando β ⇑ cuando Para θ ∈ Θ1 Para θ ∈ Θ0

la diferencia entre el valor supuesto para el par´ ametro y su valor α⇓ la variabilidad en la poblaci´ on (σ) ⇑ el tama˜ no muestral (n) ⇓ potencia(θ) = 1 − β(θ) potencia(θ) ≤ α Bloque III/Tema 6)

Matematicas III

13 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Errores de Tipo I y de Tipo II, potencia Una forma de proceder ante un problema con dos objetivos como es: 1 fijar el nivel de significaci´ on α, y escoger el criterio que nos proporcione la mayor potencia posible β. Este criterio est´a basado en un estad´ıstico T (X1 , ..., Xn ) , denominado estad´ıstico del contraste. 2

Estad´ıstico del Contraste A partir de la muestra X1 , · · · , Xn , se define un estad´ıstico T (X1 , · · · , Xn ) cuya distribuci´ on de probabilidad sea conocida cuando se asume como cierta la hip´ otesis nula. Dicho estad´ıstico, recibe el nombre de Estad´ıstico del Contraste y constituye una medida de cu´anto se acercan los resultados obtenidos en la muestra a la hip´ otesis nula.

Bloque III/Tema 6)

Matematicas III

14 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Estad´ıstico del contraste, nivel de significaci´on y regi´on de rechazo Estad´ıstico del contraste, T Nos permite decidir si es “probable” o “improbable” que se observen los datos muestrales, suponiendo que la hip´ otesis nula sea cierta. Es la cantidad pivotal utilizada en los IC, calculada bajo la hip´ otesis nula. La decisi´on del contraste de hip´ otesis se basa en el valor observado del estad´ıstico del contraste, t. Si los datos muestrales proporcionan evidencia contraria a la hip´ otesis nula, el valor observado del estad´ıstico del contraste debiera ser “extremo”, esto es, muy poco probable. En otro caso, este valor debiera ser “usual”. Distinguimos entre valores “usuales” y “extremos” sobre la base de: la distribuci´ on del estad´ıstico del contraste para la muestra, el nivel de significaci´ on α, que define la llamada regi´ on de rechazo o cr´ıtica y la regi´ on de aceptaci´ on.

Bloque III/Tema 6)

Matematicas III

15 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Estad´ıstico del contraste, nivel de significaci´on y regi´on de rechazo Regi´on Cr´ıtica o de Rechazo Al fijar un nivel de significaci´ on, α, se obtiene impl´ıcitamente una divisi´on en dos regiones del conjunto de posibles valores del estad´ıstico de contraste: La regi´ on de rechazo o regi´ on cr´ıtica que tiene probabilidad α (bajo H0 ) y la regi´ on de NO rechazo que tiene probabilidad 1 − α (bajo H0 ).

Bloque III/Tema 6)

Matematicas III

16 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Estad´ısticos del contraste Sea X n una m.a.s. de una poblaci´ on X con media µ y varianza σ 2 , α un nivel de significaci´ on, zα el cuantil α de N(0,1), µ0 la media de la poblaci´ on bajo H0 , etc. Par´ ametro

Media

Hip´ otesis

Estad´ıstico contraste

Datos normales Varianza conocida

X¯ −µ0 √ ∼ N(0, 1) σ/ n

Datos no normales Muestra grande

X¯ −µ0 √ ∼ap. N(0, 1) σ/ ˆ n

Datos Bernoulli Muestra grande

Datos normales Varianza desconocida

p

p−p ˆ 0 ∼ap. N(0, 1) p0 (1−p0 )/n

RRα contraste bilateral        z :        z : 

X¯ −µ0 √ ∼ tn−1 s/ n

Varianza

Datos normales

(n−1)s 2 ∼ χ2 n−1 σ2 0

Desv. T´ıp.

Datos normales

(n−1)s 2 ∼ χ2 n−1 σ2 0

         

 z   z }| {     x¯ − µ0 x¯−µ0 √ < z1−α/2 o > zα/2 √  σ/ n  σ/ n      x¯−µ0 x¯−µ0 √ < z1−α/2 o √ > zα/2 σ/ ˆ n σ/ ˆ n

p−p ˆ p−p ˆ 0 0 < z1−α/2 o p > zα/2 p0 (1−p0 )/n p0 (1−p0 )/n   t     z }| {         x¯ − µ0 x¯−µ0 √ > tn−1;α/2 < tn−1;1−α/2 o t : √ s/ n     s/ n        

z : p

χ2 }|

{ (n − 1)s 2

z



         

(n−1)s 2 < χ2 o > χ2 χ2 : n−1;1−α/2 n−1;α/2   σ2   σ2   0   0           ) ( (n−1)s 2 (n−1)s 2 2 2 2 χ : χ o n−1;1−α/2 n−1;α/2 σ2 σ2 0 0

Bloque III/Tema 6) Matematicas III Pregunta: ¿C´ omo definir´ıas RR para contrastes unilaterales?

17 / 82

Introducci´ on: ¿Qu´ e es un contraste de hip´ otesis?

Etapas de un Contraste de Hip´otesis Las etapas en la resoluci´on de un contraste de hip´ otesis son: 1

Especificar las hip´ otesis nula H0 y alternativa H1 .

2

Elegir un estad´ıstico de contraste apropiado, T (X1 , ..., Xn ), que sea una medida de la discrepancia entre la hip´ otesis y la muestra.

3

Fijar el nivel de significaci´ on α en base a c´ omo de importante se considere rechazar H0 cuando realmente es cierta.

4

Prefijado α y elegido T (X1 , ..., Xn ), construir las regiones de aceptaci´on y rechazo, seg´un se trate de un contraste uni o bilateral.

5

Tomar la muestra x1 , ..., xn y evaluar el estad´ıstico de contraste T (x1 , ..., xn ).

6

Concluir si el test es estad´ısticamente significativo (se rechaza H0 ) o no al nivel de significaci´ on α (dependiendo de si el valor del estad´ıstico T (x1 , ..., xn ) est´a o no en la regi´ on de rechazo). Bloque III/Tema 6)

Matematicas III

18 / 82

Contrastes para una poblaci´ on

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

19 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes

Bloque III/Tema 6)

Matematicas III

20 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Contraste unilateral para la media de datos normales con varianza conocida: ejemplo Los pesos de los rodamientos fabricados en un proceso se pueden aproximar mediante una variable aleatoria X con distribuci´ on normal con media 250 g. y desviaci´ on t´ıpica 5 g. Tras reajustar el mismo, el encargado sospecha que el peso promedio ha aumentado, pero su desviaci´ on t´ıpica no ha cambiado. ¿Tiene raz´ on el encargado? Lleva a cabo el contraste para un nivel de significaci´ on del 5 %. Soluci´ on El par´ ametro de estudio es la media de la variable aleatoria X = ”peso de un rodamiento (en g)”, con X ∼ N(µ, σ 2 = 52 ) Para realizar el estudio se plantea el siguiente contraste de hip´ otesis: µ0 z}|{ H0 : µ = 250 frente a H1 : µ > 250 (contraste unilateral) El estad´ıstico del contraste es: X¯ − µ0 √ ∼ N(0, 1) Z = σ/ n Bloque III/Tema 6)

Matematicas III

21 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Contraste unilateral para la media de datos normales con varianza conocida: ejemplo La regi´ on de rechazo (o regi´ on cr´ıtica) es: RR0.05 = {z : z > z0.05 } = {z : z > 1.645} Se toma una muestra aleatoria simple de diecis´eis rodamientos, y resulta un peso medio igual a 251.9 g. El valor observado del estad´ıstico es: σ=5 z=

µ0 = 250

n = 16

x¯ = 251.9

251.9 − 250 x¯ − µ0 √ √ = = 1.52 σ/ n 5/ 16

Como z = 1.52 ∈ / RR0.05 no rechazamos H0 a un nivel de significaci´ on del 5 %. Conclusi´ on: Los datos muestrales no proporcionan suficiente evidencia para rechazar la afirmaci´ on de que el peso promedio de los rodamientos es 250 g. Bloque III/Tema 6)

Matematicas III

22 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Definici´on de p-valor de una muestra Es el menor valor de α para el que se puede rechazar H0 con la muestra seleccionada. Se conoce tambi´en como el nivel de significaci´ on observado. Se puede emplear en el procedimiento de contraste de hip´ otesis con la regla siguiente: Si el p-valor < α, rechazamos H0 Si el p-valor ≥ α, no rechazamos H0

Se puede interpretar como la probabilidad de que se obtenga un valor del estad´ıstico del contraste que sea al menos tan extremo (≤ o ≥) como el observado, suponiendo que H0 sea cierta. El p-valor muestra la evidencia estad´ıstica de la muestra a favor o en contra de la hip´ otesis nula: p-valores “peque˜ nos” proporcionan evidencia en contra de H0 p-valores “grandes” proporcionan evidencia a favor de H0 Bloque III/Tema 6)

Matematicas III

23 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

p-valor: ejemplo Continuando con el problema de los pesos de los rodamientos fabricados en un proceso, el par´ ametro de estudio es la media de la variable aleatoria X = ”peso de un rodamiento (en g)”, con X ∼ N(µ, σ 2 = 52 ) Se plantea el siguiente contraste de hip´ otesis para saber si hay evidencia estad´ı´etica para aceptar que el peso difiere de 250 g. µ0 z}|{ H0 : µ = 250 frente a H1 : µ > 250 (contraste unilateral) El estad´ıstico del contraste es: Z =

X¯ − µ0 √ ∼ N(0, 1) σ/ n

Tras tomar una muestra de 16 rodamientos, el valor observado del estad´ıstico es z = 1.52. El p-valor es: p-valor = P(Z ≥ z) = P(Z ≥ 1.52) = 0.0643 donde Z ∼ N(0, 1) Como se cumple que p-valor = 0.0643 ≥ α = 0.05, no se rechaza H0 (pero se rechazar´ıa para cualquier α mayor que 0.0643, por ejemplo, α = 0.1). Bloque III/Tema 6)

Matematicas III

24 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

El p-valor y la probabilidad de la hip´otesis nula1 El p-valor: no es la probabilidad de H0 ni la del error de Tipo I, α; se puede utilizar como un estad´ıstico del contraste comparando su valor con el de α (i.e. rechazar H0 si p-valor < α).

Queremos responder la pregunta: ¿cu´al es la probabilidad de la hip´ otesis nula dadas las observaciones? Recordemos que definimos el p-valor como la probabilidad de obtener las observaciones (o valores mas extremos) dada la hip´ otesis nula. No podemos responder de manera exacta, Pero bajo condiciones generales y asumiendo que sin los datos Pr(H0 ) = Pr(H1 ) = 1/2, entonces para p-valores, p, tales que p < 0.36: Pr(H0 |Observaciones) ≥

1 Selke,

−e · p ln(p) . 1 − e · p ln(p)

Bayarri and Berger, The American Statistician, 2001 Bloque III/Tema 6)

Matematicas III

25 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

El p-valor y la probabilidad de la hip´otesis nula La siguiente tabla permite calibrar el p-valor como una funci´on de la probabilidad de la hip´ otesis nula: p-valor 0.1 0.05 0.01 0.001 0.00860 0.00341 0.00004 ≤ 0.00001

Pr(H0 |Observaciones) ≥ 0.39 0.29 0.11 0.02 0.1 0.05 0.01 0.001

Para un p-valor igual a 0.05 la hip´ otesis nula tiene una probabilidad de al menos el 29 % de ser cierta. Mientras que si queremos que la probabilidad de que sea cierta no supere el 5 %, el p-valor tiene que ser m´as peque˜ no que 0.0034. Bloque III/Tema 6)

Matematicas III

26 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Intervalos de confianza y contrastes bilaterales: dualidad Un contraste bilateral a un nivel de significaci´ on α puede realizarse a partir de un intervalo (sim´etrico) con nivel de confianza 100(1 − α) % de la manera siguiente: 1

Especificar las hip´ otesis nula y alternativa: H 0 : θ = θ0

frente a

H1 : θ 6= θ0

2

Calcular un intervalo de confianza al 100(1 − α) % para θ.

3

Si θ0 no pertenece a este intervalo, rechazamos H0 . Si θ0 pertenece al intervalo, no rechazamos H0 .

4

Escribir las implicaciones para nuestro caso en una frase.

Bloque III/Tema 6)

Matematicas III

27 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ conocida

Contraste bilateral para la media con varianza conocida: ejemplo Un taladro produce agujeros cuyos di´ametros siguen una distribuci´ on normal con media 2 cm y desviaci´ on t´ıpica 0.06 cm. Para verificar su correcto funcionamiento se miden aleatoriamente nueve taladros, con un di´ametro medio de 1.95 cm. Realiza un contraste bilateral para un nivel de significaci´on del 5 % utilizando ICs. Poblaci´ on: X = ”di´ametro de un agujero (en cm)”, con X ∼ N(µ, σ 2 = 0.062 ) µ0 z}|{ Objetivo: contrastar H0 : µ = 2 frente a H1 : µ 6= 2 (contraste bilateral)

Se toma una MAS con n = 9 y resulta: x¯ = 1.95.

Intervalo de confianza al 100(1 − α) % = 95 % para µ:     0.06 σ = 1.95 ∓ 1.96 √ = (1.9108, 1.9892) IC0.95 (µ) = x¯ ∓ 1.96 √ n 9 Como µ0 = 2 ∈ / CI0.95 (µ), rechazamos H0 a un nivel de significaci´ on del 5 %. Bloque III/Tema 6)

Matematicas III

28 / 82

Contrastes para una poblaci´ on

Contrastes para proporciones

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes

Bloque III/Tema 6)

Matematicas III

29 / 82

Contrastes para una poblaci´ on

Contrastes para proporciones

Contraste bilateral para la proporci´on: ejemplo En una muestra aleatoria de 199 socios auditores de empresas de auditor´ıa americanas, 104 socios se mostraron de acuerdo con la afirmaci´ on: “Los flujos de caja operativos son una medida v´alida de rentabilidad”. Contrasta al 10 % frente a una alternativa bilateral la hip´ otesis nula de que la mitad de los miembros de la poblaci´ on estar´ıan de acuerdo con esta afirmaci´ on. Poblaci´ on: X = 1 si un socio est´a de acuerdo con la afirmaci´ on y 0 en otro caso. X ∼ Bernoulli(p) p0 z}|{ Objetivo: contrastar H0 : p = 0.5 frente a H1 : p 6= 0.5 (contraste bilateral)

El tama˜ no de la muestra es suficientemente grande como para utilizar la aproximaci´ on para muestras grandes ˆ 0 Estad´ıstico del contraste: Z = √ p−p ∼aprox. N(0, 1) p0 (1−p0 )/n

Valor observado del estad´ıstico (p0 = 0.5, n = 199 y pˆ = 0.523)

0.523 − 0.5 pˆ − p0 = p = 0.65 z= p p0 (1 − p0 )/n 0.5(1 − 0.5)/199 Bloque III/Tema 6)

Matematicas III

30 / 82

Contrastes para una poblaci´ on

Contrastes para proporciones

Contraste bilateral para la proporci´on: ejemplo Regi´on de rechazo o regi´ on cr´ıtica: RR0.10 = {z : z > z0.05 } ∪ {z : z < −z0.05 } = {z : z > 1.645} ∪ {z : z < −1.645} / RR0.10 no rechazamos H0 Como z = 0.65 ∈ a un nivel de significaci´ on del 10 %.



Densidad N(0,1)

z= 0.65

● ● RR RA RR − zα2 = − 1.645 zα2 = 1.645

Conclusi´ on: Los datos muestrales no dan evidencia suficiente para dudar que la mitad de los socios auditores piensen que el flujo de caja operacional es una medida v´alida de rentabilidad.

Bloque III/Tema 6)

Matematicas III

31 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ desconocida

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes

Bloque III/Tema 6)

Matematicas III

32 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ desconocida

Contraste unilateral, media con var. desconocida: ejemplo Una cadena de centros comerciales cree que el aumento de ventas entre Noviembre y Diciembre es del 20 %. Una muestra aleatoria de seis centros tuvo incrementos de ventas de 19.2, 18.4, 19.8, 20.2, 20.4, 19.0. Suponiendo la poblaci´ on normal, contrasta que el incremento promedio es al menos del 20 % frente a una alternativa unilateral, para α = 10 %. Emplea el p-valor. Poblaci´ on: X = “incremento de ventas en un centro entre Nov. y Dic. (en %)”, con X ∼ N(µ, σ 2 ) σ 2 desconocida µ0 z}|{ Objetivo: contrastar H0 : µ ≥ 20 frente a H1 : µ < 20

(contraste unilateral)

Muestra peque˜ na. Se utiliza el contraste basado en la t de Student. Estad´ıstico del contraste: T =

¯ −µ0 X √ s/ n

∼ tn−1

Valor observado del estad´ıstico (con µ0 = 20, n = 6, x¯ = 19.5 y s = t=



0.588 = 0.767):

x¯ − µ0 19.5 − 20 √ = −1.597 √ = s/ n 0.767/ 6 Bloque III/Tema 6)

Matematicas III

33 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ desconocida

Contraste unilateral, media con var. desconocida: ejemplo p-valor = P(T ≤ −1.597)∈ (0.05, 0.1)

porque

−t5;0.05

Dado que

Densidad tn−1

−t5;0.10

z }| { z }| { −2.015 < −1.597 < −1.476

t= −1.597

p-valor < α = 0.1,

p−valor =area

rechazamos la hip´ otesis nula a este nivel.



||

−2.015 −1.476

Conclusi´ on: Los datos muestrales proporcionan suficiente evidencia para rechazar que el incremento promedio de las ventas haya sido al menos del 20 %. Interpretaci´ on del p-valor: si la hip´ otesis nula fuese cierta, la probabilidad de que hubi´esemos obtenido estos datos muestrales ser´ıa como m´ aximo del 10 %, lo que es bastante improbable, y por tanto rechazamos la hip´ otesis nula. Bloque III/Tema 6)

Matematicas III

34 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ desconocida

Ejemplo El tiempo (en minutos) necesario para montar una unidad se puede aproximar mediante una variable aleatoria con distribuci´ on normal. Se realiza un estudio para saber si se puede aceptar que el tiempo de montaje medio es mayor de 10 minutos, con un nivel de significaci´ on de 0.05. Soluci´on: Sea X = tiempo necesario para montar una unidad, X ∼ N(µ, σ 2 ). Como no tenemos datos sobre la varianza de la variable X , planteamos el contraste: H0 : µ ≤ 10

H1 : µ > 10

cuya regi´ on de rechazo es: R=

(

x¯ − µ0 √s

> tn−1,α

n

Bloque III/Tema 6)

) Matematicas III

35 / 82

Contrastes para una poblaci´ on

Contrastes para la media de una poblaci´ on normal con σ desconocida

Ejemplo (cont.) A continuci´ on se toma una muestra de 20 unidades seleccionadas aleatoriamente: 9.8 10.4 10.6 9.6 9.7 9.9 10.9 11.1 9.6 10.2 10.3 9.6 9.9 11.2 10.6 9.8 10.5 10.1 10.5 9.7 Como n = 20, x¯ = 10.2, s = 0.51, x¯ − µ0 √s n

=

10.2 − 10 0.51 √ 20

= 1.753

Adem´as tn−1,α = t19,0.05 = 1.729 y como 1.753 > 1.729, el contraste resulta estad´ısticamente significativo, se rechaza la hip´ otesis nula y podemos concluir que hay razones estad´ısticas suficientes al nivel 0.05 para afirmar que la media del tiempo de montaje es mayor de 10 minutos. Bloque III/Tema 6)

Matematicas III

36 / 82

Contrastes para una poblaci´ on

Contrastes para la varianza de una poblaci´ on normal

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes

Bloque III/Tema 6)

Matematicas III

37 / 82

Contrastes para una poblaci´ on

Contrastes para la varianza de una poblaci´ on normal

Contraste unilateral para la varianza: ejemplo Para cumplir con la normativa, la varianza del nivel de impurezas en tanto por ciento en los env´ıos de un cierto producto qu´ımico no puede superar el valor 4. Con el fin de contrastar si esto se est´ a verificando, se ha tomado una muestra aleatoria de 20 env´ıos, que ha proporcionado una cuasi-varianza muestral del nivel de impurezas de 5.62. Llevar a cabo un contraste de hip´ otesis adecuado (α = 0.1). Nota: asumir que el nivel de impurezas se puede aproximar por una v.a. N(µ, σ). Poblaci´ on: X = “nivel de impurezas del producto en un env´ıo (en %)” con X ∼ N(µ, σ 2 ) σ02 z}|{ Objetivo: contrastar H0 : σ 2 ≤ 4 frente a H1 : σ 2 > 4 (contraste unilateral) Estad´ıstico del contraste: χ2 =

(n−1)s 2 σ02

∼ χ2n−1

Valor observado del estad´ıstico (con σ02 = 44, n = 20 y s 2 = 5.62): χ2 =

(20 − 1)5.62 (n − 1)s 2 = = 26.695 σ02 4 Bloque III/Tema 6)

Matematicas III

38 / 82

Contrastes para una poblaci´ on

Contrastes para la varianza de una poblaci´ on normal

Contraste unilateral para la varianza: ejemplo

p-valor = P(χ2 ≥ 26.695) ∈ (0.1; 0.25) porque

Densidad χ2n−1 χ2 = 26.695

χ219;0.20

χ219;0.1

z }| { z }| { 23.9004 < 26.695 < 27.2036

p−valor =area

Por tanto, 0.10 ≤ p-valor ≤ 0.20

Como el p-valor es mayor que α = 0.1, no podemos rechazar la hip´ otesis nula a este nivel.



●● 22.7

27.2

Conclusi´ on: Los datos muestrales no proporcionan suficiente evidencia para rechazar la afirmaci´ on de que la varianza del porcentaje de impurezas en los env´ıos de este producto no es mayor que 4. Bloque III/Tema 6)

Matematicas III

39 / 82

Contrastes para una poblaci´ on

Contrastes para la varianza de una poblaci´ on normal

Contraste bilateral para la varianza: ejemplo Se realiza un experimento con objeto de analizar la habilidad y destreza de una clase de ratas de laboratorio, X . Se toma una muestra de 18 ratas y se obtiene una cuasivarianza muestral de s 2 = 1349. Suponiendo que X ∼ N(µ, σ 2 ), ¿puede concluirse que la σ 2 es diferente de 2600, con una confianza del 95 %? Objetivo: H0 : σ 2 = 2600nfrente a Hh1 : σ 2 6= 2600 (contraste io bilateral) 2 2 2 Regi´on de rechazo: R = n−1 , donde s ∈ / χ , χ n−1,1−α/2 n−1,α/2 σ2 0

i  h  χ2n−1,1−α/2 , χ2n−1,α/2 = χ217,0.975, χ217,0.025 = [7.564, 30.19]

El valor del estad´ıstico de contraste es:

(n − 1) 2 17 s = 1349 = 8.82 2 σ0 2600 Como 8.82 ∈ [7.564, 30.19]no podemos rechazar H0 al 95 % de confianza El p−valor asociado es 2P χ217 < 8.82 = 2 · 0.0542 = 0.1085 Bloque III/Tema 6)

Matematicas III

40 / 82

Contrastes para dos poblaciones

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

41 / 82

Contrastes para dos poblaciones

Introducci´on

En muchos problemas de decisi´on se tiene como objetivo comparar dos poblaciones . Para ello, en lugar de disponer de una muestra aleatoria, se dispone de dos muestras aleatorias de dos poblaciones, y el inter´es est´a en contrastar: la diferencia entre las medias de las dos poblaciones en el caso de muestras pareadas y en el caso de muestras independientes

el diferencia entre las varianzas de las dos poblaciones (a trav´es del cociente) en el caso de muestras independientes

Los procedimientos que se utilizan se bas´an en los m´etodos utilizados para el caso de una ´ unica poblaci´ on.

Bloque III/Tema 6)

Matematicas III

42 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

43 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contrastes para la diferencia entre dos medias en muestras pareadas Ejemplo: Se ha llevado a cabo un estudio sobre la relaci´ on entre la actividad cerebral mientras se ven anuncios en televisi´on y la capacidad de la persona para recordar dichos anuncios: Se han mostrado anuncios de dos marcas para diez productos a las personas en la muestra. Para cada anuncio se ha medido la capacidad de cada persona para recordarlo pasadas 24 horas. A cada anuncio de un producto se le han asignado las etiquetas “recuerdo fuerte” o “recuerdo d´ebil”. La siguiente tabla muestra un ´ındice de la actividad cerebral de las personas que han visto estos anuncios en el estudio. producto: i recuerdo fuerte: xi recuerdo d´ ebil: yi dif.: di = xi − yi

1 137 53 84

2 135 114 21

3 83 81 2

4 125 86 39

5 47 34 13

Bloque III/Tema 6)

6 46 66 −20

7 114 89 25

8 157 113 44

9 57 88 −31

10 144 111 33

Matematicas III

44 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contrastes para la diferencia entre dos medias en muestras pareadas Sea X una poblaci´ on con media µX e Y otra poblaci´ on con media µY . Disponemos de una muestra aleatoria de n observaciones pareadas de ambas poblaciones, {(Xi , Yi )}.: Calculamos la diferencia entre las dos variables:

d1 = x1 − y1 , d2 = x2 − y2 , . . . , dn = xn − yn Calculamos la media d¯ y cuasi desviaci´ on t´ıpica sd de las n diferencias. Supondremos que la poblaci´ on de las diferencias sigue una distribuci´ on normal.

Contraste bilateral H0 : µX − µY = D0 frente a H1 : µX − µY 6= D0 El estad´ıstico del contraste es

T =

¯ − D0 D √ ∼H0 tn−1 sD / n

La regi´ on de rechazo (a un nivel de significaci´ on α) es: RRα = {t : t < −tn−1;α/2 o t > tn−1;α/2 } Bloque III/Tema 6)

Matematicas III

45 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contrastes para la diferencia entre dos medias en muestras pareadas Ejemplo: (cont.) Poblaci´ on: D = “diferencia entre recuerdo fuerte y d´ebil”’ con 2 D ∼ N(µX − µY , σD ) D0 z}|{ Objetivo: H0 : µX − µY ≤ 0 frente a H1 : µX − µY > 0 (Contraste unilateral)

Estad´ıstico del contraste: T = Muestra: n = 10, d¯ =

210 10

D¯ − D0 √ ∼ tn−1 sD / n

= 21 y sd2 =

142022−10(21)2 10−1

= 1088

Valor observado del estad´ıstico (para D0 = 0: t=

d¯ − D0 21 √ = √ = 2.014 sd / n 32.98/ 10 Bloque III/Tema 6)

Matematicas III

46 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contrastes para la diferencia entre dos medias en muestras pareadas Ejemplo: cont.

Densidad tn−1

p-valor = P(T ≥ 2.014)∈ (0.025, 0.05) ya que t9;0.05

p−valor =area

t9;0.025

z }| { z }| { 1.833 < 2.014 < 2.262

t= 2.014



|| 1.833 2.262

Por tanto, como p-valor < α = 0.05, rechazamos la hip´ otesis nula a este nivel. Conclusi´ on: La evidencia muestral apoya que en promedio la actividad cerebral es mayor para el grupo con recuerdo fuerte que para el grupo con recuerdo d´ebil. Si la actividad cerebral promedio fuese igual para ambos grupos, la probabilidad de obtener muestras tan extremas o m´ as que la observada estar´ıa entre 0.025 y 0.05 (un valor bajo). Bloque III/Tema 6)

Matematicas III

47 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contrastes para la diferencia entre dos medias en muestras pareadas Ejemplo: cont. En Excel: Ir al menu “Datos”, submenu “An´alisis de datos”, seleccionar la opci´ on: “Prueba t para medias de dos muestras emparejadas” Columnas A y B (datos), en amarillo se muestran el valor observado del estad´ıstico y el p-valor.

Bloque III/Tema 6)

Matematicas III

48 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Contraste bilateral para la diferencia entre dos medias via IC Ejemplo: cont. Tambi´en se puede construir un intervalo de confianza al 95 % para µX − µY .   sd sd IC0.95 (µX − µY ) = d¯ − tn−1;0.025 √ , d¯ + tn−1;0.025 √ n n   32.98 32.98 = 21 − 2.262 √ , 21 + 2.262 √ 10 10 = (−2.59, 44.59) Como el valor 0 pertenece a este intervalo, no se puede rechazar la hip´ otesis nula de la igualdad de las medias de las dos poblaciones a un nivel de significaci´ on de α = 0.05.

Bloque III/Tema 6)

Matematicas III

49 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Ejemplo Se quiere comparar el nivel de dopamina presente en el cerebro, antes y despu´es de la ingesti´on por ratas de una dosis de sustancia psicotr´ opica, para decidir si la diferencia se puede considerar estad´ısticamente significativa. Para ello, se plantea un contraste sobre la diferencia a un nivel del 95 %. Soluci´on Como los datos est´an pareados, consideramos las diferencias: D =X −Y Asumimos D ∼ (µ, σ 2 ) y planteamos el contraste de hip´ otesis: H0 : µ = 0 H1 : µ 6= 0 La regi´ on de rechazo es:

) (

D¯ − µ

0 α R= s

> tn−1, 2

√n Bloque III/Tema 6)

Matematicas III

50 / 82

Contrastes para la diferencia entre dos medias: muestras pareadas

Ejemplo (cont.)

Se toma una muestra de 5 ratas obteniendo Individuo: Antes de la ingesti´on: Despu´es de la ingesti´on:

1 110 102

2 125 120

3 141 135

4 113 114

5 182 175.

Como D¯ = 5.0 y s = 3.535, |D¯ − µ0 | √s

n

=

5 3.535 √ 5

= 3.163

Como tn−1α/2 = t4,0.025 = 2.78, se rechaza la hip´ otesis nula.

Bloque III/Tema 6)

Matematicas III

51 / 82

Contrastes para dos muestras independientes

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on Contrastes para la media de una poblaci´ on normal con σ conocida Contrastes para proporciones Contrastes para la media de una poblaci´ on normal con σ desconocida Contrastes para la varianza de una poblaci´ on normal

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

52 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

53 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contrastes para la diferencia de medias de dos poblaciones normales con varianzas conocidas o con muestras grandes

Sea X una poblaci´ on con media µX y varianza σX2 , e Y otra poblaci´ on con media µY y varianza σY2 . Muestras aleatorias de n1 observaciones de X y n2 observaciones de Y , independientes, y Bien tanto n1 como n2 son grandes y σX2 y σY2 son desconocidas, O X e Y siguen distribuciones normales y σX2 y σY2 son conocidas

Bloque III/Tema 6)

Matematicas III

54 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contrastes para la diferencia de medias de dos poblaciones normales con varianzas conocidas o con muestras grandes Contraste bilateral H0 : µX − µY = D0 frente a H1 : µX − µY 6= D0 El estad´ıstico del contraste es: Bien

O

X¯ − Y¯ − D0 Z = q 2 ∼H0 , sX s2 + nY2 n1

aprox.

N(0, 1)

X¯ − Y¯ − D0 ∼H0 N(0, 1) Z = q 2 2 σX σY + n1 n2

La regi´ on de rechazo (para un nivel de significaci´ on α) es: RRα = {z : z < −zα/2 o z > zα/2 }

Bloque III/Tema 6)

Matematicas III

55 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contrastes para la diferencia de medias de dos poblaciones normales con varianzas conocidas o con muestras grandes Ejemplo: Se realiza un estudio entre auditores sobre la actividad de las mujeres en su profesi´ on. A los encuestados se les pide que den su opini´ on con un valor entre uno (muy en desacuerdo) y cinco (muy de acuerdo) sobre la afirmaci´ on “En auditor´ıa se asignan los mismos trabajos a las mujeres y a los hombres”. De una muestra de 186 auditores (varones) se obtuvo una respuesta promedio de 4.059 con una cuasi desviaci´ on t´ıpica de 0.839. Para una muestra independiente de 172 mujeres auditoras la respuesta promedio fue de 3.680 con una cuasi desviaci´ on t´ıpica de 0.966. Contraste la hip´ otesis nula (para α = 0.0001) de que las medias de las dos poblaciones son iguales, frente a la alternativa de que la media de la poblaci´ on es mayor para auditores varones. Poblaci´ on 1: Poblaci´ on 2: X = “respuesta de un auditor var´ on” Y = “respuesta de una mujer auditora” X ∼ µX , σX2 X ∼ µY , σY2 Muestra: n1 = 186, x¯ = 4.059 y sx = 0.839

Muestra: n2 = 172, y¯ = 3.680 y sy = 0.966

Bloque III/Tema 6)

Matematicas III

56 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contrastes para la diferencia de medias de dos poblaciones normales con varianzas conocidas o con muestras grandes D0 z}|{ Ejemplo: (cont.) Objetivo: contrastar H0 : µX − µY = 0 frente a H1 : µX − µY > 0 (Contraste unilateral) Estad´ıstico del contraste: Z =

¯ ¯ s X −Y

s2 s2 X + Y n1 n2

∼H0 ,

aprox.

N(0, 1)

3.75

z }| { Regi´ on de rechazo: RR0.0001 = {z : z > z0.0001 } Valor observado del estad´ıstico:

4.059 − 3.680 x¯ − y¯ = p = 3.95 z= q 2 /186 + 0.9662 /172 2 2 0.839 sx /n1 + sy /n2 Como z = 3.95 ∈ RR0.0001 , rechazamos la hip´ otesis nula a un nivel del 0.01 %. Conclusi´ on: Los datos contienen una evidencia muy fuerte en favor de que la respuesta promedio entre los varones es mayor que entre las mujeres - esto es, en promedio los varones est´ an mas convencidos que las mujeres de que se asignan los mismos trabajos a las mujeres que a los hombres. Bloque III/Tema 6)

Matematicas III

57 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia de medias de dos poblaciones normales con varianz

Contrastes para la diferencia de medias de dos poblaciones normales con varianzas conocidas o con muestras grandes Ejemplo: (cont.): dualidad con los intervalos de confianza Tambi´en se puede construir un intervalo de confianza al 95 % para µX − µY .   s 2 2 s s y x IC0.95 (µX − µY ) = x¯ − y¯ ∓ z0.025 +  n1 n2   p = 4.059 − 3.680 ∓ 1.96 0.8392/186 + 0.9662/172 = (0.19, 0.57)

Como el valor 0 no pertenece a este intervalo, podemos rechazar la hip´ otesis nula de igualdad de las dos medias poblacionales a un nivel de significaci´ on α = 0.05.

Bloque III/Tema 6)

Matematicas III

58 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos proporciones: muestras grandes independ

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

59 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos proporciones: muestras grandes independ

Contrastes para la diferencia entre dos proporciones: muestras grandes Sea X ∼ Bernoulli(pX ) y sea Y ∼ Bernoulli(pY ), donde pX y pY son dos proporciones poblacionales para los individuos que cumplan una propiedad de inter´es. Muestras aleatorias de n1 observaciones de X y n2 observaciones de Y , independientes, y tanto n1 como n2 son grandes

Contraste bilateral H0 : pX − pY = 0 frente a H1 : pX − pY 6= 0 El estad´ıstico del contraste es: pˆX − pˆY Z = r  pˆ0 (1 − pˆ0 ) n11 + donde

1 n2

 ∼H0 ,

aprox.

N(0, 1),

n1 pˆX + n2 pˆY n1 + n2 La regi´ on de rechazo (para un nivel de significaci´ on α) es: pˆ0 =

RRα = {z : z < −zα/2 or z > zα/2 } Bloque III/Tema 6)

Matematicas III

60 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos proporciones: muestras grandes independ

Contrastes para la diferencia entre dos proporciones: muestras grandes Ejemplo: En Investigaci´ on de Mercados es importante conseguir un porcentaje de respuestas elevado para las encuestas. Para mejorar este porcentaje se puede incluir una pregunta inicial de motivaci´ on que aumente el inter´ es del encuestado por completarlo. Se han enviado cuestionarios con pregunta de motivaci´ on sobre la mejora los espacios de ocio en una ciudad, a una muestra de 250 hogares, obteniendo 101 respuestas. Otros cuestionarios id´ enticos sin pregunta de motivaci´ on se han enviado a otra muestra independiente de 250 hogares, obteniendo 75 respuestas. Contraste la hip´ otesis nula de que las dos proporciones poblacionales sean iguales, frente a la alternativa de que la tasa de respuestas sea m´ as elevada cuando se incluye pregunta de motivaci´ on.

Poblaci´ on 1: X = 1 si una persona completa el cuestionario con pregunta de motivaci´ on, y 0 en caso contrario X ∼ Bernoulli(pX ) Muestra: n1 = 250 y pˆx =

101 250

= 0.404

Poblaci´ on 2: Y = 1 si una persona completa el cuestionario sin pregunta de motivaci´ on, y 0 en caso contrario Y ∼ Bernoulli(pY ) Muestra: n2 = 250 y pˆy =

Bloque III/Tema 6)

75 250

= 0.300

Matematicas III

61 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos proporciones: muestras grandes independ

Contrastes para la diferencia entre dos proporciones: muestras grandes Ejemplo: Objetivo: contrastar H0 : pX = pY frente a H1 : pX > pY (Contraste unilateral) Estad´ıstico del contraste: Z =

r

Valor observado del estad´ıstico:

pˆX −pˆY   pˆ0 (1−pˆ0 ) n1 + n1 1 2

∼H0 ,

aprox.

N(0, 1)

250(0.404) + (250)(0.300) n1 pˆx + n2 pˆy = = 0.352 n1 + n2 250 + 250 pˆx − pˆy 0.404 − 0.300 z= r  = q  1 1 1 + 0.352(1 − 0.352) 250 + pˆ0 (1 − pˆ0 )

pˆ0 =

n1

n2

1 250

 = 2.43

p-valor = P(Z ≥ z) = P(Z ≥ 2.43) = 0.0075 Como el p-valor es muy peque˜ no, podemos rechazar la hip´ otesis nula a cualquier nivel de significaci´ on mayor que 0.0075.

Conclusi´ on: Los datos muestrales contienen una fuerte evidencia de que al incluir una pregunta de motivaci´ on se obtiene una tasa de respuesta m´ as elevada que cuando no se incluye. Bloque III/Tema 6)

Matematicas III

62 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos proporciones: muestras grandes independ

Contrastes para la diferencia entre dos proporciones: muestras grandes Ejemplo: (cont.): dualidad con los intervalos de confianza Tambi´en se puede construir un intervalo de confianza al 95 % para pX − pY . IC0.95 (pX − pY )

=

= =

pˆx − pˆy ∓ z0.025

s

pˆ0 (1 − pˆ0 ) s

0.404 − 0.300 ∓ 1.96



1 1 + n1 n2

!

0.352(1 − 0.352)



1 1 + 250 250

!

(0.1877, 0.0203)

otesis nula Como el valor 0 no pertenece a este intervalo, podemos rechazar la hip´ de igualdad de las proporciones de las dos poblaciones para un nivel de significaci´ on α = 0.05.

Bloque III/Tema 6)

Matematicas III

63 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

64 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales

Consideremos: X una poblaci´ on con media µX y varianza σX2 , e Y otra poblaci´ on con media µY y varianza σY2 ambas distribuidas normalmente con varianzas poblacionales desconocidas, pero iguales σ 2 = σX2 = σY2

Se toman dos muestras aleatorias independientes: una de n1 observaciones de X y otra de n2 observaciones de Y .

Bloque III/Tema 6)

Matematicas III

65 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contrastes para la diferencia entre dos medias: muestras normales independientes, varianzas de poblaciones iguales Contraste bilateral H0 : µX − µY = D0 frente a H1 : µX − µY 6= D0 El estad´ıstico del contraste es T =

X¯ − Y¯ − D0 q ∼H0 tn1 +n2 −2 sp n11 + n12

donde el estimador de la varianza com´ un para las dos poblaciones es sp2 =

(n1 − 1)sX2 + (n2 − 1)sY2 n1 + n2 − 2

Nota: grados de libertad = n1 + n2 − 2 (n´ umero de observaciones de las muestras menos dos - por tener que estimar µX y µY ) La regi´ on de rechazo (para un nivel de significaci´ on α) es: RRα = {t : t < −tn1 +n2 −2;α/2 o t > tn1 +n2 −2;α/2 } Bloque III/Tema 6)

Matematicas III

66 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales Ejemplo: Se estudia el efecto que la presencia de un moderador puede tener en el n´ umero de ideas generadas en un grupo de trabajo. Se observan grupos de cuatro personas, con y sin moderador. En una muestra aleatoria de cuatro grupos con moderador el n´ umero promedio de ideas generadas por grupo fue 78.0, con cuasi desviaci´ on t´ıpica muestral de 24.4. Para una muestra independiente de cuatro grupos sin moderador el promedio de ideas generadas fue 63.5, y su cuasi desviaci´ on t´ıpica fue 20.2. Suponiendo distribuciones normales con varianzas iguales, contraste la hip´ otesis nula (para α = 0.1) de igualdad de medias, frente a la alternativa de que la media de la poblaci´ on es mayor para grupos con moderador. Poblaci´ on 1: Poblaci´ on 2: X = “n´ umero de ideas en grupos con Y = “n´ umero de ideas en grupos sin moderador” moderador” X ∼ N(µX , σX2 ) X ∼ N(µY , σY2 ) Muestra: n1 = 4, x¯ = 78.0 y sx = 24.4

Muestra:n2 = 4, y¯ = 63.5 e sy = 20.2

Se trata de muestras independientes de poblaciones con distribuci´ on normal tal que σX2 = σY2 = σ 2 Bloque III/Tema 6)

Matematicas III

67 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales Objetivo: contrastar H0 : µX − µY Estad´ıstico del contraste: T =

D0 z}|{ = 0 frente a H1 : µX − µY > 0

X¯ −Y¯ q sp n1 + n1 1

2

(Test unilateral)

∼H0 tn1 +n2 −2 .

Regi´ on de rechazo: RR0.1 = {t : t > t6;0.1 }, donde t6;0.1 = 1.440.

Valor observado del estad´ıstico (con D0 = 0, n1 = 4, n2 = 4, x¯ = 78.0, sx = 24.4, y¯ = 63.5 y sy = 20.2): sp2 =

(n1 − 1)sx2 + (n2 − 1)sy2 n1 + n2 − 2

t=

sp

=

(4 − 1)24.42 + (4 − 1)20.22 = 501.7 4+4−2



sp =



501.7 = 22.4

x¯ − y¯ 78.0 − 63.5 = 0.915 p = p 1/n1 + 1/n2 22.4 1/4 + 1/4

Como t = 0.915 ∈ / RR0.1 , no podemos rechazar la hip´ otesis nula a un nivel del 10 %.

Conclusi´ on: Los datos muestrales no contienen suficiente evidencia para pensar que en promedio se generan m´ as ideas en grupos con moderador. Pero para tama˜ nos muestrales tan peque˜ nos el contraste tiene potencia baja y ser´ıan necesarias diferencias muy grandes entre las medias de las poblaciones para rechazar la hip´ otesis nula. Bloque III/Tema 6)

Matematicas III

68 / 82

Contrastes para dos muestras independientes

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero i

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales Ejemplo: (cont.): dualidad con los intervalos de confianza Tambi´en se puede construir un intervalo de confianza al 99 % para µX − µY . r   1 1 x¯ − y¯ ∓ tn1 +n2 −2;0.005 sp + IC0.99 (µX − µY ) = n1 n2 ! r 1 1 = 78.0 − 63.5 ∓ 3.707 · 22.4 + 4 4 =

(−44.22, 73.22)

otesis nula Como el valor 0 pertenece a este intervalo, no podemos rechazar la hip´ de igualdad de las medias de las dos poblaciones a un nivel de significaci´ on α = 0.01.

Bloque III/Tema 6)

Matematicas III

69 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contenidos 1

Introducci´ on: ¿Qu´e es un contraste de hip´ otesis?

2

Contrastes para una poblaci´ on

3

Contrastes para dos poblaciones

4

Contrastes para la diferencia entre dos medias: muestras pareadas

5

Contrastes para dos muestras independientes Contrastes para la diferencia de medias de dos poblaciones normales con varianz Contrastes para la diferencia entre dos proporciones: muestras grandes independ Contrastes para la diferencia entre dos medias con varianzas desconocidas pero Contrastes para el cociente de varianzas en poblaciones normales

Bloque III/Tema 6)

Matematicas III

70 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para el cociente de varianzas en poblaciones normales Sea X una poblaci´ on con media µX y varianza σX2 , e Y otra poblaci´ on con media µY y varianza σY2 , ambas distribuidas normalmente

Muestras aleatorias de n1 observaciones de X y n2 observaciones de Y , independientes. Contraste bilateral H0 : σX2 = σY2 (= σ 2 ) frente a H1 : σX2 6= σY2 El estad´ıstico del contraste es

F =

sX2 ∼H0 Fn1 −1,n2 −1 sY2

La regi´ on de rechazo (para un nivel de significaci´ on α) es: RRα = {f : f < Fn1 −1,n2 −1;1−α/2 o f > Fn1 −1,n2 −1;α/2 }

Bloque III/Tema 6)

Matematicas III

71 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

La distribuci´on F

1.2 1.0 0.4

0.6

0.8

gl1=30 gl2=30 gl1=10 gl2=15 gl1=8 gl2=8 gl1=5 gl2=3

0.2

sigue una distribuci´ on Fn,m con n y m grados de libertad. Para el resultado de la transparencia anterior: χ2n1 −1 z }| { 2 (n − 1)s 1 X 1 n1 −1 sX2 σ2 = ∼ Fn1 −1,n2 −1 H 0 sY2 (n2 − 1)sY2 1 n2 −1 2 | σ {z }



Densidades F

0.0

X1 , X2 , . . . , Xn y Y1 , Y2 , Y3 , . . . , Ym son dos conjuntos de variables aleatorias independientes, con distribuci´ on N(0, 1). La variable aleatoria (cociente de dos v.a.s chi-cuadrado normalizadas) 1 Pn 2 i =1 Xi F = n1 Pm 2 i =1 Yi m

0

2

4

6

8

χ2n2 −1

Bloque III/Tema 6)

Matematicas III

72 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para el cociente de varianzas en poblaciones normales Ejemplo: Se tomas dos muestras de bonos industriales emitidos recientemente: La primera muestra corresponde a 17 bonos industriales emitidos con calificaci´ on AAA y tiene una cuasi varianza de sus vencimientos (en a˜nos al cuadrado) fue de 123.35. La segunda muestra corresponde a 11 bonos industriales emitidos con calificaci´ on CCC y tiene una cuasi varianza de sus vencimientos fue de 8.02. Lleve a cabo un contraste bilateral al 5 % para comparar las correspondientes varianzas poblacionales, σX2 y σY2 , . Poblaci´ on 1: X vencimiento de bonos AAA (en a˜ nos) X ∼ N(µX , σX2 )

Poblaci´ on 2: Y vencimiento de bonos CCC (en a˜ nos) Y ∼ N(µY , σY2 )

Muestra: n1 = 17 y sx2 = 123.35

Muestra: n2 = 11 y sy2 = 8.02

Bloque III/Tema 6)

Matematicas III

73 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para el cociente de varianzas en poblaciones normales Ejemplo: (cont.) Objetivo: H0 : σX2 = σY2 frente a H1 : σX2 6= σY2 (contraste bilateral) Estad´ıstico del contraste: F =

2 sX 2 sY

∼H0 Fn1 −1,n2 −1

0.402 z }| { Regi´ on de rechazo: RR0.10 = {f : f < F16,10;1−0.05 } ∪ {f : f > F16,10;0.05 } | {z } 2.83 Nota: el cuantil F16,10;0.05 = 2.83 aparece en la tabla de la F, pero no F16,10;1−0.05 . Para calcularlo podemos emplear la propiedad de esta distribuci´ on Fn,m;α =

1 Fm,n;1−α



F16,10;1−0.05 =

1 1 = = 0.402 F10,16;0.05 2.49

123.35 = 15.38 ∈ RR0.10 Valor observado del estad´ıstico: f = 8.02 Conclusi´ on: Existe una fuerte evidencia de que las dos varianzas poblacionales son distintas. Bloque III/Tema 6)

Matematicas III

74 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para el cociente de varianzas en poblaciones normales Ejemplo: (cont.): dualidad con los intervalos de confianza Tambi´en se puede construir un intervalo de confianza al 90 % para el cociente de las varianzas.  2  2  sx2 1 1 σX sx , IC0.90 = sy2 Fn1 −1,n2 −1;0.05 sy2 Fn1 −1,n2 −1;1−0.05 σY2   123.35 1 123.35 1 , = 8.02 2.83 8.02 0.402 = (5.43, 38.26) Como era de esperar por el resultado anterior, el valor 1 no pertenece a este intervalo, y podemos rechazar la hip´ otesis nula de que las dos varianzas poblacionales sean iguales, para un nivel de significaci´ on α = 0.1.

Bloque III/Tema 6)

Matematicas III

75 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contraste bilateral para el cociente de varianzas mediante intervalos de confianza Un grupo de personas participa en un estudio nutricional que trata de analizar los niveles asimilados de vitamina C en sangre de fumadores (X1 ) y no fumadores (X2 ). Los resultados en mg /l fueron F : 18.3 9.3 12.6 15.7 14.2 13.1 14.3 16.2 18.1 19.4 15.5 11.7 NF : 24.9 16 26.3 25.5 19.3 16.8 15.7 24.6 19.9 9.4 17.4 Asumiendo que Xi ∼ N(µi , si2 ), comprobar si el h´abito de fumar disminuye el nivel de asimilaci´ on de vitamina C en sangre. Soluci´ on: Obtenemos los res´ umenes num´ericos: n1 = 12, x¯1 = 14.87, s12 = 8.7 n2 = 11, x¯2 = 19.62, s22 = 27.79 y planteamos el contraste H0 : µ1 ≥ µ2 frente a H1 : µ1 < µ2 a un nivel del 95 %. Bloque III/Tema 6)

Matematicas III

76 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contraste bilateral para el cociente de varianzas mediante intervalos de confianza Contrastamos primero la igualdad de las varianzas: H0 : σ12 = σ22

frente a

H1 : σ12 6= σ22

La regi´ on de rechazo, a un nivel del 95 %, es n o R = s12 /s22 ∈ / [Fn1 −1,n2 −1,1−α/2 , Fn1 −1,n2 −1,α/2 ]

que es este caso, resulta

[Fn1 −1;n2 −1;1−α/2 , Fn1 −1;n2 −1;α/2 ] = [F11;10;0.975 , F11;10;0.025 ] = [1/F10;11;0.025 , F11;10;0.025 ] = [0.2836, 3.6689] El valor del estad´ıstico de contraste es s12 /s22 = 0.31 y como 0.31 ∈ [0.2836, 3.6689] se acepta la igualdad de las varianzas. Bloque III/Tema 6)

Matematicas III

77 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contraste bilateral para el cociente de varianzas mediante intervalos de confianza Para el contraste de medias, usamos entonces la regi´ on de rechazo:    x¯ − y¯  q R= < tn1 +n2 −2,1−α s  1 + 1 p

n1

n2

donde −t21,0.05 = t21,0.95 = −1.7207

El valor del estad´ısitico de contraste es: q

x¯ − y¯

(n1 −1)s12 +(n2 −1)s22 n1 +n2 −2

q

1 n1

+

1 n2

= q

14.87 − 19.62 q

11·8.7+10·27.79 21

1 12

+

1 11

= −2.698

Como −2.698 < −1.7207, se rechaza H0 al 95 % de confianza. El p−valor asociado es P{t21 < −2.698} = 0.0067. Este valor tan bajo nos lleva a inferir que el h´abito de fumar disminuye el nivel de asimilaci´on de vitamina C en sangre. Bloque III/Tema 6)

Matematicas III

78 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales Ejemplo: Actualmente existen una serie de sustancias que se liberan al medio ambiente por parte de las poblaciones humanas, de las que se sospecha que son t´ oxicas. La u ´nica manera de conocer su toxicidad es realizando bioensayos, es decir, tomando un ser vivo modelo y exponi´endolo a distintas concentraciones de la sustancia pura. Las esporas de helecho son producto de la meiosis capaces de germinar en el suelo y dar lugar a un gametofito de helecho, una planta vascular en miniatura. En los u ´ltimos a˜ nos se han detectado f´ armacos humanos en las aguas de r´ıos y potables. Se decidi´ o probar si los f´ armacos venlafaxina (antidepresivo) y diclofenaco (antiinflamatorio) y el metabolito de la coca´ına benzoilecgonina son t´ oxicos para estas esporas comprobando c´ omo afectan a la actividad mitocondrial. Los datos obtenidos siempre se comparan con los efectos de un medio de cultivo control desprovisto de sustancias t´ oxicas. Una disminuci´ on estad´ısticamente significativa en la actividad mitocondrial respecto del control se considera un efecto t´ oxico. Bloque III/Tema 6)

Matematicas III

79 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales Ejemplo:(cont.) La siguiente tabla presenta los resultados obtenidos en el experimento. R´eplicas 1 2 3 4 5 6

Control 0.196 0.237 0.247 0.206 0.239 0.225

Venlafaxina 0.040 0.055 0.052 0.035 0.051 0.060

Diclofenaco 0.243 0.083 0.176 0.054 0.024 0.160

Benzoilecgonina 0.161 0.208 0.209 0.160 0.200 0.226

¿Se pueden considerar t´oxicas estas sustancias seg´ un estos datos, con un nivel de significaci´ on α = 0.05?

Bloque III/Tema 6)

Matematicas III

80 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Contrastes para la diferencia entre dos medias con varianzas desconocidas pero iguales

Ejemplo:(cont.) La siguiente tabla muestra las estad´ısticas de los datos anteriores Estad´ıstica x s s2

Control 0.22500 0.02013 0.00041

Venlafaxina 0.04889 0.00943 0.00009

Diclofenaco 0.12361 0.08340 0.00696

Benzoilecgonina 0.19400 0.02730 0.00075

Para contestar a la pregunta es necesario realizar un contraste sobre diferencias de medias, aunque al no tener informaci´ on sobre las variantes, habr´a que realizar un contraste de diferencia de variantes previo.

Bloque III/Tema 6)

Matematicas III

81 / 82

Contrastes para dos muestras independientes

Contrastes para el cociente de varianzas en poblaciones normales

Estad´ısticos pivotales Par´ ametro

Hip´ otesis

Estad´ıstico del contraste

Diferencias normales Muestras pareadas Pobls. normales Varianzas iguales µX − µY = D0

σX2 /σY2 = 1

X¯ −Y¯ −D0 r 1 + 1 n1 n2 X¯ −Y¯ −D0 s σ2 σ2 X + Y n1 n2

sp

Pobls. normales Vars. conocidas Pobls. no normales Vars. desconocidas Muestras grandes

pX − pY = 0

¯ D−D √0 sD / n

Pobls. Bernoulli Muestras grandes Pobls. normales

∼ tn−1

∼H0 tn1 +n2 −2 ∼H0 N(0, 1)

X¯ −Y¯ −D0 s ∼H0 aprox N(0, 1) s2 s2 X + Y n1 n2 pˆX −pˆY s  ∼H0 aprox N(0, 1)  pˆ0 (1−pˆ0 ) 1 + 1 n1 n2 2 sX ∼H0 Fn1 −1,n2 −1 s2 Y

Pregunta: ¿Como se definir´ıa RRα para contrastes unilaterales?

Bloque III/Tema 6)

Matematicas III

82 / 82