Guia 11. Inferencia Sobre Proporciones

1 Programa para la inmersi´ on a la Educaci´ on Superior - PIES Departamento de Ciencias B´ asicas ´ Area: Estad´ıstic

Views 24 Downloads 0 File size 190KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

1

Programa para la inmersi´ on a la Educaci´ on Superior - PIES

Departamento de Ciencias B´ asicas ´ Area: Estad´ıstica Gu´ıa # 11 Programas: Ingenier´ıa de alimentos, Ingenier´ıa de Automatizaci´ on, Ingenier´ıa Ambiental y sanitaria, Ingenier´ıa El´ ectrica, Ingenier´ıa Civil, Ingenier´ıa Qu´ımica, Administraci´ on de Empresas, Contadur´ıa P´ ublica, Urbanismo, Biolog´ıa, Econom´ıa, Finanzas y comercio internacional, Negocios y Relaciones Internacionales, Trabajo Social, Optometr´ıa, Veterinaria, Zootecnia y Administraci´ on de Agronegocios. Elaborado por: Edgar Palacios Segura Fecha de elaboraci´ on: Mayo 04 de 2018 Tema: Inferencia Sobre Proporciones INTENCIONALIDAD Habilidades que se pretenden desarrollar. Describir el intervalo de confianza para la proporci´on de una poblaci´on. Describir la prueba de hip´ otesis para la proporci´on de una poblaci´on. Describir el intervalo de confianza para la comparaci´on de proporciones de dos poblaciones. Describir la prueba de hip´ otesis para la comparaci´on de proporciones de dos poblaciones. Calcular el tama˜ no de muestra m´ınimo par estimar una proporci´on poblacional DESARROLLO DEL CONCEPTO:

Inferencia para una proporci´ on poblacional En esta gu´ıa damos los m´etodos para utilizar una proporci´on muestral con la finalidad de estimar una proporci´on de una poblaci´on. Se describen procedimientos para la construcci´on de intervalos de confianza y pruebas de hip´otesis respecto de una proporci´on poblacional. Los razonamientos utilizados en inferencia parten de la distribuci´on de x¯ Para la proporci´on se sigue el mismo esquema, sustituyendo las medias por proporciones. El objetivo es la proporci´on desconocida π de una poblaci´on que cumple una determinada caracter´ıstica. El estad´ıstico que estima el par´ametro π es la proporci´on muestral p=

N´ umero de exitos de la caracteristica en la muestra x = N´ umero de observaciones de la muestra n

´ DE LA PROPORCION ´ MUESTRAL DISTRIBUCION Si se selecciona una muestra aleatoria de tama˜ no n de una poblaci´on distribuci´on en forma

2

binomial con par´ametro π. La distribuci´on muestral de la proporci´on p tendr´a una distribuci´on aproximadamente normal, con media la proporci´on π y desviaci´on est´andar (error est´andar) r π(1 − π) σp = n cuando el tama˜ no de muestra n es grande. La aproximaci´on normal ser´a adecuada si nπ ≥ 10 y n(1 − π) ≥ 10 Intervalo de confianza para una proporci´ on poblacional con confianza (1 − α) r π(1 − π) p ± zα/2 n donde zα/2 es el valor cr´ıtico de z que corresponde a un a´rea de α/2 en el extremo derecho de una distribuci´on normal est´andar. Como se desconoce el valor de π, se estima por medio de la estimaci´on puntual p. Prueba de hip´ otesis para una proporci´ on poblacional Las tres formas que tiene una prueba de hip´otesis para la proporci´on son: H0 : π = π0

H0 : π = π0

H0 : π = π0

Ha : π < π0

Ha : π > π0

Ha : π 6= π0

Estad´ıstico de prueba para la prueba de hip´ otesis acerca π z=r

p − π0

π0 (1 − π0 ) n Tama˜ no de muestra para estimar la proporci´ on poblacional El tama˜ no de muestra m´ınimo n para estimar la media poblacional con un nivel de confianza (1 − α) y un error de estimaci´on deseado e es n=

2 zα/2 π ∗ (1 − π ∗ )

e2

donde π ∗ es el valor supuesto para la proporci´on muestral. INFERENCIA DE LA DIFERENCIA ENTRE DOS PROPORCIONES POBLACIONALES Sean π1 la proporci´on de la poblaci´on 1 y π2 la proporci´on de la poblaci´on 2, se hace inferencia acerca de la diferencia entre las proporciones: π1 − π2 . Se elige una muestra aleatoria simple de tama˜ no n1 de la poblaci´on 1 y otra muestra aleatoria simple n2 de la poblaci´on 2. Estimaci´ on por intervalo de π1 − π2 La estimaci´on puntual de la diferencia entre las dos proporciones poblacionales es la dife  x1 x 2 rencia entre las dos proporciones muestrales: (p1 − p2 ) = + n1 n2

3

Error est´ andar de p1 − p2 es: s σp1 −p2 =

π1 (1 − π1 ) π2 (1 − π2 ) + n1 n2

el cual es estimado por s σp1 −p2 =

p1 (1 − p1 ) p2 (1 − p2 ) + n1 n2

Una estimaci´on por intervalo esta dada por: estimacion puntual ± margen de error Como la distribuci´on muestral de p1 − p2 tiene una distribuci´on aproximadamente normal, el margen de error se escribe como sigue: s p1 (1 − p1 ) p2 (1 − p2 ) Margen de error = zα/2 + n1 n2 La estimaci´on por intervalo con un nivel de confianza (1 − α) entre dos proporciones poblacionales es s p1 (1 − p1 ) p2 (1 − p2 ) + (p1 − p2 ) ± zα/2 n1 n2 Prueba de hip´ otesis acerca de p1 − p2 Las tres formas que tiene una prueba de hip´otesis son: H0 : π1 − π2 = D0

H0 : π1 − π2 = D0

H0 : π1 − π2 = D0

Ha : π1 − π2 < D0

Ha : π1 − π2 > D0

Ha : π1 − π2 6= D0

Cuando D0 = 0 significa que la hip´otesis nula es que π1 y π2 son iguales. Estad´ıstico de prueba para la prueba de hip´ otesis acerca π1 − π2 (p1 − p2 ) − (π1 − π2 ) π1 (1 − π1 ) π2 (1 − π2 ) + n1 n2 Para estimar el error est´andar del estad´ıstico z, usamos el hecho de que la H0 es cierta, las dos proporciones poblacionales son iguales a alg´ un valor com´ un. Para obtener este valor com´ un tomamos la proporci´on muestral com´ un de ´exitos en las dos muestras combinadas n´ umero total de exitos x1 + x2 p= = n´ umero total de ensayos n1 + n2 y el estad´ıstico de prueba es z=r

(p1 − p2 ) − (π1 − π2 ) (p1 − p2 ) − (π1 − π2 ) z=r =s   p(1 − p) p(1 − p) 1 1 + p(1 − p) + n1 n2 n1 n2

4

Supuestos Las muestras se seleccionan de una manera aleatoria e independiente de dos poblaciones binomiales, y n1 y n2 son suficientemente grandes para que la distribuci´on de muestreo de (p1 − p2 ) pueda aproximarse mediante una distribuci´on aproximadamente normal. EJEMPLOS Ejemplo 1. Cuando se habla de publicidad, los pre-adolescentes no est´an listos para los crudos mensajes que los anunciantes usan para llegar a los adolescentes. Un estudio de Geppeto Group encontr´o que 78 % de los pre-adolescentes entienden y disfrutan los anuncios que son tontos por naturaleza. A diferencia de los adolescentes, los pre-adolescentes prefieren ver bailar 69 % y “novios”y “novias” 63 %. Suponga que ´estos son los resultados de una muestra de tama˜ no 1039 pre-adolescentes. Construya un intervalo de confianza de 95 % para la proporci´on de pre-adolescentes que entienden y disfrutan anuncios que son de naturaleza tonta. Soluci´on: π : La proporci´on de pre-adolescentes que entienden y disfrutan los anuncios que son tontos por naturaleza. La estimaci´on puntual para r la proporci´on poblacional es p = 0,78 0,78 ∗ 0,22 = 0,01285 El error estandar es σp = 1039 El valor critico z = 1,96 para un nivel de confianza de 95 % es el valor que tiene como a´rea (1 − α/2) = 0,975 a la izquierda de z El intervalo de confianza es 0,78 ± 1,96 ∗ 0,01285 0,78 ± 0,0252 o bien 0,7248 < π < 0,8052 Se estima con una confianza de 95 % que la proporci´on de pre-adolescentes que entienden y disfrutan anuncios que son de naturaleza tonta est´a entre 72,48 % y 80,52 %. Ejemplo 2. Las devoluciones de impuestos incluyen la opci´on de asignar $3 para las campa˜ nas de elecci´on presidencial, y esto no representa ning´ un costo al contribuyente. En una muestra aleatoria simple de 250 devoluciones de impuestos correspondientes al a˜ no fiscal 1976, el 27.6 % asign´o los $3 para la campa˜ na. En una muestra aleatoria simple de 300 devoluciones de impuestos recientes, en el 17.3 % de estas se asignaron los $3 para la campa˜ na (seg´ un datos de USA Today). Utilice un nivel de significancia de 0.01 para someter a prueba la afirmaci´on de que el porcentaje de devoluciones que asignan los $3 para la campa˜ na fue mayor en 1976 que en la actualidad. Soluci´on Paso 1. Planteamiento de las Hip´ otesis

5

X1 : Devoluciones de impuestos correspondientes al a˜ no fiscal 1976. X2 : Devoluciones de impuestos a˜ no fiscal recientes. Planteamos la hip´otesis nula que las proporciones de asignar $3 a las campa˜ nas de elecci´on presidencial en el a˜ no fiscal de 1976 y en el a˜ no fiscal reciente es la misma, y la hip´otesis alternativa como la proporci´on de asignar $3 a las campa˜ nas de elecci´on presidencial en el a˜ no fiscal de 1976 fue mayor que en el a˜ no fiscal reciente H0 : π1 − π2 = 0 Ha : π1 − π2 > 0 Paso 2. estad´ıstico de prueba Los estad´ısticos son: n1 = 250, n2 = 300, p1 = 0,276, p2 = 0,173, Para evaluar el estad´ıstico de prueba primero estimamos la proporci´on com´ un p p=

250 ∗ 0,276 + 300 ∗ 0,173 = 0,21982 250 + 300

(0,276 − 0,173) − 0   = 2,9044 1 1 + 0,21982(1 − 0,21982) 250 300

zc = s

Paso 3. Valor P El valorP para z = 2,9044 es el ´area situada a la derecha de 2.9044 por debajo de la curva de la distribuci´on normal est´andar. Con un programa estad´ıstico como R o la tabla normal est´andar, obtenemos el V alorP = P (T > 2,9044) = 0,0019 Como el Valor P es menor que el nivel de significancia α = 0,01. se rechaza la hip´otesis nula. Paso 4. Conclusi´ on Existe suficiente evidencia muestral que indica que la proporci´on de asignar $3 de la devoluci´on de impuestos a las campa˜ nas de elecci´on presidencial fue mayor en el a˜ no fiscal del 1976 que en el a˜ no fiscal reciente con un nivel de significancia de 0.01 EJERCICIOS PROPUESTOS 1. El New York Times y la CBS llevaron a cabo una encuesta en el ´ambito de EE UU compuesta de 1.048 adolescentes de entre 13 y 17 a˜ nos. De estos adolescentes, 692 dijeron que ten´ıan un aparato de televisi´on en su habitaci´on, 189 dijeron que el canal de televisi´on que prefer´ıan era la Fox. Actuaremos como si se tratara de una muestra aleatoria simple. a) Calcula un intervalo de confianza del 95 % para la proporci´on de adolescentes de esta edad que tienen TV en su habitaci´on y otra para la proporci´on de estos

6

adolescentes que prefieren la Fox. Comprueba que efectivamente podemos utilizar los procedimientos sobre proporciones. b) Dice un art´ıculo period´ıstico: “En teor´ıa, en 19 de cada 20 encuestas los resultados de la muestra no diferir´ıan en m´as menos un 3 % de los resultados que obtendr´ıamos si pudi´eramos entrevistar a todos los adolescentes estadounidenses de este grupo de edad”. Comprueba si tus resultados concuerdan con esta afirmaci´on. c) ¿Existe evidencia de que m´as de la mitad de los adolescentes estadounidenses tienen TV en su habitaci´on? Plantea las hip´otesis y halla el estad´ıstico de contraste. ¿Cu´ales son tus conclusiones? 2. En un a˜ no reciente, el 73 % de los estudiantes universitarios de primer curso que respondi´o a una encuesta nacional seleccion´o “ser rico”como meta personal importante. Una universidad p´ ublica averigu´o que 132 sujetos de una muestra aleatoria simple de 200 de los estudiantes de primer curso consideran que este objetivo es importante. a) Calcula un intervalo de confianza del 95 % para la proporci´on de estudiantes de primer curso de esa universidad que identificar´ıa“ser rico”como objetivo personal importante. b) ¿Existe suficiente evidencia de que la proporci´on de estudiantes de primer curso de esta universidad que piensa que ser rico es importante es distinta de la proporci´on nacional, el 73 %? (Aseg´ urate de plantear las hip´otesis, de dar el valor P y de explicar tus conclusiones.) 3. Una encuesta de opini´on nacional hall´o que el 44 % de todos los adultos estadounidenses estaba de acuerdo en que a los padres se les deber´ıa dar bonos para pagar la educaci´on de sus hijos en las escuelas p´ ublicas o privadas de su elecci´on. El resultado se bas´o en una muestra peque˜ na. ¿Cu´al es el tama˜ no necesario de la muestra aleatoria simple para obtener un error de estimaci´on igual a 0.03 (es decir, de ± el 3 %) en un intervalo de confianza del 95 %? a) Responde a esta pregunta utilizando los resultados de la encuesta anterior para dar el valor supuesto π ∗ . b) Resuelve otra vez el problema utilizando el valor supuesto conservador π ∗ = 0,5. ¿Cu´al es la diferencia entre los tama˜ nos de las dos muestras? 4. En zonas rurales, la enfermedad de Lyme se halla bastante extendida. Esta enfermedad ´ la transmiten las garrapatas. Estas se infectan cuando chupan la sangre de ratones. Por tanto, cuanto mayor es la poblaci´on de ratones, m´as extendida se halla la enfermedad. A su vez, la poblaci´on de ratones depende de la abundancia de bellotas, su alimento preferido. Unos investigadores estudiaron dos zonas boscosas similares un a˜ no en el que la producci´on de bellotas fue muy escasa. En una de las zonas, los investigadores esparcieron centenares de miles de bellotas con el fin de simular un a˜ no de buena producci´on. La otra zona se mantuvo intacta. La primavera siguiente, 54 de los 72 ratones capturados en la primera zona estaban en condiciones de reproducirse. En la

7

segunda zona estaban en condiciones de reproducirse 10 ratones de 17. Calcula un intervalo de confianza para la diferencia entre la proporci´on de ratones en condiciones de reproducirse en un a˜ no de buena producci´on de bellotas y la proporci´on de ratones en condiciones de reproducirse en un a˜ no con una mala producci´on. 5. El estudio sobre la quiebra de peque˜ nas empresas se fij´o en 148 empresas del sector de “restaurantes y bares”de Indiana. De ´estas, 106 las dirig´ıan hombres y 42 mujeres. Durante un periodo de tres a˜ nos, 15 de las empresas dirigidas por hombres y 7 de las dirigidas por mujeres quebraron. ¿Existe una diferencia significativa entre las proporciones de empresas que quiebran lideradas por hombres y por mujeres? 6. En un experimento, el 16 % de 734 sujetos tratados con Viagra tuvieron dolores de cabeza. En el mismo experimento, el 4 % de 725 sujetos que recibieron un placebo tuvieron dolores de cabeza (seg´ un datos de Pfizer). a) Utilice un nivel de significancia de 0.01 para someter a prueba la afirmaci´on de que la proporci´on de dolores de cabeza es mayor en los individuos tratados con Viagra. ¿Parece que los dolores de cabeza son un problema para los individuos que toman Viagra? b) construir el intervalo de confianza correspondiente a la prueba de hip´otesis realizada con un nivel de significancia de 0.01. ¿Qu´e conclusi´on sugiere el intervalo de confianza? USANDO R Instrucciones en R que permiten obtener los resultados de la inferencia sobre proporciones. La funci´on “prop.test”. Para hacer inferencia acerca de una proporci´on escribimos. prop.test(x,n,alternative=“two.sided”, conf.level=0.95) donde x: Valor num´erico que indica el numero de observaciones de la muestra que presenta la caracter´ıstica de inter´es. n: Valor num´erico que indica total de observaciones en el grupo (tama˜ no de muestra) conf.level: Valor num´erico que indica el nivel de confianza en tanto por uno al que quiere construir el intervalo de confianza. Si omite este par´ametro en la funci´on, los intervalos de confianza se calcula a un nivel del 95 %. Para la inferencia acerca de dos proporciones escribimos prop.test(c(x1 , x2 ),c(n1 , n2 ), alternative=“two.sided”, conf.level=0.95) donde c(x1 , x2 ): vector de dos dimensiones que indica el numero de observaciones de cada grupo que presenta la caracter´ıstica de inter´es. c(n1 , n2 ): Vector de dos dimensiones que indica total de observaciones en cada grupo conf.level: Valor num´erico que indica el nivel de confianza en tanto por uno al que quiere construir el intervalo de confianza. Si omite este par´ametro en la funci´on, los intervalos de confianza se calcula a un nivel del 95 %.

8

Ejemplo La muestras aleatorias independientes de n1 = 1265 y n2 = 1688 observaciones, fueron elegidas de dos poblaciones y se observan x1 = 849 y x2 = 910 ´exitos. La funci´on es: prop.test(c(849, 910),c(1265, 1688), alternative=“two.sided”, conf.level=0.99) Salida de R

BIBLIOGRAF´IA 1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman and Company (2010). 2. Triola Mario F. ESTADISTICA. Decimoprimera Edici´on. Pearson Educaci´on 2013. 3. Devore Jay l. PROBABILIDAD Y ESTAD´ISTICA para ingenier´ıa y ciencias. Octava edici´on . Cengage Learnig 2010 4. Canavos George C. PROBABILIDAD Y ESTAD´ISTICA, Aplicaciones y M´etodos. Primera edici´on en espa˜ nol, Mc Graw Hill 1987. 5. Levin Richard I. y Rub´ın David S. ESTAD´ISTICA para ADMINISTRADORES. Sexta edici´on, Prentice Hall. 6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTAD´ISTICA PARA ADMINISTRACION Y ECONOMIA. D´ecima edici´on, Cengage Learnig. 7. Paul Newold, William L. Carlson y Betty Thorne. Estad´ıstica para administraci´on y econom´ıa. Sexta edici´on. Prencice Hall.