Resumen Unidad 3 Parte 2

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA MATERIAL DE APOYO

Views 294 Downloads 6 File size 942KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE DOS POBLACIONES Glosario:

 Estimación: es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro 

Estimación por intervalo: se tiene cuando la estimación del parámetro se hace entre dos valores.



Estimador por intervalo de confianza: se tiene cuando se hace la estimación por intervalo, estableciéndose un margen de probabilidad llamado nivel de confianza (1-α) el cual garantiza que el parámetro se encuentre dentro de esos valores.



Nivel de confianza o coeficiente de confianza: nivel de confianza que se tiene en el que el intervalo contenga el valor desconocido del parámetro. El nivel de confianza generalmente se asume de 90%, 95% o 99%.



Valor alfa: Es la probabilidad de error o la probabilidad de que un intervalo dado no contenga el parámetro poblacional desconocido.



Error de estimación: cuanto me debo desviar del estadístico para encontrar el valor del parámetro.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE DOS POBLACIONES Al igual que cuando se realizaban estimaciones para los parámetros de una población podemos realizar estimaciones para la comparación de los parámetros de dos poblaciones. Para ello necesitaremos los datos de sobre las muestras de dos poblaciones independientes, es decir que el comportamiento de una no afecta el comportamiento de la otra población. Al igual que con los intervalos de confianza para una sola población tendremos un nivel de confianza para nuestra estimación, el mismo por lo general será de 90%, 95% o 99%.

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS Un intervalo de confianza para la diferencia entre dos medias busca realizar una comparación de los promedios de dos poblaciones independientes, el intervalo de confianza nos dará un estimado no de los promedios sino de la diferencia entre ellos. 𝑁2

𝑁1 𝜇1

𝜇2

𝜎1 2

𝑛1 𝑥̅1

𝑛2

𝜎2 2 𝑥̅2

Para trabajar con un intervalo de confianza para la diferencia de medias debemos tener en cuenta la información que se nos provee sobre las poblaciones, dependiendo de los datos que conozcamos el procedimiento para estimar la diferencia cambia.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

𝜎 21 y 𝜎 2 2

Conocidos

Desconocidos

Calculo utilizando las varianzas dadas

𝜎 21 = 𝜎 2 2

Cálculo de una nueva desviación estándar 𝑆𝑝



Grados de libertad 𝑣 = 𝑛1 + 𝑛2 − 2

𝜎 21 ≠ 𝜎 2 2

Cálculo de nuevos grados de libertad v

Se usan las varianzas muestrales 𝑠 21 y 𝑠 22

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS CON 𝝈𝟐 𝟏 y 𝝈𝟐 𝟐 CONOCIDAS Para este tipo de intervalo de confianza estaremos trabajando con muestras de tamaño mayor o igual a 30, además conoceremos ambas varianzas poblacionales. Realizaremos la estimación en base a la distribución normal. Al igual que para los intervalos de una población partiremos del supuesto de que nuestra estimación del parámetro se encontrará dentro de los límites calculados con cierto nivel de confianza. En este caso la expresión que utilizaremos para calcular Z es la siguiente: (𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 ) 𝑍= 𝜎 2 (𝑥̅ 1 −𝑥̅2) En los intervalos de confianza se busca la simetría, es decir que el error se distribuya equitativamente entre el límite superior y el límite inferior. Para ello a cada límite se le asignará la mitad del error de la siguiente manera, por ejemplo: 𝜶 = 𝟎. 𝟎𝟓 Entonces cada lado del intervalo tendrá un error de

𝜶 𝟐

=

0.05 2

=

0.025, esta es la probabilidad que se utilizará para calcular los valores de Z del intervalo de confianza.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

Fuente: Probabilidad y estadística para la ingeniería, Walpole 9na. Edición

Se espera que el valor de Z que incluye la media poblacional se encuentre entre los valores de −𝑍𝛼⁄2 y 𝑍𝛼⁄2 lo cual se traduce a la siguiente expresión: 𝑃 (−𝑍𝛼⁄2 ≤ 𝑍 ≤ 𝑍𝛼⁄2 ) = 1 − 𝛼 Si se sustituye Z por su expresión equivalente en el intervalo, siempre utilizando el valor de la desviación estándar para la distribución muestral. (𝑥̅1 − 𝑥̅2 ) − (𝜇1 − 𝜇2 ) 𝑃 (−𝑍𝛼⁄2 ≤ ≤ 𝑍𝛼⁄2 ) = 1 − 𝛼 𝜎 2 (𝑥̅ 1 −𝑥̅2) Por último dado que lo que queremos estimar la diferencia entre las medias poblacionales, realizaremos el despeje de la fórmula de Z obteniendo la estructura general del intervalo de confianza para la media poblacional. 𝑃 ((𝑥̅1 − 𝑥̅2 ) − 𝑍𝛼⁄2 𝜎 2 (𝑥̅ 1 −𝑥̅2) ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅1 − 𝑥̅2 ) + 𝑍𝛼⁄2 𝜎 2 (𝑥̅1 −𝑥̅ 2) ) = 1 − 𝛼 Dependiendo de si trabajamos o no con poblaciones finitas cambiará la manera de calcular la desviación estándar para la diferencia de medias, a continuación se presentan los dos posibles casos: Población Infinita Población finita 𝜎(𝑥̅1 −𝑥̅ 2) = √

𝜎 21 𝜎 2 2 + 𝑛1 𝑛2

𝜎 21 𝑁1 − 𝑛1 𝜎 2 2 𝑁2 − 𝑛2 𝜎(𝑥̅ 1 −𝑥̅2 ) = √ ∗( )+ ∗( ) 𝑛1 𝑁1 − 1 𝑛2 𝑁2 − 1

El intervalo de confianza para la diferencia de medias con varianzas poblacionales conocidas es:

̅𝟏 − 𝒙 ̅𝟐 ) ± 𝒁𝜶⁄ 𝝈(𝒙̅𝟏−𝒙̅𝟐 ) 𝝁𝟏 − 𝝁𝟐 = (𝒙 𝟐

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA



MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS CON 𝝈𝟐 𝟏 y 𝝈𝟐 𝟐 DESCONOCIDAS En el caso en que no se conozcan los valores de las varianzas poblacionales es necesario realizar una prueba para determinar si las varianzas son desconocidas e iguales o desconocidas y distintas. Para ello se utilizará una prueba de Fisher, la misma es parecida a la prueba de Chi cuadrado, pero en lugar de trabajar con una sola varianza la prueba de Fisher realiza una comparación de dos varianzas.

1.

Ho

2.

Ha

3.

𝜶

4.

Zona de rechazo

5.

Estadístico de prueba

6.

Regla de decisión

𝜎 21 =1 𝜎 22 𝜎 21 ≠1 𝜎 22 Usualmente se define como 1%, 5% o 10%

𝑣1 = 𝑛1 − 1 𝑣2 = 𝑛2 − 1 s21 F= 2 s 2 Si F >

𝐹𝛼⁄2 o 𝐹


𝜋2

(-a, -b)

𝜇1 < 𝜇2 𝜋1 < 𝜋2

INTERPRETACIÓN Dado que el 0 está incluido en el intervalo podemos decir que no hay diferencia entre las dos poblaciones. Dado que luego de realizar la diferencia nos quedan valores positivos nos quiere decir que a quien escogimos como población 1 tiene mayor media o proporción que la población 2. Dado que luego de realizar la diferencia nos quedan valores negativos nos quiere decir que a quien escogimos como población 1 tiene menor media o proporción que la población 2.

 INTERVALOS PARA RAZON DE VARIANZAS INTERVALO COMPARACIÓN INTERPRETACIÓN Dado que el 1 está incluido en el intervalo 2 2 Incluye 1 podemos decir que no hay diferencia entre 𝜎1 = 𝜎2 las dos poblaciones. Ambos Dado que las razones son mayores que 1, 𝜎1 2 > 𝜎2 2 mayores que 1 la población 1 tiene mayor varianza que 2. Ambos Dado que las razones son menores que 1, 𝜎1 2 < 𝜎2 2 menores que 1 la población 1 tiene menor varianza que 2.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

EJERCICIOS RESUELTOS INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS CON 𝝈𝟐 𝟏 y 𝝈𝟐 𝟐 CONOCIDAS 1. The Metro Pet Center compara los costos telefónicos utilizando dos programas de facturación diferentes. Con el primer programa, se encontró que sobre 100 semanas la facturación promedio fue de $32.40, con s= $15.10. Una muestra de 150 semanas utilizando el segundo programa dio una media de $47.30, con s= $13.20. Calcule e interprete el intervalo de confianza del 95% para la diferencia entre las medias de los dos programas. Datos: Cadena 1 Cadena 2 ̅ 32.40 47.30 𝒙 15.10 13.20 𝒔 100 150 𝒏 También sabemos que α es 0.05 y σ/2=0.025, por lo que 𝑍𝛼⁄2 = −1.96 σ2

μ1 − μ2 = (x̅1 − x̅2 ) ± Zα⁄2 √ 𝜇1 − 𝜇2 = (32.40 − 47.30) ± 1.96√

n1

+

σ2 n2

15.102 100

+

13.202 150

𝜇1 − 𝜇2 = −14.9 ± 3.64 = (−18.64, −11.26) R// Se encontró que la diferencia de medias está entre -18.64 y -11.26 dólares, esto nos indica que el programa 1 tiene un costo promedio menor que programa 2. La compañía utilizará la cadena 1 al tener menor costo. 2. Se tienen dos grupos de enfermos A y B de 50 y 100 individuos, respectivamente. Al grupo A le fue dado un nuevo somnífero y al grupo B se le dio un somnífero genérico. El grupo A tuvo un número medio de horas de sueño de 7.82 y el grupo B tuvo una media de 6.75. Se sabe que las desviaciones estándar son 0.24 y 0.30 horas respectivamente. Calcule e interprete un intervalo de confianza al 95% para la diferencia del número medio de horas de sueño inducidas por los dos tipos de somníferos.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

Datos: ̅ 𝒙 𝝈 𝒏

Grupo A 7.82 0.24 50

Grupo B 6.75 0.30 100

También sabemos que α es 0.05 y σ/2=0.025, por lo que 𝑍𝛼⁄2 = −1.96 σ2

μ1 − μ2 = (x̅1 − x̅2 ) ± Zα⁄2 √

n1

+

0.242

𝜇1 − 𝜇2 = (7.82 − 6.75) ± 1.96√

50

σ2 n2 +

0.302 100

𝜇1 − 𝜇2 = 1.07 ± 0.089 = (0.981, 1.159) R// Se encontró que la diferencia en el número de horas de sueño promedio está entre 0.981 y 1.159 horas, se encontró que el nuevo medicamento hace que aumente las horas promedio de sueño.

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS CON 𝝈𝟐 𝟏 y 𝝈𝟐 𝟐 DESCONOCIDAS 1. Opus Inc., ha desarrollado un proceso para producir oro a partir del agua de mar. Quince galones tomados del océano Pacífico produjeron una media de 12.7 onzas de oro por galón son s=4.2 onzas, y doce galones del océano Atlántico produjeron cifras similares de 15.9 y 1.7. Con base en un intervalo del 95%, ¿cuál es su estimado de la diferencia en las onzas promedio de oro provenientes de estas dos fuentes? Datos: Pacífico Atlántico ̅ 12.7 15.9 𝒙 4.2 1.7 𝒔 15 12 𝒏 También sabemos que α es 0.05 y σ/2=0.025 Ahora por medio de una prueba de Fisher determinaremos si las varianzas son iguales o distintas. 𝜎 21 ⁄𝜎 2 2 = 1 1. Ho

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

2. 3.

Ha 𝜶

𝜎 21 ⁄𝜎 2 2 ≠ 1 0.05

4.

Zona de rechazo

𝑣1 = 15 − 1 = 14 𝑣2 = 12 − 1 = 11

𝐹(0.975,14,11) =

1

𝐹(0.025,11,14)

=

1 = 0.3225 3.10

𝐹(0.025,14,11) = 3.33 5. 6.

4.22 = 6.1 1.72 𝟔. 𝟏 > 𝟑. 𝟑𝟑 Se rechaza Ho

Estadístico de prueba Regla de decisión

F=

Dado que se rechazó la hipótesis nula podemos decir que las varianzas son desconocidas y distintas. Por lo que procedemos a calcular los nuevos grados de libertad. (𝑆1 2 ⁄𝑛1 + 𝑆2 2 ⁄𝑛2 )

2

(4.22 ⁄15 + 1.72 ⁄12)2 𝑽= = 19.29 ≅ 𝟐𝟎 2 2 = (4.22 ⁄15)2 (1.72 ⁄12)2 (𝑆1 2 ⁄𝑛1 ) (𝑆2 2 ⁄𝑛2 ) + 12 − 1 15 − 1 𝑛1 − 1 + 𝑛2 − 1 Ahora con esos datos debemos buscar el valor en la tabla de t student. 𝐭 (𝟎.𝟎𝟐𝟓,𝟐𝟎) = 2.0860 𝜇1 − 𝜇2 = (𝑥̅1 − 𝑥̅ 2 ) ± 𝑡(𝛼⁄

𝑆1 2

,𝑉) √(

2

𝑛1

𝜇1 − 𝜇2 = (12.7 − 15.9) ± 2.0860√(

+

4.22 15

𝑆2 2 𝑛2 +

)

1.72 12

)

𝜇1 − 𝜇2 = −3.2 ± 2.4829 = (−5.6829, −0.7171) R// Se encontró que la diferencia en las onzas de oro promedio producidas está entre -5.6829 y -0.7171 onzas, debido a que los valores del intervalo son negativos nos indica que el océano Atlántico tiene mayor producción promedio que el océano Pacífico. 2. Sammy Shopper desea compara los costos de 10 servicios diferentes ofrecidos por los nuevos concesionarios de autos en esta zona. De acuerdo

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

a los datos de la tabla calcule e interprete un intervalo de confianza al 90% para la diferencia entre las medias poblacionales. Si la calidad del servicio es la misma, ¿cuál comercializador debería utilizar Sammy? ¿o hay alguna diferencia?

Datos: ̅ 𝒙 𝒔 𝒏

Consumidor 1 53 8.86 10

Consumidor 2 63.27 4.80 10

También sabemos que α es 0.10 y α/2=0.05 Ahora por medio de una prueba de Fisher determinaremos si las varianzas son iguales o distintas 1.

Ho

𝜎 21 ⁄𝜎 2 2 = 1

2. 3.

Ha 𝜶

𝜎 21 ⁄𝜎 2 2 ≠ 1 0.10

4.

Zona de rechazo

𝑣1 = 10 − 1 = 9 𝑣2 = 10 − 1 = 9

𝐹(0.95,9,9) =

1

=

1 = 0.3145 3.18

𝐹(0.05,9,9) 𝐹(0.05,9,9) = 3.18

5.

Estadístico de prueba

8.862 F= = 3.90 4.802

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

𝟑. 𝟗𝟎 > 𝟑. 𝟏𝟖 Se rechaza Ho

Regla de decisión

6.

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

Dado que se rechazó la hipótesis nula podemos decir que las varianzas son desconocidas y distintas. Por lo que procedemos a calcular los nuevos grados de libertad.

𝑽=

(𝑆1 2 ⁄𝑛1 + 𝑆2 2 ⁄𝑛2 ) 2

2

(𝑆1 2 ⁄𝑛1 ) (𝑆2 2 ⁄𝑛2 ) 𝑛1 − 1 + 𝑛2 − 1

2

=

(8.862 ⁄10 + 4.82⁄10)2 = 13.86 ≅ 𝟏𝟒 (8.862 ⁄10)2 (4.82 ⁄10)2 10 − 1 + 10 − 1

Ahora con esos datos debemos buscar el valor en la tabla de t student. 𝐭 (𝟎.𝟎𝟓,𝟏𝟒) = 1.7613 𝜇1 − 𝜇2 = (𝑥̅1 − 𝑥̅ 2 ) ± 𝑡(𝛼⁄

𝑆1 2

,𝑉) √(

2

𝑛1

+

8.862

𝜇1 − 𝜇2 = (53 − 63.27) ± 1.7613√(

10

𝑆2 2 𝑛2 +

)

4.82 10

)

𝜇1 − 𝜇2 = −10.27 ± 5.6124 = (−15.88, −4.66)

R// Se encontró que la diferencia en el costo de los servicio es de -15.88 y -4.66, esto nos indica que si hay diferencia; debería utilizar la comercializadora 2 al tener menor costo. 3. Diecisiete latas de Red Bull presentan una media de 17.2 onzas, con una desviación estándar de 3.2 onzas y trece latas de Monster producen una media de 18.1 onzas con desviación estándar de 2.7 onzas. ¿qué conclusiones se pueden sacar respecto a la diferencia de precios promedio, con base en un intervalo de confianza del 98%? Datos: Consumidor 1 Consumidor 2 ̅ 17.2 18.1 𝒙 3.2 2.7 𝒔 17 13 𝒏 También sabemos que α es 0.02 y α/2=0.01 Ahora por medio de una prueba de Fisher determinaremos si las varianzas son iguales o distintas

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

1.

Ho

𝜎 2 1 ⁄𝜎 2 2 = 1

2. 3.

Ha 𝜶

𝜎 2 1 ⁄𝜎 2 2 ≠ 1 0.02

4.

Zona de rechazo

𝑣1 = 17 − 1 = 16 𝑣2 = 13 − 1 = 12

𝐹(0.99,16,12) =

1

𝐹(0.01,12,16)

=

1 = 0.2817 3.55

𝐹(0.01,16,12) = 4.01 5. 6.

Estadístico de prueba Regla de decisión

3.22 = 1.40 2.72 0.2817 < 1.40 < 4.01 Se acepta Ho F=

Dado que se aceptó la hipótesis nula podemos decir que las varianzas son desconocidas e iguales. Por lo que procedemos a calcular una nueva desviación estándar utilizando los datos de las dos muestras.

𝑆𝑝 = √

𝑆𝑝 = √

(𝑛1 − 1)𝑠1 2 + (𝑛2 − 1)𝑠2 2 𝑛1 + 𝑛2 − 2

(17 − 1)3.22 + (13 − 1)2.72 = 𝟐. 𝟗𝟗𝟓𝟗 17 + 13 − 2 𝑣 = 17 + 13 − 2 = 28 𝐭 (𝟎.𝟎𝟏,𝟐𝟖) = 2.4671

El intervalo de confianza para la diferencia de medias con varianzas poblacionales conocidas es:

̅𝟏 − 𝒙 ̅𝟐 ) ± 𝒕(𝜶⁄ 𝝁𝟏 − 𝝁𝟐 = (𝒙

𝑺𝒑 𝟐,𝒗)



1

𝑛1

+

1 𝑛2

𝝁𝟏 − 𝝁𝟐 = (17.2 − 18.1) ± 2.4671 ∗ 2.9959 √

1 17

+

1 13

𝝁𝟏 − 𝝁𝟐 = (−0.90) ± 2.7232 = (−3.6232, 1.8232)

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

R// El intervalo para las diferencias en los pesos promedio es de -3.6232 y 1.8232 onzas, dado que el intervalo incluye el 0 podemos decir que no hay diferencia entre los pesos de las dos bebidas.

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES 1. Se encuestan 10 escuelas de ingeniería de Estados Unidos. La muestra contiene a 250 ingenieros eléctricos, de los cuales 80 son mujeres; y 175 ingenieros químicos, de los cuales 40 son mujeres. Calcule un intervalo de confianza del 90% para la diferencia entre la proporción de mujeres en estos dos campos de la ingeniería. ¿Hay una diferencia significativa entre las dos proporciones? Datos: Ing. Eléctricos Ing. Químicos 80 40 𝒙 (mujeres) 250 175 𝒏 𝑝̂1 =

𝑥1 80 = = 0.32 𝑛1 250

𝑝 ̂ 1 (1 − 𝑝̂ 1 )

𝑆𝑝̂1 −𝑝̂2 = √

𝑛1

+

𝑝̂2 =

𝑝 ̂ 2 (1 − 𝑝̂ 2 )

𝑛2

𝑥2 40 = = 0.23 𝑛2 175 0.32(0.68)

=√

250

+

0.23(0.77)

175

𝑆𝑝̂1 −𝑝̂2 = 0.0434 Sabemos que α es 0.10 y α/2=0.05 por lo que 𝑍𝛼⁄2 = −1.645

𝜋1− 𝜋2 = (𝑝̂1 − 𝑝̂2 ) ± 𝑍𝛼⁄2 𝑆𝑝̂1−𝑝̂2 𝜋1− 𝜋2 = (0.32 − 0.23) ± 1.645(0.0434) = 0.09 ± 0.0714 𝜋1− 𝜋2 = (0.0186, 0.1614) R// El intervalo para la diferencia de proporciones está entre 1.86 y 16.14%, el intervalo nos indicaría que la proporción de mujeres que se desempeña en la rama de la ingeniería eléctrica es mayor a la proporción de mujeres que se desempeña en la ingeniería química. 2. De 35 personas que están en un plan de adelgazamiento, el 70% alcanzó la meta. Un segundo plan funciona para el 65% de las 50 personas que lo utilizan. ¿Un intervalo del 99% indica una diferencia en la tasa de éxito de los planes?

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

Datos: Plan 1 0.70 35

̂ 𝒑 𝒏 𝑝 ̂ 1 (1 − 𝑝̂ 1 )

𝑆𝑝̂1 −𝑝̂2 = √

𝑛1

Plan 2 0.65 50

𝑝 ̂ 2 (1 − 𝑝̂ 2 )

+

𝑛2

0.70(0.30)

=√

35

+

0.65(0.35)

50

𝑆𝑝̂1 −𝑝̂2 = 0.1027 Sabemos que α es 0.05 y α/2=0.025 por lo que 𝑍𝛼⁄2 = −2.575

𝜋1− 𝜋2 = (𝑝̂1 − 𝑝̂ 2 ) ± 𝑍𝛼⁄2 𝑆𝑝̂1−𝑝̂2 𝜋1− 𝜋2 = (0.7 − 0.65) ± 2.575(0.1027) = 0.05 ± 0.2644 𝜋1− 𝜋2 = (−0.2144, 0.3144) R// El intervalo para la diferencia de proporciones está entre -0.2144 y 0.23144, dado que el 0 está incluido en nuestro intervalo podemos afirmar que no hay diferencia entre los dos planes de adelgazamiento, su tasa de éxito puede considerarse igual.

CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA LA DIFERENCIA DE DOS POBLACIONES 1. Se llevará a cabo un estudio para estimar el porcentaje de habitantes de dos ciudades que están a favor de tener agua fluorada. ¿Qué tan grande debería ser la muestra si se desea tener al menos 95% de confianza en que el estimado este dentro del 1% del porcentaje verdadero? Datos: 1 − 𝛼 = 95% 𝛼 = 0.05 𝛼/2 = 0.025 𝑍𝛼⁄2 = −1.96 𝜀 = 0.01 Dado que no se nos proporcionan los valores de las proporciones asumiremos que ambas serán de 0.5, procedemos a calcular el tamaño de la muestra utilizando la siguiente expresión: 𝑛= 𝑛=

𝑍𝛼⁄2 2 [𝜋1 (1 − 𝜋1 ) + 𝜋2 (1 − 𝜋2 )]

(−1.96)

2 [0.5(0.5)

0.012

𝜀2 + 0.5(0.5)]

= 19208

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

R// Es necesario tomar una muestra de 19, 208 ciudadanos para cumplir con las condiciones dadas. 2. La Comisión de Planeación Económica de Texas pidió a un economista que desarrollará un intervalo de confianza al 99% para la diferencia entre la duración promedio del servicio prestado por empleados públicos y el de los trabajadores del sector privado. La comisión desea un ancho de intervalo de 3 años. Las muestras pilotos produjeron varianzas de 18 y 23, respectivamente. ¿Qué tan grandes deberían tomarse las muestras de cada población? Debido a que nos piden que el ancho del intervalo sea de 3 años, debemos dividir el tiempo en dos pues los 3 años corresponden a todo el intervalo no solo a la mitad del mismo, nuestro error sería entonces de 1.5 años. Datos: 1 − 𝛼 = 99% 𝛼 = 0.01 𝛼/2 = 0.005 𝑍𝛼⁄2 = −2.575 𝜀 = 1.5 𝜎 21 = 18 𝜎 2 2 = 23 𝑍𝛼⁄2 2 (𝜎1 2 + 𝜎2 2 ) 2.5752 (18 + 23) 𝑛= = = 120.82 ≅ 121 𝜀2 1.52 R// Es necesario tomar una muestra de 121 empleados del sector privado y 121 empleados del sector público. 3. Se sabe que de las personas que están en un plan de adelgazamiento, el 70% alcanzó la meta. Un segundo plan funciona para el 65% de las personas que lo utilizan. ¿Qué tamaño han de tener las muestras para estar seguro con un nivel de confianza del 95% de que el error será del 5%? Datos: 𝛼 = 0.05 𝛼/2 = 0.025 𝑍𝛼⁄2 = −1.96 𝜀 = 0.05 𝑝̂1 = 0.70 𝑝̂2 = 0.65 𝑍𝛼⁄2 2 [𝜋1 (1 − 𝜋1 ) + 𝜋2 (1 − 𝜋2 )] 𝒏= 𝜀2 2 [0.70(0.30) (−1.96) + 0.65(0.35)] 𝑛= = 672.28 ≅ 673 0.052 R// Es necesario tomar una muestra de 673 personas de cada plan para cumplir con las condiciones dadas.

INTERVALOS DE CONFIANZA PARA LA RAZON DE LAS VARIANZAS DE DOS POBLACIONES

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

1. Las desviaciones estándar de los diámetros de los cojinetes de bolas producidos por dos máquinas son 0.042cm y 0.035 respectivamente, basados en muestras de tamaño 10 cada una, calcule e interprete un intervalo de confianza al 90% para la relación de las varianzas. Datos: 𝛼 = 0.10 𝛼/2 = 0.05 𝑠1 = 0.042 𝑠2 = 0.035 𝑛1 = 𝑛2 = 10 Dado que la distribución de Fisher no es simétrica necesitaremos dos valores de F, uno para cada rama del intervalo. Para ello necesitaremos calcular los grados de libertad para cada población. 𝑣1 = 10 − 1 = 9

𝑣2 = 10 − 1 = 9

Dado que las muestras tienen el mismo tamaño, utilizaremos el valor de 𝒇(𝟎.𝟎𝟓,𝟗,𝟗) = 𝟑. 𝟏𝟖 Por lo que nuestro intervalo de confianza para la razón de las varianzas será el siguiente. 𝐿𝐼 =

𝐿𝑆 =

𝑆1 2

1

𝑆2 2 𝑓(𝛼⁄2,𝑣1, 𝑣2 ) 𝑆1 2 𝑆2 2

𝑓(𝛼⁄ ,𝑣2,𝑣1) 2

0.0422 1 ∗ = 0.4528 0.0352 3.18 0.0422 = ∗ 3.18 = 4.5792 0.0352

=

𝝈𝟏 𝟐 𝝈𝟏 = (𝟎. 𝟒𝟓𝟐𝟖, 𝟒. 𝟓𝟕𝟗𝟐) = (𝟎. 𝟔𝟕𝟐𝟗, 𝟐. 𝟏𝟑𝟗𝟗) 𝟐 𝝈𝟐 𝝈𝟐 R// Dado que nuestro intervalo de confianza contiene a 1, podemos decir que las varianzas de las dos máquinas son iguales. 2. Diecisiete latas de Red Bull presentan una media de 17.2 onzas, con una desviación estándar de 3.2 onzas y trece latas de Monster producen una media de 18.1 onzas con desviación estándar de 2.7 onzas. ¿qué conclusiones se pueden sacar respecto a la relación de las varianzas del peso de ambas marcas al 95%? Datos: 𝛼 = 0.05 𝛼/2 = 0.025 𝑠1 = 3.2 𝑠2 = 2.7 𝑛1 = 17 𝑛2 = 13 Dado que la distribución de Fisher no es simétrica necesitaremos dos valores de F, uno para cada rama del intervalo. Para ello necesitaremos calcular los grados de libertad para cada población. 𝑣1 = 17 − 1 = 16

𝑣2 = 13 − 1 = 12

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

Necesitaremos dos valores de F, uno para cada rama del intervalo, dichos valores son los siguientes: 𝑓(𝛼⁄2,𝑣1, 𝑣2 ) = 𝑓(0.025,16,12) = 3.18 𝑓(𝛼⁄2,𝑣2,𝑣1) = 𝑓(0.025,12,16) = 2.89 Por lo que nuestro intervalo de confianza para la razón de las varianzas será el siguiente. 𝑆1 2 1 3.22 1 𝐿𝐼 = 2 = ∗ = 0.4417 2.72 3.18 𝑆2 𝑓(𝛼⁄2,𝑣1, 𝑣2) 𝑆1 2 3.22 𝐿𝑆 = 2 𝑓(𝛼⁄ ,𝑣2,𝑣1) = ∗ 2.89 = 4.059 𝑆2 2 2.72 𝝈𝟏 𝟐 𝝈𝟏 = (𝟎. 𝟒𝟒𝟏𝟕, 𝟒. 𝟎𝟓𝟗) = (𝟎. 𝟔𝟔𝟒𝟔, 𝟐. 𝟎𝟏𝟒𝟔) 𝟐 𝝈𝟐 𝝈𝟐 R// Dado que nuestro intervalo de confianza contiene a 1, podemos decir que las varianzas de los pesos de ambas marcas son iguales. 3. Opus Inc., ha desarrollado un proceso para producir oro a partir del agua de mar. Quince galones tomados del océano Pacífico produjeron una media de 12.7 onzas de oro por galón son s=4.2 onzas, y doce galones del océano Atlántico produjeron cifras similares de 15.9 y 1.7. Con base en un intervalo del 98%, ¿se puede decir que hay diferencia en la desviación estándar de las onzas producidas por océano? Datos: 𝛼 = 0.02 𝛼/2 = 0.01 𝑠1 = 4.2 𝑠2 = 1.7 𝑛1 = 15 𝑛2 = 12 Dado que la distribución de Fisher no es simétrica necesitaremos dos valores de F, uno para cada rama del intervalo. Para ello necesitaremos calcular los grados de libertad para cada población. 𝑣1 = 15 − 1 = 14

𝑣2 = 12 − 1 = 11

Necesitaremos dos valores de F, uno para cada rama del intervalo, dichos valores son los siguientes: 𝑓(𝛼⁄2,𝑣1, 𝑣2) = 𝑓(0.01,14,11) = 4.25 𝑓(𝛼⁄2,𝑣2,𝑣1) = 𝑓(0.01,,11,14) = 3.735 Por lo que nuestro intervalo de confianza para la razón de las varianzas será el siguiente.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

𝑆1 2

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 3 INGA. MAYRA CARVAJAL

4.22 1 ∗ = 1.4362 2𝑓 2 1.7 4.25 𝑆2 (𝛼⁄2,𝑣1, 𝑣2 ) 𝑆1 2 4.22 𝐿𝑆 = 2 𝑓(𝛼⁄ ,𝑣2,𝑣1) = ∗ 3.735 = 22.79 𝑆2 2 1.72 𝐿𝐼 =

1

=

𝝈𝟏 𝟐 𝝈𝟏 = (𝟏. 𝟒𝟑𝟔𝟐, 𝟐𝟐. 𝟕𝟗) = (𝟏. 𝟏𝟗𝟖𝟒, 𝟒. 𝟕𝟕) 𝟐 𝝈𝟐 𝝈𝟐 R// Dado que nuestro intervalo no incluye el 1 y ambos valores son mayores que 1, podemos decir que las varianzas y desviaciones estándar de las onzas de oro producidas son distintas. Dado que la razón es mayor a 1 podemos decir que el océano Pacífico tiene una varianza mayor.