Resumen Unidad 2

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA MATERIAL DE APOYO

Views 117 Downloads 5 File size 985KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

UNIDAD 2: TEORÍA DE LA ESTIMACIÓN Glosario: 

Estimación: es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro.



Estimadores insesgados: se consideran así a los estadísticos cuyo valor esperado (promedio aritmético) de su distribución muestral es igual al correspondiente parámetro poblacional. 𝛍𝐗̅ = 𝛍



Estimadores sesgados: se consideran así a los estadísticos cuyo valor esperado (promedio aritmético) de la distribución muestral de su distribución muestral no es igual al correspondiente parámetro poblacional. 𝛍𝐬𝟐 ≠ 𝛔𝟐



Estimador eficiente: si al comparar el valor esperado de la distribución muestral de un estadístico con el de otro estadístico diferente, ambos tienen igual valor, pero las varianzas son diferentes, al estadístico que tiene menor varianza se le conoce como estimador eficiente.



Estimador puntual: se tiene cuando la estimación de un parámetro se hace por medio de un número.



Estimación por intervalo: se tiene cuando la estimación del parámetro se hace entre dos valores.



Estimador por intervalo de confianza: se tiene cuando se hace la estimación por intervalo, estableciéndose un margen de probabilidad llamado nivel de confianza (1-α) el cual garantiza que el parámetro se encuentre dentro de esos valores.



Nivel de confianza o coeficiente de confianza: nivel de confianza que se tiene en el que el intervalo contenga el valor desconocido del parámetro. El nivel de confianza generalmente se asume de 90%, 95% o 99%.



Valor alfa: Es la probabilidad de error o la probabilidad de que un intervalo dado no contenga el parámetro poblacional desconocido.



Error de estimación: cuanto me debo desviar del estadístico para encontrar el valor del parámetro.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

INTERVALOS DE CONFIANZA La estimación de un parámetro poblacional puede realizarse por distintos métodos, el método de estimación por intervalos busca encontrar un rango dentro del cual se encuentre el valor del parámetro con una probabilidad de acierto llamada nivel de confianza. Los niveles de confianza utilizados generalmente son 99, 95 y 90%. A la probabilidad de que el parámetro no se encuentre dentro del rango encontrado se llama valor alfa, α. Los intervalos de confianza tendrán un límite inferior y un límite superior, los mismos se calcularán en base a un estimador muestral al que se le suma y se le resta un error. El cálculo de dicho error cambia dependiendo del parámetro que se esté estimando. El ancho del intervalo puede cambiarse de dos formas: cambiando el nivel de confianza, a mayor nivel más amplio el intervalo; la otra es el cambiar el tamaño de la muestra. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL µ La estimación de intervalos para la media de una población puede realizarse utilizando distribución normal y la distribución de t Student. El primer indicio de cuál de las dos distribuciones utilizar es en base al tamaño de la muestra que se tiene, el otro es si se especifica si se está trabajando con una desviación estándar poblacional o una desviación estándar muestral. En el siguiente esquema σ es la desviación poblacional.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

Sí Sí

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

No

Z



Z

No

t



Z

No

Z

𝜎 conocido

𝜎 conocido

Población normal



Z

𝑛 ≥ 30

No

No





𝜎 conocido

No

E. no paramétrica

𝑛 ≥ 30

Intervalos con desviación estándar poblacional conocida σ

Cuando se conoce la desviación estándar poblacional y la muestra que se tiene es de tamaño mayor o igual a 30 se utilizará la distribución normal Z, la estructura del intervalo de confianza parte de la suposición de que el valor para µ se encontrará dentro de los límites de confianza encontrados con cierta certeza dada. Dado que partiremos de la distribución poblacional partiremos de la siguiente expresión: 𝑥̅ − 𝜇 𝑍=𝜎 ⁄ 𝑛 √ Esperamos que este valor de Z se encuentre dentro del intervalo, con una confianza de 1-𝛼; la probabilidad de error se define como 𝛼 y es la probabilidad de que el intervalo no contenga el valor del parámetro. Como siempre se tiene que la distribución normal tendrá 100% de probabilidad, dado que la confianza es 1-𝛼, cuyos valores suelen ser 90, 95 y 99% de probabilidad los valores de 𝛼 deberían ser sus respectivos complementos, 10, 5 y 1%. En los intervalos de confianza se busca la simetría, es decir que el error se distribuya equitativamente entre el límite superior y el límite inferior. Para ello a cada límite se le asignará la mitad del error de la siguiente manera, por ejemplo:

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

𝜶 = 𝟎. 𝟎𝟓 Entonces cada lado del intervalo tendrá un error de

𝜶 𝟐

=

0.05 2

= 0.025,

esta es la probabilidad que se utilizará para calcular los valores de Z del intervalo de confianza.

Fuente: Probabilidad y estadística para la ingeniería, Walpole 9na. Edición

Se espera que el valor de Z que incluye la media poblacional se encuentre entre los valores de −𝑍𝛼⁄2 y 𝑍𝛼⁄2 lo cual se traduce a la siguiente expresión: 𝑃 (−𝑍𝛼⁄2 ≤ 𝑍 ≤ 𝑍𝛼⁄2 ) = 1 − 𝛼 Si se sustituye Z por su expresión equivalente en el intervalo, siempre utilizando el valor de la desviación estándar para la distribución muestral. 𝑥̅ − 𝜇 𝑃 (−𝑍𝛼⁄2 ≤ 𝜎 ≤ 𝑍𝛼⁄2 ) = 1 − 𝛼 ⁄ 𝑛 √

Por último, dado que lo que queremos estimar es la media poblacional, realizaremos el despeje de la fórmula de Z obteniendo la estructura general del intervalo de confianza para la media poblacional. 𝑃 (𝑥̅ − 𝑍𝛼⁄2

𝜎 √𝑛

≤ 𝜇 ≤ 𝑥̅ + 𝑍𝛼⁄2

𝜎 √𝑛

)= 1−𝛼

Como se mencionó con anterioridad el error de estimación para un intervalo de confianza es cuanto debemos desviarnos del estadístico para encontrar el valor del parámetro. Dependiendo si estamos trabajando o no con una población finita se aplicará el factor de corrección correspondiente. Error de estimación para poblaciones infinitas ±𝑍𝛼⁄2

𝜎 √𝑛

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

Error de estimación para poblaciones infinitas

±𝑍𝛼⁄2

𝜎

𝑁−𝑛 √𝑛 𝑁 − 1 √

El ancho del intervalo de confianza cambiara de acuerdo al nivel de confianza y al tamaño de la muestra, analicemos como cambia de acuerdo al nivel de confianza. 𝟏−𝜶

𝜶

0.90 0.95 0.99

0.10 0.05 0.01

𝜶⁄ 𝟐 0.05 0.025 0.005

𝒁𝜶⁄

𝟐

-1.645 -1.96 -2.575

Dado que el valor de 𝑍𝛼⁄2 multiplica a la desviación estándar de la distribución muestral, mientras más alto sea el valor de 𝑍𝛼⁄2 más ancho será el intervalo, esto se refleja en que los mientras va aumentando el nivel de confianza más certeza se tiene de que el parámetro esté contenido en el intervalo por lo que el error de las colas se reduce.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA



MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

Intervalos con desviación estándar poblacional desconocida

Fuente: Probabilidad y estadística para la ingeniería, Walpole 9na. Edición

Se espera que el valor de t que incluye la media poblacional se encuentre entre los valores de −𝑡𝛼⁄2 y 𝑡𝛼⁄2 lo cual se traduce a la siguiente expresión: 𝑃 (−𝑡𝛼⁄2 ≤ 𝑡 ≤ 𝑡𝛼⁄2 ) = 1 − 𝛼 Si se sustituye t por su expresión equivalente en el intervalo, siempre utilizando el valor de la desviación estándar para la distribución muestral. 𝑥̅ − 𝜇 ≤ 𝑡𝛼⁄2 ) = 1 − 𝛼 𝑠̂⁄ √𝑛 Por último, dado que lo que queremos estimar es la media poblacional, realizaremos el despeje de la fórmula de Z obteniendo la estructura general del intervalo de confianza para la media poblacional. 𝑠 𝑠 𝑃 (𝑥̅ − 𝑡𝛼⁄2 ≤ 𝜇 ≤ 𝑥̅ + 𝑡𝛼⁄2 ) = 1 − 𝛼 √𝑛 √𝑛 𝑃 (−𝑡𝛼⁄2 ≤

Como se mencionó con anterioridad el error de estimación para un intervalo de confianza es cuanto debemos desviarnos del estadístico para encontrar el valor del parámetro. Dependiendo si estamos trabajando o no con una población finita se aplicará el factor de corrección correspondiente. 

Error de estimación para poblaciones infinitas 𝑠 ±𝑡𝛼⁄2 √𝑛



Error de estimación para poblaciones infinitas ±𝑡𝛼⁄2

𝑠̂

𝑁−𝑛 √𝑛 𝑁 − 1 √

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

Intervalo de confianza para proporciones Al igual que en las distribuciones muestrales para la proporción de una población, ser calculará un valor de Z, en este caso el cálculo del intervalo se basará en la proporción muestral. ̂ = 𝒙⁄𝒏 𝒑 De acuerdo a la distribución muestral se tiene que el valor de Z se estima de la siguiente manera: ̂ ± 𝟏⁄𝟐𝒏 − 𝝅 𝒑 𝒁= √𝝅(𝟏 − 𝝅) 𝒏 Para el caso de los intervalos de confianza se realizarán dos modificaciones, primero dado que se trabajará con muestras grandes el factor de corrección se aproxima a 0, por lo que se no se toma en cuenta para el cálculo. De igual manera para la distribución muestral la desviación estándar se basa en la proporción de la población. Dado que es ese parámetro el que queremos estimar, tendremos que calcular la desviación estándar en base a los datos de la muestra. 𝑺𝒑 = √

̂(𝟏 − 𝒑 ̂) 𝒑 𝒏

Con estas correcciones se pasa a calcular el intervalo de confianza para la proporción poblacional. 𝑃 (−𝑍𝛼⁄2 ≤ 𝑍 ≤ 𝑍𝛼⁄2 ) = 1 − 𝛼 𝑃 −𝑍𝛼⁄2 ≤ (

𝑝̂ − 𝜋 √𝑝̂ (1 − 𝑝̂ ) 𝑛

≤ 𝑍𝛼⁄2

=1−𝛼 )

𝑝̂ (1 − 𝑝̂ ) 𝑝̂ (1 − 𝑝̂ ) 𝑃 (𝑝̂ − 𝑍𝛼⁄2 √ ≤ 𝜋 ≤ 𝑝̂ ̅ + 𝑍𝛼⁄2 √ )= 1−𝛼 𝑛 𝑛 Al igual que con los intervalos de confianza para la media, se debe realizar la corrección del error de estimación para las poblaciones finitas, el error de estimación sería el siguiente de acuerdo al tipo de población trabajada.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA



Error de estimación para poblaciones infinitas

±𝑍𝛼⁄2 √ 

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

𝑝̂ (1 − 𝑝̂ ) 𝑛

Error de estimación para poblaciones infinitas 𝑝̂ (1 − 𝑝̂ ) 𝑁 − 𝑛 √ ±𝑍𝛼⁄2 √ 𝑛 𝑁−1

Tamaño de la muestra para las medias El tamaño de la muestra utilizando la media poblacional se puede calcular de las siguientes formas. 1. Utilizando la desviación estándar, el valor de Z para alfa medios y el error aceptable.

2. Utilizando la media muestral, la media poblacional, la desviación estándar y el valor de Z para alfa medios. Para obtener el valor de n se debe despejar de la siguiente expresión. 𝑋̅ − 𝜇 𝑍𝛼⁄2 = 𝜎 ⁄ 𝑛 √ Despejando: 𝑍𝛼⁄2 ∗

𝜎

= 𝑋̅ − 𝜇

√𝑛

𝑍𝛼⁄ ∗ 𝜎 2

𝑋̅ − 𝜇 (

𝑍𝛼⁄ ∗ 𝜎 2

𝑋̅ − 𝜇

= √𝑛

2

) = (√𝑛)

2

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

𝒏=

𝟐

𝒁𝜶⁄

𝟐

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

∗ 𝝈𝟐

̅ − 𝝁)𝟐 (𝑿

=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝝈𝟐

(𝜺)𝟐

Se utiliza la diferencia entre la media muestral y la media poblacional como el error, también puede denotarse con 𝜺. 3. Si no se conoce el valor de la desviación estándar deben de obtenerse ya sea de estudios anteriores, de encuentras o de una muestra piloto calculando manualmente. Para fines de estudio en el curso deberán darnos el valor para la desviación estándar. Si no se conoce la desviación estándar de la población, se puede utilizar la desviación estándar de la muestra.

𝒏=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝒔̂𝟐

̅ − 𝝁)𝟐 (𝑿

=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝒔̂𝟐

(𝜺)𝟐

Los tres pasos anteriores son utilizados para poblaciones infinitas, si se está trabajando con poblaciones finitas se realiza el mismo despeje, pero incluyendo el factor de corrección para poblaciones finitas.

𝒏=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝝈𝟐 ∗ 𝑵

(𝑵 − 𝟏)𝜺𝟐 + 𝒁𝜶⁄

𝟐

𝟐

∗ 𝝈𝟐

=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝒔̂𝟐 ∗ 𝑵

(𝑵 − 𝟏)𝜺𝟐 + 𝒁𝜶⁄

𝟐

𝟐

∗ 𝒔̂𝟐

Tamaño de la muestra para las proporciones El tamaño de la muestra utilizando la proporción poblacional se puede calcular de las siguientes formas. 1. Utilizando la desviación estándar, el valor de Z para alfa medios y el error aceptable.

2. Utilizando la media muestral, la media poblacional, la desviación estándar y el valor de Z para alfa medios. Para obtener el valor de n se debe despejar de la siguiente expresión.

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

𝑍=

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

𝑝−𝜋

√𝜋(1 − 𝜋) 𝑛

Despejando: 𝜋(1 − 𝜋) 𝑍∗√ =𝑝−𝜋 𝑛 √

𝜋(1 − 𝜋) 𝑝 − 𝜋 = 𝑛 𝑍 2

(√

𝜋(1 − 𝜋) 𝑝−𝜋 2 ) =( ) 𝑛 𝑍

𝜋(1 − 𝜋) 𝑝−𝜋 2 =( ) 𝑛 𝑍

𝒏=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝝅(𝟏 − 𝝅)

(𝒑 − 𝝅)𝟐

=

𝒁𝜶⁄

𝟐

𝟐

∗ 𝝅(𝟏 − 𝝅) (𝜺)𝟐

Se utiliza la diferencia entre la proporción muestral y la proporción poblacional como el error. 3. En caso de que no nos den el valor de las proporciones de toma p con un valor de 0.5, al igual que q.

Con población finita 𝒏

=

𝑵∗𝒁𝜶⁄ 𝟐 ∗𝝅(𝟏−𝝅)

𝟐 𝟐 (𝑵−𝟏)(𝜺) +𝒁𝜶⁄ 𝟐∗𝝅(𝟏−𝝅) 𝟐

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

INTERVALO DE CONFIANZA PARA VARIANZA

Fuente: Probabilidad y estadística para la ingeniería, Walpole 9na. Edición

La distribución de Chi cuadrado no es simétrica como las distribuciones, normal y t student, es por ello que en lugar de buscar un solo valor de chi cuadrado tendremos que buscar dos valores. Utilizaremos como base la fórmula de chi cuadrado utilizado para la distribución muestral de varianzas. (n − 1)s2 2 χ = σ2 𝑃 (χ2 1−𝛼⁄ ≤ χ2 ≤ χ2 𝛼⁄ ) = 1 − 𝛼 2 2 Se sustituye el equivalente de chi cuadrado en la expresión anterior. (n − 1)s2 𝑃 (χ2 1−𝛼⁄ ≤ ≤ χ2 𝛼⁄ ) = 1 − 𝛼 2 2 2 σ Se despeja la varianza poblacional dado que es el parámetro que queremos encontrar. (𝑛 − 1)𝑆 2 (𝑛 − 1)𝑆 2 𝑃( ≤ 𝜎2 ≤ )= 1−𝛼 χ2𝛼⁄ χ21−𝛼⁄ 2 2

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

Ejemplos: Intervalos para medias con σ conocida 1. Cien latas de 16 onzas de la salsa de tomate Jake’s Mom’s tienen un promedio de 15.2 onzas. La desviación estándar poblacional en peso es de 0.96 onzas. ¿A un nivel de confianza del 95% las latas parecen estar llenas con un promedio de 16 onzas? Datos: .n=100 𝜎 = 0.96 𝑜𝑛𝑧𝑎𝑠 𝛼 = 0.05 𝑍𝛼/2 = −1.96 𝑥̅ = 15.2 𝑜𝑛𝑧𝑎𝑠 1 − 𝛼 = 0.95 𝛼/2 = 0.025 Se sustituye en la siguiente fórmula. 𝜎 0.96 𝐼. 𝐶. = 𝑥̅ ± 𝑍𝛼⁄2 = 15.2 ± −1.96 √𝑛 √100 L.S.=15.388 onzas L.I. =15.012 onzas R/ Se tiene que las latas tienen entre 15.012 y 15.388 onzas de peso en promedio, con un 95% de confianza. Esto nos indica que el peso promedio está por debajo de las 16 onzas esperadas por la empresa. 2. Una muestra de 121 llamadas al número 900 tiene una duración promedio de 16.6 minutos y una desviación estándar de 3.63. Usted pretende discontinuar el servicio a menos que la duración promedio sea superior a 18 minutos. En el nivel de confianza del 90% ¿cuál es su decisión? Datos: .n=121 𝜎 = 3.63 𝑚𝑖𝑛 𝛼 = 0.10 𝑍𝛼/2 = −1.645 𝑥̅ = 16.6 𝑚𝑖𝑛 1 − 𝛼 = 0.90 𝛼/2 = 0.05 Se sustituye en la siguiente fórmula. 𝜎 3.63 𝐼. 𝐶. = 𝑥̅ ± 𝑍𝛼⁄2 = 16.6 ± −1.645 √𝑛 √121 L.S.=17.1429 minutos L.I. =16.0571 minutos

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

R/ Se tiene que la duración promedio de las llamadas está entre 16.06 y 17.14 minutos, con un 90% de confianza. Con los resultados obtenidos se recomienda descontinuar el servicio al ser el tiempo promedio menor a 18 minutos. Intervalos para medias con σ desconocida 1. Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras y una desviación estándar de 1.2 libras. Halle el intervalo de confianza al 95% para estimar el peso promedio de todos los paquetes. Los pesos de los paquetes están distribuidos normalmente. Datos: .n=25 𝑠̂ = 1.2𝑙𝑏𝑠 𝛼 = 0.05 g.l.= 24 𝑥̅ = 3.7 𝑙𝑏𝑠 1 − 𝛼 = 0.95 𝛼/2 = 0.025 𝑡𝛼/2 = 2.0639 Se sustituye en la siguiente fórmula. 𝐼. 𝐶. = 𝑥̅ ± 𝑡𝛼⁄2

𝑠̂

= 3.7 ± 2.0639

1.2

√𝑛 √25 L.S.=4.1953 libras L.I. =3.2047 libras R/ El peso promedio de los paquetes está entre 3.2047 y 4.1953 libras, con una certeza del 90% 2. Se desea estimar la concentración de albúmina total en una especie de murciélagos insectívoros. Se capturó un total de 8 animales con un promedio de 0.2 mg/dl y una desviación estándar de 0.07 mg/dl. Calcule el intervalo de confianza con un nivel de confianza del 99% n=8 𝑥̅ = 0.2𝑚𝑔/𝑑𝑙

𝑠̂ = 0.07𝑚𝑔/𝑑𝑙 1 − 𝛼 = 0.99

𝛼 = 0.01 𝛼/2 = 0.005

g.l.= 7 𝑡𝛼/2 = 3.4995

Se sustituye en la siguiente fórmula. 𝑠̂ 0.07 𝐼. 𝐶. = 𝑥̅ ± 𝑡𝛼⁄2 = 0.2 ± 3.4995 √𝑛 √8 L.S.=0.2866 mg/dl L.I. =0.1134 mg/dl R/ Los murciélagos tendrán una concentración promedio de albúmina de entre 0.1134 y 0.2866 mg/dl, con una certeza del 99%

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

Intervalos para proporciones 1. Se seleccionó una muestra aleatoria de 30 empresas que comercializan productos inalámbricos para determinar la proporción de tales empresas que implementaron software nuevo para aumentar la productividad. Resulto que 8 de las 30 empresas habían implementado tal software. Calcule un intervalo de confianza del 95% en p, la proporción verdadera de ese tipo de empresas que implementaron el nuevo software. 𝛼/2 = 0.025 𝑍𝛼/2 = −1.96 𝟖 ̂ = 𝒙⁄𝒏 = 𝒑 = 𝟎. 𝟐𝟔𝟔𝟕 𝟑𝟎 Se sustituye en la siguiente fórmula. n=30 𝑥=8

𝛼 = 0.05 1 − 𝛼 = 0.95

𝐼. 𝐶. = 𝑝̂ ± 𝑍𝛼⁄2 √

𝑝̂ (1 − 𝑝̂ ) 0.2667(1 − 0.2667) = 0.2667 ± −1.96√ 𝑛 30

L.S.=0.4250 L.I. =0.1084 R/ Se encontró que entre el 10.84 y 42.50% de las empresas implementó el nuevo software con una confianza del 95% 2. Se está considerando un nuevo sistema de lanzamiento de cohetes para el despliegue de cohetes pequeños, de corto alcance. La probabilidad de que el sistema existente tenga un lanzamiento exitoso se representa con π = 0.8. Se toma una muestra de 40 lanzamientos experimentales con el nuevo sistema y 34 resultan exitosos. a) Construya un intervalo de confianza del 99% para p. b) Con base en sus resultados, ¿concluiría que el nuevo sistema es mejor? n=40 𝛼 = 0.01 𝛼/2 = 0.005 𝑥 = 34 1 − 𝛼 = 0.99 𝑍𝛼/2 = −2.575 𝟑𝟒 ̂ = 𝒙⁄𝒏 = 𝒑 = 𝟎. 𝟖𝟓 𝟒𝟎 Se sustituye en la siguiente fórmula. 𝑝̂ (1 − 𝑝̂ ) 0.85(1 − 0.85) 𝐼. 𝐶. = 𝑝̂ ± 𝑍𝛼⁄2 √ = 0.85 ± −2.575√ 𝑛 40 L.S.=0.7046 L.I. =0.9954

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

R/ Se encontró que entre el 70.46 y 99.54% de los lanzamientos resultan exitosos, con un 99% de confianza. El intervalo encontrado incluye la posibilidad de que se tenga casi un 100% de lanzamientos exitosos, sin embargo, también existe la posibilidad de que el promedio de lanzamientos exitosos se encuentre por debajo del 80% actual. Aún con esa restricción se considera que el nuevo sistema es mejor. Cálculo del tamaño de la muestra 1. Un experto en eficiencia desea determinar el tiempo promedio que toma perforar tres hoyos en cierta placa metálica. ¿De qué tamaño debe ser una muestra para tener un 95% de confianza en que esta media muestral estará dentro de 15 segundos de la media verdadera? Suponga que por estudios previos se sabe que σ = 40 segundos. 𝜎 = 40 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 𝛼 = 0.05 𝑍𝛼/2 = −1.96 𝜀 = 15 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠 1 − 𝛼 = 0.95 𝛼/2 = 0.025

𝒁𝜶/𝟐 𝟐 ∗ 𝝈𝟐 𝟏. 𝟗𝟔𝟐 ∗ 𝟒𝟎𝟐 𝒏 == = = 𝟐𝟕. 𝟑𝟐 ≅ 𝟐𝟖 (𝜺)𝟐 (𝟏𝟓)𝟐 R/ Se necesita una muestra de tamaño 28 para asegurar con un 95% de confianza que la media muestral estará a 15 de la media poblacional. 2. Se desea determinar la proporción de hogares que tienen la costumbre de consumir carne de cerdo en una aldea de Zacapa. En un estudio piloto con 60 hogares de un total de 1130 se estimó que 45 de los hogares entrevistados no acostumbran consumir carne de ninguna clase. ¿Cuál sería el tamaño de muestra si quiere una precisión del 10% y un nivel de confianza del 95% 𝑁𝑝 = 1130 ℎ𝑜𝑔𝑎𝑟𝑒𝑠 𝛼 = 0.05 𝑍𝛼/2 = −1.96 𝑥𝑝 = 15 𝜀 = 10% 1 − 𝛼 = 0.95 𝛼/2 = 0.025 𝑛𝑝 = 60 Como primer paso se debe calcular la proporción del estudio piloto y comparar el tamaño de la muestra y de la población del estudio piloto. 15 𝑝̂ = 𝑥⁄𝑛 = = 0.25 60 𝑛 > 0.05𝑁 60 > 0.05 ∗ 1130 60 > 56.5 Por lo tanto, se trata de una población finita

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

𝑛=

𝑛=

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

𝑁 ∗ 𝑍𝛼⁄2 2 ∗ 𝜋(1 − 𝜋) (𝑁 − 1)(𝜀)2 + 𝑍𝛼⁄2 2 ∗ 𝜋(1 − 𝜋)

1130 ∗ (−1.96)2 ∗ 0.25(1 − 0.25) 813.939 = = 67.77 ≅ 68 2 2 (1129)(0.10) + (−1.96) ∗ 0.25(1 − 0.25) 11.29 + 0.7203

R/ Se necesita una muestra de 68 hogares para asegurar con un 95% de confianza que la precisión será del 10% Intervalos para varianza 1. Se utiliza una máquina para llenar cajas de un producto en una operación de la línea de ensamble. Gran parte del interés se centra en la variabilidad del número de onzas del producto en la caja. Se sabe que la desviación estándar en el peso del producto es de 0.3 onzas. Se realizan mejoras y luego se toma una muestra aleatoria de 20 cajas, y se encuentra que la varianza de la muestra es de 0.045 onzas2. Calcule un intervalo de confianza del 95% de la varianza del peso del producto. Si considera el rango del intervalo de confianza, ¿le parece que el mejoramiento en el proceso incremento la calidad en lo que se refiere a la variabilidad? Suponga normalidad en la distribución del peso del producto. 𝜎 = 0.3𝑜𝑛𝑧𝑎𝑠 𝛼 = 0.05 1 − 𝛼/2 = 0.975 .n=20 cajas 2 𝑠̂ = 0.045 𝑜𝑛𝑧𝑎𝑠 1 − 𝛼 = 0.95 𝛼/2 = 0.025 g.l. =19 Dado que la distribución de chi cuadrado no es simétrica se calcularán los dos valores para cada uno de los límites. χ2 𝛼⁄ = 32.852 χ21−𝛼⁄2 = 8.907 2 Ahora se calculan los límites 𝐿. 𝐼. = 𝐿. 𝑆. =

(𝑛 − 1)𝑆 2

χ2

𝛼⁄ 2

(𝑛 − 1)𝑆 2

χ2

=

1−𝛼⁄2

=

(20 − 1)0.045

32.852 (20 − 1)0.045

8.907

= 0.026 𝑜𝑛𝑧𝑎𝑠 2 = 0.16 𝑜𝑛𝑧𝑎𝑠 = 0.096 𝑜𝑛𝑧𝑎𝑠 2 = 0.31 𝑜𝑛𝑧𝑎𝑠

R/ El intervalo de confianza para la varianza es de (0.026,0.096), estas medias están en onzas cuadradas. Para realizar una comparación sacaremos la raíz cuadrada de cada límite para encontrar el intervalo de la desviación estándar. Con ello obtenemos un intervalo de 0.16 a 0.31 onzas, esto nos indica que el mejoramiento del proceso logró reducir la

UNIVERSIDAD DE SAN CARLOS DE GUATEMALA FACULTAD DE INGENIERÍA ESCUELA DE CIENCIAS ÁREA DE ESTADÍSTICA

MATERIAL DE APOYO ESTADÍSTICA 2 UNIDAD 2 INGA. MAYRA CARVAJAL

variabilidad pues nuestras nuevas desviaciones se encuentran por debajo de la desviación anterior de 0.30 onzas. 2.

Los rodamientos esféricos que fabrica una maquina deben de tener un diámetro uniforme para ser aptos para su uso. El responsable de la maquina asegura que la varianza es 𝜎 2 = 0.025. Medidos 50 rodamientos se obtuvo una varianza muestral de 0.0272. ¿Con un nivel de confianza del 95%, es correcta la afirmación previa? 𝜎 2 = 0.025 𝑠̂ 2 = 0.0272

𝛼 = 0.05 1 − 𝛼 = 0.95

1 − 𝛼/2 = 0.975 .n=50 𝛼/2 = 0.025 g.l. =49

Dado que la distribución de chi cuadrado no es simétrica se calcularán los dos valores para cada uno de los límites. χ2 𝛼⁄ = 70.2122 χ2 1−𝛼⁄2 = 31.5646 2 Ahora se calculan los límites 𝐿. 𝐼. = 𝐿. 𝑆. =

(𝑛 − 1)𝑆 2

χ2

𝛼⁄ 2

(𝑛 − 1)𝑆 2

χ2

=

1−𝛼⁄2

=

(50 − 1)0.0272

70.2122 (50 − 1)0.0272

31.5646

= 0.01898 = 0.04222

R/ El intervalo de confianza para la varianza es de (0.01898, 0.04222), con un 95% de confianza. La afirmación del encargado es correcta dado que el valor de 0.025 se encuentra dentro del intervalo de confianza, sin embargo, se pueden presentar variaciones en el mismo. Por lo tanto, es recomendable realizar más análisis.