Intervalo Confianza

Departamento de Ciencias Exactas Recurso básico de Aprendizaje (OA) ESTADISTICA INFERENCIAL PARA CIENCIAS HUMANAS (CHU

Views 200 Downloads 2 File size 328KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Departamento de Ciencias Exactas

Recurso básico de Aprendizaje (OA)

ESTADISTICA INFERENCIAL PARA CIENCIAS HUMANAS (CHUM)

Versión

DOCENTE:

1

Ing. María Isabel Chávez Castro

Tema

Intervalos de Confianza

2

Motivación

Es bien sabido que las poblaciones son por lo general demasiado grandes para estudiarlas en su totalidad y se exige que se tomen muestras, de las cuales podremos extraer inferencias sobre las poblaciones origen. Es así, que resultaría mucho más fácil calcular la media de una muestra representativa y a partir de ellas hacer una estimación de la media poblacional. Hay dos tipos de estimadores, como mínimo, que se utilizan para este fin: la estimación puntual y la estimación de intervalo. La estimación puntual se vale del estadístico para estimar el parámetro en un solo valor o punto; mientras que la estimación de intervalo es la que define un intervalo dentro del cual puede estar el parámetro desconocido. El intervalo suele ir acompañado de una afirmación sobre el nivel de confianza que se puede asignar a su precisión, de allí que se lo llama intervalo de confianza. Los intervalos de confianza son de gran utilidad en la toma de numerosas decisiones relacionadas con la empresa, y el estudio de la presente unidad permitirá que les sea evidente las distintas formas de aplicar esta herramienta estadística en el marco de sus actividades profesionales.

3

Resultado del aprendizaje:

Calcula e interpreta un intervalo de confianza de una media o de una proporción Calcula el tamaño de muestra para medias y proporciones

4

Contenido:

Se sabe que un estimador puntual es un estadístico muestral que se usa para estimar un parámetro poblacional. Como no se puede esperar que un estimador puntual suministre

el valor exacto del parámetro poblacional, se debe utilizar lo que se llama estimación por intervalos ya que los intervalos estadísticos expresan la incertidumbre debida a la variabilidad de los datos muestrales. Es así, que por ejemplo, basados en una muestra de hogares en los que se está viendo televisión se puede construir un intervalo que contenga, con un grado específico de confiabilidad, la media o la desviación estándar de la cantidad de hogares que ven programas infantiles en la televisión. Intervalo de Confianza Un intervalo de confianza se define como un “rango de valores calculado a partir de los

datos muestrales, el cual probablemente incluye el valor verdadero de un parámetro desconocido” (Galindo, 1999) Un intervalo de confianza tiene un límite inferior de confianza (LCL) y un límite superior de confianza (UCL). A cada intervalo se le asocia una probabilidad (1-α) de que contenga el valor verdadero del valor del parámetro considerado. A tal probabilidad se la llama nivel de confianza (o coeficiente de confianza). Es así entonces que: (

)

Al intervalo que cumpla con estas condiciones se lo nombra como intervalo de confianza al 100 (1-α)% (α se conoce como nivel de significancia) Para tener resultados fiables, el nivel de confianza debe ser alto (muy cercano a 1) por lo que normalmente toma valores de 0,90; 0,95; 0,99. (90%, 95%, 99% expresados como porcentajes) Es importante mencionar que mientras más confiabilidad se requiera en los resultados el nivel de confianza deberá ser mayor y por lo tanto la anchura del intervalo; sin embargo, hay una contrapartida ya que si bien se está seguro de que el intervalo contiene el valor verdadero del parámetro, el intervalo de confianza es más ancho y menos preciso. Obviamente una mayor confiabilidad se obtendrá también con un tamaño de muestra mayor, cuyo análisis se realizará en el transcurso de la unidad. Interpretación de los intervalos de confianza: Un intervalo de confianza puede ser interpretado de dos maneras distintas: a) Confía, al nivel de confianza estipulado, que el parámetro se encuentra en el intervalo determinado b) Si se construyen todos los intervalos de confianza posibles, el porcentaje de ellos que incluirá el parámetro desconocido coincide con el nivel de confianza considerado. Por ejemplo: La directora de un centro de cuidado infantil de la ciudad de Quito ha determinado que los gastos medios en medicina preventiva para los niños de su centro está en un intervalo de 35 a 38 dólares calculado a un nivel de confianza del 95%. Esto puede ser interpretado entonces de la siguiente manera:

a) En sentido a priori (antes de calcular el intervalo) se puede decir que existe un 95% de probabilidad de construir un intervalo que comprenda la media poblacional. Sin embargo, una vez que se ha calculado el intervalo, la probabilidad de que en el intervalo entre 35 y 38 se encuentre la media poblacional es 1 o 0 y no del 95%, ya que el valor de 95% se asigna al grado de confianza de que se encuentre en el intervalo, no a la probabilidad de que esté en él. b) La segunda interpretación parte de la consideración de que a partir de cualquier población se pueden tomar infinitas muestras diferentes de tamaño n. Cada muestra dará lugar a un intervalo ligeramente distinto porque cada una de ellas tiene una media algo diferente afirmándose que en el 95% de estos intervalos se incluirá la media poblacional desconocida.

Estimación de la media poblacional: Intervalo de confianza para la media poblacional Una de las más comunes aplicaciones de los intervalos de confianza es la de estimar la media poblacional. Se toman dos consideraciones: a) Para muestras grandes: (tamaño de muestra mayor o igual a 30) Un intervalo de confianza para la media poblacional µ, a un determinado nivel de confianza, viene dado por la ecuación: ( ̅





̅





)

donde: n es el tamaño de la muestra σ es la desviación estándar de la población es el valor z que corresponde al área de α/2 en el extremo superior de la ⁄ distribución normal estándar Es importante mencionar que si se desconoce el valor de σ puede reemplazarse por su estimador muestral, sin pérdida de exactitud. Los valores más comunes utilizados como niveles de confianza con sus respectivos valores de z son:

Nivel de confianza

α

α/2

Zα/2

90%

0,10

0,05

1,645

95%

0,05 0,025

1,960

98%

0,02

0,01

2,326

99%

0,01 0,005

2,576

Ejemplo: El director creativo de una fábrica de juguetes didácticos le ha pedido que estime el tiempo medio necesario para producir una unidad concreta del proceso de fabricación. Una muestra de 600 unidades da una media de 7,2 días. Se sabe que la desviación estándar es de 1,90 días. A un nivel de confianza del 90%, calcular el corresponde intervalo de confianza para el tiempo medio de ejecución del proceso de fabricación. Datos: ̅ días n = 600 σ =1,90 días Nivel de confianza = 90% (0,90), es decir que α = 1- 0,90 = 0,10. Por lo tanto α/2 = 0,05 ⁄ (valor z que corresponde al área de α/2) = 1,645 Entonces el intervalo de confianza para el tiempo medio de ejecución solicitado será: ( ̅



(



̅





)





(

)

) (

)

Interpretación: Estoy 90% seguro de que el tiempo medio de ejecución del proceso de fabricación está entre 7,072 días y 7,328 días.

b) Para muestras pequeñas: (tamaño de muestra menor a 30) Antes de hablar del intervalo de confianza para muestras pequeñas será necesario revisar el tema sobre Distribución T de Student.

Distribución T de Student: Cuando hay que tomar una muestra pequeña, la distribución normal no siempre es la adecuada. En concreto, cuando la muestra es pequeña y la desviación estándar es desconocida, no se deberá apllcar la distribución z recurriéndose a una distribución alternativa llamada T de Student. Los valores de probabilidad vienen tabuladas en la tabla que se muestra en el link: https://www.uam.es/personal_pdi/ciencias/gallardo/Tablas-normal-chi-t-F.pdf Estos valores dependen de los grados de libertad (g.l) porque la ley de probabilidad t varía cuando n varía. Cuando n aumenta, la distribución t tiende hacia la normal estándar. La lectura de la tabla se hace de la siguiente manera;

a) Escoger el número r de grados de libertad de acuerdo al tamaño de la muestra b) Considerar la probabilidad α, según el nivel de confianza c) Lee los valores obtenidos de t en la tabla (recuerde de se lee: el valor t a r grados de libertad y nivel de significancia α) Ejemplo: Encontrar el valor de la ley t para una muestra de 7 personas y un nivel de confianza de 95%. Con estos datos se sabe que: Grados de libertad = r = tamaño de la muestra = 7 Nivel de confianza = 95% (0,95), es decir que α = 1-0,95 = 0,05 Con estos dos datos entrando a la tabla se obtiene que el valor t buscado es de = 1,895.

Intervalo de confianza: Para construir un intervalo de confianza para la media en muestras pequeñas, debemos basar nuestra ecuación en la distribución t, por lo tanto quedará establecida de la siguiente manera: ( ̅

⁄ (

)



̅

⁄ (

)



)

donde: n es el tamaño de la muestra s es la desviación estándar muestral es el valor de la distribución t de Student a (n-1) grados de libertad, para el ) ⁄ ( cual el área en el extremo superior es igual a α/2. Ejemplo: En una muestra de 16 estudiantes de una carrera se encontró una estatura media de 164.5 cm con una desviación estándar de 8.3 cm Calcular e interpretar un intervalo de confianza de 95% para la media poblacional. Datos: ̅ cm n = 16, es decir n-1 = 16 -1 = 15 s = 8,3 cm Nivel de confianza = 95% (0,95), es decir que α = 1- 0,95 = 0,05. Por lo tanto α/2 = 0,025 ) (el valor t a 15 grados de libertad y un nivel de significancia 0,025) = 2,131 ⁄ ( Entonces el intervalo de confianza para la media poblacional será:

( ̅

⁄ (

)

(

̅

⁄ (



)





)

)



(

) (

)

Interpretación: Estoy 95% seguro de que la estatura media de los estudiantes de una carrera está entre 160.078 cm y 168.922 cm Estimación de la media poblacional: poblacionales

Intervalo de confianza para proporciones

Muchas veces las decisiones dependen de parámetros con dos categorías en donde puedan caer las respuestas. Es así, que cuando esto sucede el parámetro que se utiliza es la proporción poblacional. Para construir el correspondiente intervalo de confianza se utiliza la siguiente ecuación:

( ̂





̂(

̂) ̂





̂(

̂)

)

donde: n es el tamaño de la muestra zα/2 es el valor z que corresponde al área α/2 en el extreme superior de la distribución normal estándar. Ejemplo: En un estudio realizado a los egresados de la carrera de Licenciatura en Administración Educativa, los investigadores encontraron que, de una muestra de 210 egresados, 77 habían repetido la materia de Dirección Estratégica. Calcule un intervalo de confianza al 90% para la proporción poblacional de los que han repetido la materia de Dirección Estratégica. Datos: El valor proporcional para quienes han repetido la materia indicada = ̂

n = 210 egresados Nivel de confianza = 90% (0,90), es decir que α = 1- 0,90 = 0,10. Por lo tanto α/2 = 0,05 (valor z que corresponde al área de α/2) = 1,645 ⁄ Entonces el intervalo de confianza para la proporción poblacional será:

( ̂



̂(

̂)

(



(



̂





)

̂(

̂)



)

(

) )

)

( (

)

Interpretación: Estoy 90% seguro de que la proporción poblacional para los egresados que repitieron la materia de Dirección Estratégica está entre 0,312 y 0,422.

Tamaño de muestra El tamaño de la muestra es importante en la determinación de la probabilidad del error y la precisión de la estimación. Tomando en consideración el nivel de confianza, existen dos factores que inciden en el tamaño muestral: a) La variabilidad de la población (σ2), que es un factor no controlable por el investigador. b) El grado de error que se puede aceptar, que es un factor que depende de lo crítico que sea el trabajo sobre el cual se está analizando el parámetro. Es importante mencionar que cualquier intervalo dado tiene una amplitud igual al doble del error tolerable.

a) Tamaño de muestra para la media poblacional: Debemos partir de que la variable tipifica z es igual a: ̅

̅ √

despejando n se tiene:

( ̅

)

En ciertas bibliografías encontrará la siguiente relación, que es equivalente a la anterior: (

donde, ̅



) ( )

es el error permitido o tolerable ( E ).

b) Tamaño de muestra para la proporción: Para este caso debemos partir de que los intervalos de confianza tienen la forma: ̂ donde el error es





̂(

̂)





̂(

̂)

por lo que el tamaño de la muestra se calculará con la

siguiente ecuación: (



)

̂(

̂)

Si no se conociera de antemano la estimación de p, se suele tomar p = 0,5, porque este valor hace que tengamos un tamaño de muestras máximo. Ejemplos: a) Se desea conocer la distancia promedio que corren semanalmente los miembros del club de carreras de fondo “Correr es Vivir”. Por estudios anteriores se conoce que la desviación estándar de estas distancias es 4 km. ¿A cuántos atletas habrá que muestrear si la estimación debe quedar a menos de 0,2 km con un nivel de confianza del 95%? Datos: σ = 4 km E = 0,2 km porque el intervalo es de la forma ( ̅ ̅ ) Para un intervalo de confianza del 95% se tiene que el valor de z = 1,96 Entonces: ( ̅ (

)

) ( ) ( )

Es decir, que se necesita un tamaño de muestra mínimo de 1537 atletas. Si la muestra fuera demasiado alta, es necesario aumentar el error permitido. b) Victor Pérez un afamado doctor de la región se presenta como candidato a la Alcaldía de la urbe. Quiere estimar con un error de un punto porcentual la proporción de electores que le votará. También quiere confiar al 98% en los datos que halle. ¿Qué tamaño de muestra deberá tener el sondeo? Datos: Para este caso haremos unos de la proporción en donde se puede asumir p = 0,5 E = 0,01 Nivel de confianza = 98% (0,98), es decir que α = 1- 0,98 = 0,02. Por lo tanto α/2 = 0,01

(valor z que corresponde al área de α/2) = 2,326



Entonces: ( (



)

) (

̂(

( )

̂)

)

Es decir, que necesitará una muestra de 13526 para el sondeo del caso.

5

Autoevaluación

1. Si la media muestral es 42,5, construir un intervalo de confianza del 90% para la media poblacional si n=81 y σ=15,3 (Resp: 39,70≤µ≤45,31) 2. Una muestra de 20 personas recorría cada día en su automóvil por término medio 27,3 millas para ir al trabajo y volver, con una desviación tìpica de 8,3 millas ¿Cuál es el intervalo de confianza del 90% para la distancia media de toda la problación? (Resp: 24,09≤µ≤30,51) 3. Una cadena de fabricantes de arcos para centros infantiles quiere determinar un intervalo de confianza para la contratación diaria de sus productos. Desea un intervalo de 5 contrataciones y un nivel del confianza del 99%. ¿Qué tamaño deberá tener la muestra si σ2=40 contrataciones diarias? (Resp: 43 días)

6

Recursos Complementarios

https://youtu.be/2WlPJYMUxls https://www.youtube.com/watch?v=EsAGiLv8qVE https://www.youtube.com/watch?v=X5E5APryEvs https://www.youtube.com/watch?v=nH9q9UJwZmc

7

Referencias/Bibliografía)

Webster, A. (2012). Estadística Aplicada para la Administración y Economía. Estados Unidos: Irwin. Galindo, E. (1999). Estadística para la Administración y la Ingeniería. Ecuador: Gráfica Mediavilla Hnos.