Intervalos de Confianza El intervalo de confianza describe la variabilidad entre la medida obtenida en un
Views 165 Downloads 2 File size 909KB
Intervalos de Confianza El intervalo de confianza describe la variabilidad entre la medida obtenida en un estudio y la medida real de la población (el valor real). Corresponde a un rango de valores, cuya distribución es normal y en el cual se encuentra, con alta probabilidad, el valor real de una determinada variable. Esta “alta probabilidad” se ha establecido por consenso en 95%. Así, un intervalo de confianza de 95% nos indica que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza. Supongamos que tenemos una moneda, la cual puede o no estar balanceada. Así después de varios lanzamientos, la probabilidad que el resultado sea sello, variará desde 0 (todas las veces cara, es decir, una moneda balanceada) hasta 1 (toda las veces sello, nuevamente balanceada), pasando por 0.5 (la mitad de las veces sello y las otras cara, lo que equivale una moneda no balanceada). Como no conocemos la verdadera naturaleza de la moneda, vamos a experimentar con ella. Iniciamos el experimento con 2 lanzamientos, uno es cara y el otro es sello. La probabilidad de que el resultado sea sello fue 0.5, con lo que podríamos concluir que la moneda no está balanceada, sin embargo, ¿Con sólo 2 lanzamientos podemos concluir con total certeza la naturaleza de la moneda? La respuesta es no, por lo tanto ¿Cuál es el rango de valores donde se encuentra el valor real? Dado que el azar pudo influir en este resultado, uno acepta que el rango de valores reales posibles es amplio, incluso desde uno tan bajo como 0 a uno tan alto como 1, por lo tanto aún no estamos seguros de la naturaleza de nuestra moneda. Considerando ésto, ampliamos el experimento y realizamos 8 nuevos lanzamientos (10 en total), resultando 5 caras y 5 sellos. Nuevamente el resultado es 0.5, sin embargo, ahora intuitivamente nos percatamos que la verdadera naturaleza de la moneda se encuentra en un rango menos amplio. Por ejemplo, es poco probable que después de 10 lanzamientos 9 sean sello, menos aún que todos lo sean, sin embargo, aún es factible que 8, 7 o 6, sí lo sean. Así, nuestro nuevo rango puede variar entre 0,2 y 0,8, pero con un alcance: todos advertimos que si bien 0.8, y 0.2 son posibles, los valores centrales (0,4 y 0.6) los son más aún, siendo 0.5 el más probable. Decidimos seguir experimentando, realizando 90 nuevos lanzamientos (100 en total), resultando 50 caras y 50 sellos. nuevamente el resultado es 0.5, advirtiendo que cada vez es más probable que la verdadera naturaleza de nuestra moneda es el de una no balanceada, pero aún con un rango de variabilidad que podríamos estimar entre 0.4 y 0.6 (es decir, que después de 100 lanzamientos, el resultado real varíe entre 40 y 60 sellos).
Realizamos 1000 lanzamientos, resultando 500 sellos y 500 caras, con lo que estamos aún más seguros que nuestra moneda no está balanceada (nuestro rango puede ser 0.45 a 0.55 o menor). Del ejemplo anterior nos permite aclarar varios conceptos: ●
La “verdadera naturaleza” de nuestra moneda (si está balanceada o no) corresponde al valor real. ● El rango de valores reales posibles, es decir el rango donde se encuentra la verdadera naturaleza de nuestra moneda corresponde al Intervalo de Confianza (IC). ● El valor real más probable corresponde al estimador puntual del estudio, en este caso 0.5. ● Finalmente, advertimos la relación inversa entre la amplitud del IC y el tamaño muestral: si consideramos que el número de lanzamientos respresenta el n de la muestra, observamos que mientras más pequeño es el n más amplio es el IC. A mayor número de lanzamientos (mayor n) más certeza tenemos que el resultado del experimento se acerca al valor real, por lo tanto el IC es más estrecho.
INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde X representa el número de éxitos en N pruebas.Por tanto, la proporción de la muestra p=x/n se utilizará como estimador puntual del parámetro P. Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones. Considerando el valor z para la distribución de proporciones:
Si intentamos despejar el valor de P nos encontramos con que
Pero ¿cómo podemos encontrar P si también está del lado derecho de la ecuación? Lo que haremos es aproximar la proporción de la población por la de la muestra, es decir sustituir P por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable ya que realmente se debería emplear la distribución binomial, por tanto, no se debe utilizar. Para estar seguros, se debe requerir que np y n(1p) sea mayor o igual a 5. El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá el valor de
Existen dos alternativas a la hora de construir un intervalo de confianza para p: ● Considerar la aproximación asintótica de la distribución Binomial en la distribución Normal. ● Utilizar un método exacto.
Aproximación asintótica Tiene la ventaja de la simplicidad en la expresión y en los cálculos, y es la más referenciada en la mayoría de textos de estadística. Se basa en la aproximación
que, trasladada a la frecuencia relativa, resulta
Tomando como estadístico pivote
que sigue una distribución N(0, 1), y añadiendo una corrección por continuidad al pasar de una variable discreta a una continua, se obtiene el intervalo de confianza asintótico:
donde zα/2 es el valor de una distribución Normal estándar que deja a su derecha una probabilidad de α/2 para un intervalo de confianza de (1 − α) ∙ 100 %. Las condiciones generalmente aceptadas para considerar válida la aproximación asintótica anterior son:
Ejemplos: A. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasarían todas las pruebas. Solución:
B. En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 95% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales.
1. El 60 de una población de 20 000 habitantes tiene los ojos oscuros. Si elegimos al azar 50 personas de esa población, ¿cuál es la probabilidad de que haya menos de 30 personas con los ojos oscuros?
2. Un examen de 100 preguntas admite como respuesta en cada una de ellas dos posibilidades, verdadero o falso. Si un alumno contesta al azar, calcula la probabilidad de que acierte más de 60 respuestas.
3. El 7% de los pantalones de una determinada marca salen con algún defecto. Se empaquetan en caja de 80 para distribuirlos por diferentes tiendas. ¿Cuál es la probabilidad de que en una caja haya más de 10 pantalones defectuosos?
4. En una urna hay 3 bolas rojas, 2 blancas y 5 verdes. Sacamos una bola, anotamos su color y la devolvemos a la urna. Si repetimos la experiencia 50 veces, ¿cuál es la probabilidad de sacar roja en más de 20 ocasiones?
5. Lanzamos un dado 300 veces. ¿Cuál es la probabilidad de que obtengamos más de 70 unos?
6. En una moneda defectuosa, la probabilidad de obtener cara es de 0,586. Si hacemos tandas de 40 lanzamientos: a) ¿Cómo se distribuye la proporción de caras en esas tandas? b) ¿Cuál es la probabilidad de que la proporción de caras en una tanda sea mayor de 0,6?
Intervalo de confianza para la media de una población De una población de media y desviación típica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media. Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional: Pero además, si el tamaño de las muestras es lo suficientemente grande, la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: Esto se representa como sigue: Si estandarizamos, se sigue que: En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2tales que P[z1 ≤ z ≤ z2] = 1 α, donde (1 α)∙100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal). Se desea obtener una expresión tal que En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si sólo se conoce una media muestral ( ), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto). Para ello se necesita calcular el punto —o, mejor dicho, su versión estandarizada o valor crítico— junto con su "opuesto en la distribución" . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:
Dicho punto es el número tal que: Y en la versión estandarizada se cumple que: Así: Haciendo operaciones es posible despejar para obtener el intervalo: De lo cual se obtendrá el intervalo de confianza: Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto del valor crítico por el error estándar . Si no se conoce y n es grande (habitualmente se toma n ≥ 30): , donde s es la desviación típica de una muestra. Aproximaciones para el valor para los niveles de confianza estándar son 1,96 para y 2,576 para . Partes de los intervalos de confianza A) Poblaciones normales (o tamaños muestrales > 30) : Donde Z a / 2 es el valor crítico de la normal tipificada que deja a su derecha un área de a / 2, siendo a el nivel de significación del intervalo y s es la cuasidesviación típica muestral. B) Poblaciones no normales (tamaños muestrales £ 30 ): donde ta / 2,n 1, es el valor de la tStudent que deja a su derecha un área de a / 2 , para n1 grados de libertad.
CASOS: **Intervalo de confianza para la media μ de una población normal con desviación típica conocida σ Si partimos de una población que sigue una distribución Z ~ N(0,1) bastará con encontrar el punto crítico zα/2 para tener un intervalo que contenga la media poblacional con probabilidad c. p(zα/2