Intervalos de confianza

Intervalos de Confianza   El  intervalo  de  confianza  describe  la  variabilidad  entre  la  medida  obtenida  en  un 

Views 165 Downloads 2 File size 909KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Intervalos de Confianza   El  intervalo  de  confianza  describe  la  variabilidad  entre  la  medida  obtenida  en  un  estudio   y  la  medida  real  de  la  población  (el  valor  real).  Corresponde  a  un  rango  de  valores,  cuya  distribución  es  normal  y  en  el  cual  se  encuentra,  con  alta  probabilidad,  el  valor  real  de  una  determinada  variable.  Esta  “alta  probabilidad”  se  ha  establecido  por  consenso  en  95%.  Así,  un  intervalo  de  confianza de  95%  nos  indica  que  dentro  del  rango dado  se encuentra  el valor real  de un parámetro con 95% de certeza.    Supongamos  que  tenemos  una  moneda,  la  cual  puede  o no  estar  balanceada.  Así  después de  varios  lanzamientos,  la  probabilidad  que  el  resultado  sea  sello,  variará  desde  0  (todas las veces  cara,   es  decir,  una  moneda  balanceada)  hasta   1  (toda  las  veces  sello,  nuevamente balanceada),  pasando  por  0.5  (la  mitad  de  las  veces  sello  y las  otras  cara,  lo  que  equivale  una  moneda  no  balanceada).  Como  no  conocemos  la  verdadera  naturaleza  de  la  moneda, vamos a experimentar con ella.  Iniciamos  el  experimento con  2  lanzamientos,  uno  es  cara  y  el  otro  es sello. La  probabilidad de  que  el  resultado  sea  sello  fue  0.5,  con  lo  que  podríamos  concluir  que  la  moneda  no  está balanceada,  sin  embargo,  ¿Con  sólo  2  lanzamientos  podemos  concluir con  total  certeza  la naturaleza  de  la  moneda?  La  respuesta   es  no,  por  lo  tanto  ¿Cuál  es  el  rango  de   valores donde  se encuentra  el  valor  real?  Dado  que  el  azar pudo influir en este resultado, uno acepta que  el  rango  de  valores  reales  posibles  es  amplio,  incluso  desde  uno  tan  bajo  como  0 a uno tan alto como 1, por lo tanto aún no estamos seguros de la naturaleza de nuestra moneda.  Considerando  ésto,  ampliamos  el  experimento  y  realizamos  8  nuevos  lanzamientos  (10  en total),   resultando  5  caras  y  5  sellos.  Nuevamente  el  resultado  es  0.5,  sin  embargo,  ahora intuitivamente  nos  percatamos  que  la  verdadera naturaleza de la moneda se encuentra  en un rango  menos  amplio.  Por ejemplo, es poco probable  que después de 10 lanzamientos 9 sean sello,  menos  aún  que  todos  lo  sean, sin embargo, aún es factible que 8, 7 o 6, sí lo sean. Así, nuestro  nuevo  rango  puede  variar  entre  0,2  y  0,8, pero con un alcance: todos advertimos que si  bien  0.8,  y  0.2 son posibles, los valores centrales (0,4 y 0.6)  los son más aún, siendo 0.5 el más probable.  Decidimos  seguir  experimentando,  realizando  90   nuevos  lanzamientos  (100  en  total), resultando  50  caras  y  50 sellos.  nuevamente  el resultado es 0.5, advirtiendo que cada vez es más  probable  que  la  verdadera  naturaleza  de  nuestra  moneda  es  el  de  una  no  balanceada, pero  aún  con  un  rango  de  variabilidad  que  podríamos  estimar  entre  0.4  y  0.6  (es  decir,  que después de 100 lanzamientos, el resultado real varíe entre 40 y 60 sellos). 

Realizamos  1000  lanzamientos,  resultando  500  sellos  y  500  caras,  con  lo  que  estamos  aún más  seguros  que  nuestra  moneda  no  está  balanceada (nuestro rango  puede ser  0.45 a 0.55 o menor).  Del ejemplo anterior nos permite aclarar varios conceptos:  ●

La  “verdadera  naturaleza”  de  nuestra  moneda  (si  está  balanceada  o  no) corresponde al valor real.  ● El  rango de valores reales posibles, es decir el rango donde se encuentra la verdadera naturaleza de nuestra moneda corresponde al Intervalo de Confianza (IC).  ● El  valor  real  más  probable corresponde al estimador  puntual del estudio, en este caso 0.5.  ● Finalmente,  advertimos  la  relación  inversa  entre  la  amplitud  del  IC  y  el  tamaño muestral:  si   consideramos  que  el  número  de  lanzamientos   respresenta  el  n  de  la muestra,  observamos  que  mientras  más  pequeño  es  el  n  más   amplio  es  el  IC.  A mayor  número  de  lanzamientos (mayor  n) más  certeza  tenemos  que  el  resultado del experimento se acerca al valor real, por lo tanto el IC es más estrecho.     

INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística  P=X/N,  donde  X  representa  el  número  de  éxitos  en  N  pruebas.Por  tanto,   la  proporción  de  la  muestra p=x/n se utilizará como estimador puntual del parámetro P.  Si  no  se  espera  que  la  proporción  P  desconocida  esté  demasiado  cerca  de 0 ó de 1,  se puede  establecer  un  intervalo  de  confianza  para   P   al  considerar  la  distribución  muestral  de  proporciones.  Considerando el valor z para la distribución de proporciones: 

    Si intentamos despejar el valor de P nos encontramos con que   

   

Pero ¿cómo podemos encontrar P si también está del lado derecho de la ecuación?   Lo  que  haremos  es  aproximar  la  proporción  de  la   población  por  la  de  la  muestra,  es  decir  sustituir  P  por  la  proporción  de  la  muestra  p  siempre  y  cuando  el  tamaño de  muestra  no  sea  pequeño. 

  Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó  a  1,  el   procedimiento  del  intervalo  de  confianza  que  se  establece  aquí  no  es  confiable  ya  que  realmente  se  debería  emplear la  distribución  binomial,  por  tanto,  no  se  debe  utilizar. Para estar  seguros, se debe requerir que   np y n(1­p) sea mayor o igual a 5.  El  error  de  estimación  será  la  diferencia  absoluta  entre  p   y  P,  y  podemos  tener  el  nivel  de  confianza de que esta diferencia no excederá el valor de 

  Existen dos alternativas a la hora de construir un intervalo de confianza para p:  ● Considerar  la  aproximación  asintótica  de  la  distribución  Binomial  en  la  distribución  Normal.  ● Utilizar un método exacto.    

Aproximación asintótica Tiene  la  ventaja de  la  simplicidad  en  la  expresión  y en los cálculos, y es la más referenciada en  la mayoría de textos de estadística. Se basa en la aproximación 

  que, trasladada a la frecuencia relativa, resulta 

 

Tomando como estadístico pivote 

 

 

que  sigue  una  distribución  N(0,  1),  y  añadiendo  una  corrección  por  continuidad  al  pasar de una  variable discreta a una continua, se obtiene el intervalo de confianza asintótico: 

  donde  zα/2  es  el  valor  de  una  distribución   Normal  estándar  que  deja  a  su  derecha  una  probabilidad  de  α/2  para  un  intervalo  de  confianza  de  (1  −  α)  ∙   100   %.  Las  condiciones  generalmente aceptadas para considerar válida la aproximación asintótica anterior son:           

 

Ejemplos: A.  Un  fabricante  de  reproductores  de  discos  compactos  utiliza un  conjunto  de  pruebas  amplias  para   evaluar  la  función  eléctrica  de  su  producto.  Todos  los  reproductores  de  discos   compactos  deben  pasar  todas  las  pruebas  antes  de  venderse.  Una  muestra   aleatoria  de  500  reproductores  tiene  como  resultado  15  que  fallan  en  una  o  más  pruebas.   Encuentre  un  intervalo  de  confianza  de  90%  para  la  proporción  de  los  reproductores de discos compactos de la población que no pasarían todas las pruebas.    Solución:   

        B.  En  un  estudio  de  300  accidentes  de  automóvil  en  una  ciudad  específica,  60  tuvieron  consecuencias  fatales.  Con  base  en  esta  muestra,  construya  un  intervalo  del  95%  de  confianza  para  aproximar  la  proporción  de todos los accidentes automovilísticos que en  esa ciudad tienen  consecuencias fatales. 

   

1.­   El  60  de  una   población  de  20  000 habitantes tiene los  ojos  oscuros.  Si  elegimos  al  azar  50  personas  de  esa  población,  ¿cuál  es  la  probabilidad  de  que  haya  menos  de  30  personas con los ojos oscuros?     

        2.­   Un   examen  de  100  preguntas  admite  como  respuesta  en  cada  una  de  ellas  dos   posibilidades,  verdadero  o  falso.  Si  un  alumno  contesta  al  azar,  calcula  la  probabilidad  de que acierte más de 60 respuestas.     

             

3.­   El  7%  de  los   pantalones  de  una  determinada  marca  salen  con  algún  defecto.  Se  empaquetan  en  caja  de  80  para  distribuirlos  por  diferentes  tiendas.  ¿Cuál  es  la  probabilidad de que en una caja haya más de 10 pantalones defectuosos?     

        4.­   En  una  urna  hay  3  bolas  rojas,  2 blancas y 5 verdes. Sacamos  una bola, anotamos su  color  y  la   devolvemos  a  la  urna.  Si  repetimos  la  experiencia  50  veces,  ¿cuál  es  la  probabilidad de sacar roja en más de 20 ocasiones?     

             

5.­   Lanzamos  un  dado  300  veces.  ¿Cuál es  la  probabilidad  de  que  obtengamos  más  de  70 unos?   

 

    6.­   En  una  moneda  defectuosa,  la  probabilidad de obtener cara es de 0,586. Si hacemos  tandas  de  40   lanzamientos:  a)  ¿Cómo  se  distribuye  la  proporción  de  caras  en  esas  tandas?   b)  ¿Cuál  es  la   probabilidad   de  que  la  proporción  de  caras  en  una  tanda  sea  mayor de 0,6?    

   

Intervalo de confianza para la media de una población De  una  población  de  media  y  desviación  típica  se  pueden  tomar  muestras  de  elementos.  Cada  una  de  estas  muestras  tiene  a  su  vez  una  media.  Se puede  demostrar  que  la  media  de  todas las medias muestrales coincide con la media poblacional:   Pero  además,  si  el  tamaño  de  las  muestras  es  lo  suficientemente  grande,  la  distribución  de  medias  muestrales  es,  prácticamente, una distribución normal (o gaussiana) con media μ y una  desviación típica dada por la siguiente expresión:      Esto se representa como sigue:  Si estandarizamos, se sigue que:   En  una  distribución  Z  ~  N(0,  1)  puede calcularse  fácilmente  un  intervalo  dentro  del  cual  caigan  un  determinado  porcentaje  de  las  observaciones, esto es, es sencillo hallar z1 y z2tales que P[z1  ≤  z  ≤  z2]  =  1  ­  α, donde  (1  ­  α)∙100  es el porcentaje deseado (véase el uso de las tablas en una  distribución normal).  Se desea obtener una expresión tal que   En  esta  distribución  normal  de  medias  se  puede  calcular  el  intervalo  de  confianza  donde  se   encontrará  la  media  poblacional  si  sólo  se  conoce  una  media muestral  (  ),  con  una  confianza  determinada. Habitualmente  se  manejan  valores  de  confianza  del  95 y  del 99 por ciento. A este  valor se le llamará   (debido a que   es el error que se cometerá, un término opuesto).  Para  ello  se  necesita  calcular  el  punto  —o,  mejor  dicho,  su   versión  estandarizada  o  valor  crítico—  junto  con  su "opuesto  en  la  distribución"  .  Estos  puntos  delimitan la  probabilidad para  el intervalo, como se muestra en la siguiente imagen:                

Dicho punto es el número tal que:  Y en la versión estandarizada se cumple que:  Así:  Haciendo operaciones es posible despejar   para obtener el intervalo:  De lo cual se obtendrá el intervalo de confianza:  Obsérvese   que  el  intervalo  de  confianza  viene  dado  por  la  media  muestral  ±  el  producto  del  valor crítico   por el error estándar  .  Si no se conoce   y n es grande (habitualmente se toma n ≥ 30):  , donde s es la desviación típica de una muestra.  Aproximaciones  para  el  valor  para  los  niveles  de  confianza  estándar  son  1,96  para  y  2,576   para .     Partes de los intervalos de confianza     A)   Poblaciones normales (o tamaños muestrales > 30) :  Donde  Z  a  /  2  es  el  valor  crítico  de  la normal  tipificada  que  deja  a  su  derecha  un  área  de  a / 2,  siendo a el nivel de significación del intervalo y s es la cuasi­desviación típica muestral.           B)   Poblaciones no normales (tamaños muestrales £ 30 ):  donde  ta  /  2,n­  1,  es el  valor  de  la  t­Student  que  deja  a  su derecha  un  área  de  a  /  2  ,  para  n­1  grados de libertad.            

CASOS:    **Intervalo de confianza para la media μ de una población normal con desviación  típica conocida σ  Si  partimos  de   una  población  que  sigue  una  distribución  Z  ~  N(0,1)  bastará  con encontrar  el  punto crítico zα/2  para  tener un intervalo que contenga la media poblacional con probabilidad c.  p(­zα/2