Inferencia Estadistica

CAPITULO VI INFERENCIA ESTADISTICA Es la parte de la estadística cuyo objetivo es estimar parámetros poblacionales en b

Views 164 Downloads 4 File size 358KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

CAPITULO VI INFERENCIA ESTADISTICA

Es la parte de la estadística cuyo objetivo es estimar parámetros poblacionales en base a nuestras aleatorias tomadas de la población de la cual se desea inferir. Existen 2 maneras de estimar parámetros: 1) Estimación Puntual.- Este tipo de estimación se refiere al hecho de aproximar los estimadores muestrales obtenidos a partir de una muestra “n” a los parámetros poblacionales. Es decir:

ux

n

 x2

x u s 2   x2

2) Estimación por intervalos.- Este tipo de estimación es la más adecuada puesto que ella cuantifica el error que cometemos al estimar un parámetro. La idea es tomar rangos en la cual nosotros tengamos cierto grado de confianza que el valor del parámetro poblacional se encuentre en esos valores. Es decir:

1 

P ( a  u  b) 

gra do de confianza

Interpretación de un Intervalo de Confianza.Si seleccionamos repetidamente muestras aleatorias de tamaño “n”, confiamos o esperamos que el 100(1 - )% de las muestras, darán intervalos de confianza que incluyan al verdadero parámetro de la población. INTERVALO D CONFIANZA PARA LA MEDIA POBLACIONAL “u”.Se presenta 2 casos: I ) Caso I: Intervalo de confianza para la “u” , n  30   X2 = conocida Si la X2 no es conocida asumimos que: SX2  X2 Partimos de:

P z  z 0   1   P z 0  z  z 0   1  

pero : z 

x u

X

  x u P  z 0   z 0   1   X       x u  P  z0   z0   1    X   n      P  x  z 0 X  u   x  z 0 X n n 

    P x  z 0 X  u  x  z 0 X n n 

    P  z 0 X  x  u  z 0 X   1   n n     1   

 int ervalo    1     

de confianza para la " u"

II) Caso II.- Intervalo de Confianza para la media “u” Cuando n < 30 y X2 = desconocida Partimos de:

P t  t 0   1   P t 0  t  t 0   1  

pero : t 

      x u P  t 0   t0   1  SX         n   S S   P  t 0 X  x  u  t 0 X   1   n n 

x u  S     n

S X2   X2

S S   P  x  t 0 X  u   x  t 0 X   1    * (1) n n  Intervalo  SX SX     1     P x  t 0  u  x  t0 confianza n n  la  media En la práctica se trabaja con:

Grado de confianza (1 -  0.95

N 20

T T1 = 2.093

0.90

10

T2 = 1.833

de para " u"

n  10

n  20  2

 0.005

 2

1    0.95

 t0

 0.005

1    0.90

 t0

t0  2.093

INTERVALO DE CONFIANZA PARA LA VARIANZA X2: Partimos de: P(X12 < X2 < X22) = 1 -  Se sabe que:

X2  Luego:

(n  1) S X2

 X2

 2 (n  1) S X2 2     1 P X 1    X  2 2 2   X   2 2  X 1   X 1   2 2 P  2   1 2 2   (n  1) S X  X (n  1) S X      (n  1) S X2   (n  1) S X2 2 P X   1 2 X 12   X 2 2  

 2  2

x 21 2

x 2 2

t0  1.833

Intervalos de Confianza: Para la media (ux) y varianza (X2) Ejemplo 1: Debido al racionamiento de agua, SEDAPAL decide estimar el consumo diario promedio por vivienda de un sector, para esto selecciona al azar n = 100 viviendas y se observa el registro del medidor de agua durante el día, obteniéndose de la muestra los siguientes parámetros: x = 117.5lts.

y una SX = 16.8lts.

determine un rango de confianza del 95% para el consumo promedio poblacional del agua en todo el sector (uX) Solución: N

n = 100

ux

x = 117.5lts



SX = 16.8lts

2 x

como n = 100  SX =  X

Luego:

    P x  z0 X  u X  x  z0 X   1   n n  Datos: x = 117.5lts

n = 100

X = 16.8lts.

1 -  = 0.95

Reemplazando:

z *16.8 z *16.8   P 117.5  0  u X  117.5lts  0  0.95 100 100  

Hallando Z0 tenemos:

Z  2

 0.025

X  2

 0.025

1

 z0

P( au x b)  0.95

1

z0  1.96

a

ux

b

16.8 16.8    P 117.5  1.96  u X  117.5  1.96 10 10    P114.20  u X  120.79 Interpretación: Se tiene un 95% de confianza que al consumo promedio poblacional de agua en el sector está entre 114.20lts y 120.79lts.

Ejemplo 2: Un inspector está analizando la cantidad de llenando de unas botellas de gaseosas que deben contener 500 cc, se toma una muestra aleatoria que le dio los siguientes datos: 501.8; 498.7; 496.7; 503.1; 495.7; 502.3; 497.3; 502.6; 499.3; 503.8 a) Construya e interprete un rango de confianza del 95% para la media poblacional. Solución:

Como n < 30

S S    P x  t 0  u  x  t0   1 n n  Donde:

 x  x    i   500.13 10   n  10

 x  x  n

1    0.95

2

S2 

i

2 i

n 1

 8.67



S X  2.944

Hallando t0 tenemos:

t( n1) g.l  2.262

Z  2

 0.025

X  2

1

 t0

 0.025

P( a u x b )  1  

1    0.95

t0  1.96

a

ux

b

2.944 2.944   P 500.13  2.262  u X  500.13  2.262  0.95 10 10   P498.02  u X  502.24  0.95

Interpretación: Se tiene un 95% de confianza que el promedio de llamado de las botellas de gaseosa se encuentra entre 498.0200 y 502.2400 como valor mínimo y máximo.

Ejemplo 3: b) Construya e interprete rango de confianza para la varianza del 98% Solución:

Datos:

  (n  1) S X2 (n  1) S X2  2 P     1 X  X 2 X 21   2 2   1 -  = 0.98   = 0.02

n = 10 SX2 = 8.67

Hallando en la tabla Fi – Cuadrado X2(n – 1)g.l.

 2

 2

x 21 2  2.088

 0.01  0.01

x 2 2  21.66

Reemplazando:

9 * 8.67   9 * 8.67 P   X2   0.98 2.088   21.666 P3.601   X2  37.37  0.98 Interpretación: Se tiene un 98% de confianza que la varianza poblacional se encuentre entre 3.601 y 37.37 cc2.

CAPITULO VII PRUEBA DE HIPÓTESIS Hipótesis.- Una hipótesis en estadística es un supuesto acerca de los parámetros de la población cuya aceptación o rechazo dependerá de al información que nos proporcione la muestra. En estadística se trabaja con dos tipos de hipótesis: a) Hipótesis Nula b) Hipótesis Alternante

a) Hipótesis Nula: - Se denomina así en el sentido que nulifica las posibles diferencias, es decir anula el efecto de un tratamiento y corresponde a la ausencia de efectos. -

La hipótesis nula debe concordar con la teoría del problema o con el conocimiento existente.

-

La Ho está formulada con el propósito expreso a ser rechazada o ser desacreditada.

b) Hipótesis Alternante: - Es la que suponemos verdadera y deseamos probar. -

Es la hipótesis de trabajo.

-

La Ho se expresa en forma no específica (>,θo  será

La zona de rechazo está a la derecha y el valor crítico “K”

positivo.

Cola hacia la derecha  parámetro  0  valor

 (Zona de rechazo Ho)

Zona de aceptación de No

K

Caso II: Si Ha:  < 0  La zona de rechazo esta a la izquierda y valor crítico “k” será negativo

 (Zona de rechazo No)

Zona de aceptación de Ho

K

Caso III: Si Ha:   0  La zona de rechazo estará en los extremos y existirá 2 valores críticos k1 y k2 uno negativo y otro positivo. Prueba de 2 colas

Zona de aceptación de Ho 

 2

2

(Zona de rechazo Ho)

1

K1

K2

Nivel de Significación (): Es el subconjunto del espacio muestral que nos conduce ha realizar la H0 cuando esta es verdadera. Es decir es la probabilidad de cometer el Error Tipo I  = P(rechazar la H0 / H0 no es verdadera) -

El comete el error tipo I se debe a que muchas veces la muestra no es lo suficiente representativa de la población.

-

Por lo general “” toma 2 valores, y

-

Si rechazamos la hipótesis nula (H0) con  0.01 se dice que la prueba es altamente significativa(se arriesga 1 de cada 100 casos)

-

Si rechazamos la hipótesis nula (H0) con  = 0.05 se dice que la prueba es significativa(se arriesga 5 de cada 100 casos)

Pasos a seguir para una muestra de hipótesis: 1) Plantear la Ho  Ha 2) Establecer “” 3) Suposiciones (Muestras extraídas al azar, Población normal) 4) Establecer la prueba estadística 5) Establecer el criterio de decisión 6) Realizar los cálculos 7) Conclusiones Prueba de Hipótesis para la Media Poblacional (u) -

Para la prueba de hipótesis de la media (u) ocurre tres casos:

Dado:

la `

Hipótesis (H O ) H O : u  uO

      H a : u  u0 Nula      H a : u  u0      H a : u  uo

se

pre sen ta

(Zona de rechazo )    

U0 (Zona de rechazo )    

U0

U0     (Zona de rechazo )

Estadística de Prueba: Caso I: Si n  30  X2 es conocida

z

x  u0       n

Si X2 no es conocida se asume que X2  SX2 Caso II: Sí n< 30  X2 desconocida

Ejemplo: Una maquina llena de botellas de gaseosas, si se dispone que el volumen medio de gaseosas de cada botella es de 32 onzas con x = 0.06 de onza. En una comprobación sistemática para ver que la maquina funciona adecuadamente, se tomaron aleatoriamente 36 botellas y se advierte que contienen una media de 32.1 onzas ¿la maquina funciona adecuadamente? Nivel de significación = 0.05 Solución: 1.- Ho : u = 32 Ha : u  32(¿la maquina funciona adecuadamente?) 2.- = 0.05 3.- muestra aleatoria volumen medio de gasolina  N(32, (0.06)2 4.- como n  30

z

x-u

x

n 5.- criterio: si –1.96 < Zo < 1.96, entonces se acepta la Ho, caso contrario se rechaza.

Zona de aceptación de Ho   2

 0.025 1-

zt  1.96

6.-

Zc 

x-u

x

n



 2

 0.025

zt  1.96

32.1  32 0.1   10 0.06 0.06 6 36

7.- conclusión: como Zc = 10, entonces se rechaza la Ho, por lo tanto la maquina no trabaja adecuadamente, necesita una revisión.

Ejemplo 2: con el fin de probar un aditivo para gasolina se cogió un grupo de automóviles sobre una pista en condiciones rigurosamente supervisadas. El número de kilómetros recorridos con 4lts. De gasolina fue = 15, 12, 13, 16, 17, 11, 14, 15, 13, 14. En varias pruebas anteriores ....... de aditivo se obtuvo un rendimiento de 12.62kmts/4lts. Usando el error tipo I = 0.05. ¿Puede llegarse a la conclusión que el aditivo mejoro la capacidad de kilometraje de la gasolina? Solución: 1.- Ho : u = 32 Ha : u  32(¿la maquina funciona adecuadamente?) 2.- = 0.05 3.- muestra aleatoria (población normal) 4.-

t

x-u  (n  1)g.l. s n

5.-

Zona de aceptación de Ho

1

n  10 g.l  n  1  9   0.05 Zona de rechazo Ho

Tt  1.833

6.-

x-u s n 14  12.62 tc   2.39 1.825 10 t

x  14 s  2

x i  x 2 n 1

 3.33

s  1.825

7.- conclusión: Como tc = 2.39 y mayor a tabular entonces se rechaza la Ho por lo tanto el aditivo si mejora la capacidad de kilometraje.

Prueba de Hipótesis acerca de la varianza de una población Ejemplo 3: una maquina que produce tuercas es detenida periódicamente de modo que el diámetro de las tuercas producidas pueden ser chequeadas. En este caso no es el diámetro medio lo que es importante sino la variabilidad de dichos diámetros. Suponga que una muestra de 21 tuercas es obtenida y determina que la varianza muestral del diámetro es s 2 = 9.4mm2. Indica esta muestra que la maquina funciona defectuosamente, es decir la x2 de tuercas es mayor a 8mm(= 0.01) Solución: 1. - Ho    8mm 2

Ha   2  8mm 2. - (= 0.01) 3. - Distribución normal de los diámetros de tuercas. Muestra aleatoria 4. -

(n - 1)s2



2



x2 (n - 1)g.l

5. -

n  21 Zona de aceptación de Ho

  0.01 (Zona de rechazo de Ho) 2 xtab  37.566

6. -

x 2cal 

(20)(9.4)  23.5 8

7. - conclusión: como x2cal es igual a 23.5 entonces se acepta la Ho, por lo tanto muestra indica que la maquina no funciona defectuosamente.

la

Prueba de Hipótesis de 2 varianzas poblacionales.Ejemplo 4: dos maquinas arrojando los siguientes resultados: A n1 = 13 S12 = 0.01

B n2 = 16 S22 = 0.008

¿Están trabajando ambas maquinas con la misma variabilidad? Use (= 0.1) Solución:

Ho :  12   22

1. -

Ha :  12   22 2. - (= 0.1) 3. - Suposiciones: - las muestras son aleatorias - proviene de una distribución normal 4. -

s12 22 s22 12



F(n -1)(n -1) 1

2

5. -

Hallando : Zona de aceptación de Ho   2

 0.05

 2

1

F1  F(12,15) 

 0.05

1 F(15,12) 0.95

 F1  0.382 F2  F(12,15) 0.95  2.48

F1  0.382 F2  2.48

Criterio: 6. – ya que

Si 0.382 < Fc < 2.48 se acepta la Ho, caso contrario se rechaza.

 12   22 Fcal 

(0.01) 22 (0.008) 12

 1.25

7. - Como Fcal = 1.25 se acepta la Ho, es decir ambas maquinas trabajan con la misma variabilidad.

Distribuciones Continuas 1. HALLAR: a) P(z > 0.1) + P(z0.1) + P(z1.52) + P(z 0.860) = 0.3 – 0.2 = 0.1 P(t>t1)=0.1 t1 = 1.325 b) P(t>1.325/ t < 2.086) Solución: lo resolveremos de la siguiente manera

t >1.325  -2.086 < t < 2.086  1.325 < t < 2.086 entonces tenemos:

 t  1.325  Pt  1.325  2.15  t  2.15 P1.325  t  2.15  P     t  2 . 15 P  2 . 15  t  2 . 15 P(2.05  t  2.15)   calculando vamos a obtener: P(1.3252.15)=0.10 – 0.023=0.077 P(-2.15