Intervalo de Confianza Fiai

UNSM Ing. de Sistemas e Informática Inferencia Estadística ESTIMACIÓN POR INTERVALOS Un intervalo de confianza para u

Views 386 Downloads 11 File size 190KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística

ESTIMACIÓN POR INTERVALOS Un intervalo de confianza para un parámetro  es un intervalo construido alrededor del estimador del parámetro de tal manera que podemos esperar que el verdadero valor del parámetro quede incluido en dicho intervalo. La estimación de parámetros por intervalos, permite construir un intervalo que contendrá el parámetro a estimar con un nivel de confianza fijada a priori por el experimentador.

P ( A    B )  1  1  

: Nivel de confianza Es la probabilidad (expresada en porcentaje) que representa la seguridad de que el intervalo contenga al verdadero valor del parámetro.



: Nivel de significancia Es la probabilidad de que el intervalo no contenga al verdadero parámetro.

Ejemplo:

P ( A    B )  0,95 Es un intervalo del 95% de confianza para el parámetro 

Significa que si se extraen repetidamente muestras de la población y se calculan los intervalos de esta manera, entonces el 95% de estos intervalos contendrán al parámetro desconocido.

Nota: Nivel de confianza

Nivel de significancia



Conclusión

0.90 0.95 0.99

0.10 0.05 0.01

Poco significativa. Significativa. Altamente significativa.

1  

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL Li    L s De una población desconocemos la media  y deseamos estimarla mediante un intervalo con un nivel de confianza apropiada a partir de la media x obtenida en una muestra de tamaño n. 1.

Si la varianza poblacional σ2 es conocida Para una población infinita:  x  z / 2 n

 x 

z / 2

Para una población finita:  Nn  N1 n

n  0,05 N

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística 2.-



Si la varianza poblacional σ2 es desconocida 

Para una población infinita: S x  t0 n

t0

donde:

x 

 t1   / 2 , n 1

S n

t0

Para una población finita: Nn  N1

n  0,05 N

Ejemplo 1: Los siguientes datos corresponden a las calificaciones obtenidas por un grupo de estudiantes en un curso de matemática. Considerando que durante los últimos años se ha venido obteniendo una varianza de 18. Llegue a una conclusión altamente significativa acerca del verdadero promedio. 71 75 65 69 73 68 74 70

Solución: 1    0,99

n1  8

12  18 conocida

x1  70,63

1  4,24

2 S1  11,13

x  z  /2

 n

 z

  0,01  / 2  0,005 z 0,005

70,63  2,58



4,24 8



  2,58

66,77    74,49

Con una confianza del 99% podemos concluir que el verdadero promedio de las calificaciones se encuentra variando entre 67 y 75 aproximadamente.

Error de Estimación: Es la diferencia entre el promedio de la muestra x y el promedio real Es decir es la diferencia entre el estadígrafo y el parámetro: Ei  x  

 de la población.

Error máximo probable: x  Z  /2

 x  Z /2   n    ERROR

 n

  x  Z /2 n     



ERROR

E  Z /2

 n

Para muestras pequeñas el Error máximo probable es:

E  t  /2

S n

Ejemplo 2: Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística Para estimar el tiempo promedio que lleva ensamblar cierto componente de una computadora, el supervisor de una empresa electrónica tomó el tiempo que 40 técnicos demoraban en ejecutar esta tarea, obteniendo una media de 12,73 minutos y una desviación estándar de 2,06 minutos. a)

¿Qué podemos decir, con una confianza del 99% acerca del error máximo si

se utiliza como estimación puntual del tiempo medio que se requiere para realizar la tarea? x  12,73

n = 40

 Z

1    0,99

x  12,73

 / 2  0,005

S = 2,06 e  2,58

b)

Z  /2



2,06 40

e  0,84

Hallar un intervalo de confianza del 98% para el tiempo medio real que lleva ensamblar el componente de la computadora. x  t / 2, n 1

1    0,98  / 2  0,01

12,73  2,438

t0.01, 39  2,438

c)

 2,58

S n

2,06 40

11,9359    13,5241 Hallar un intervalo de confianza del 95% para el tiempo medio real que lleva ensamblar el componente de la computadora a diez técnicos. x  12,73

n = 40

S = 2,06 x 

1    0,95  / 2  0,025

t / 2 , n  1

12,73  2,030

t0 , 025 , 3 9  2,030

S n

2,06 40

12,07    13,39

INTERVALO DE CONFIANZA PARA LA VARIANZA POBLACIONAL Li  2  L s

Sea x1 , x 2 , .... , x n una muestra aleatoria extraída de una población normal con media  y varianza 2 desconocidas, entonces: ( n  1 ) S2 12  /2 , n1



2 

( n  1 ) S2 2  / 2 , n 1

Ejemplo 3: Durante varios años se ha aplicado una prueba de matemática a todos los alumnos del primer ciclo de la UNSM-T, si 64 alumnos seleccionados al azar demoraron para resolver la prueba en promedio 28,5 minutos con una varianza de 9,3 minutos2. Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística a)

Construir un intervalo de confianza del 99% para la desviación estándar verdadera del tiempo que demoran los estudiantes en resolver el examen. n = 64

1    0,99

x  28,5

 /2  0,005



1   /2  0,995

S2 = 9,3 63  9,3 20,995 , 63

 2 

63  9,3 20,005 , 63

63  9,3 63  9,3  2  95,6 37,8 6,13  2

 15,5

2,48    3,94

Con una confianza del 99% se puede afirmar que la desviación estándar poblacional del tiempo que demoran los estudiantes en resolver el examen se encuentra variando entre 2,48 y 3,94. b)

Con una confianza del 90%, ¿Cuál sería el valor máximo para la varianza poblacional? n = 64

1    0,90

x  28,5

 / 2  0,05



1   / 2  0,95

S2 = 9,3 63  9,3 2 0,95 , 63

 2 

63  9,3 2 0,05

, 63

63  9,3 63  9,3  2  82,5 45,7 7,10  2  12,82

Con una confianza del 90% se puede afirmar que el valor máximo para la varianza poblacional es de 12,82.

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL

Li  P  L s Dado un nivel de confianza 1-, para construir un intervalo para la proporción se tendrán en cuenta los siguientes casos:

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística Si la población es infinita:

p  Z / 2

Si la población es finita:

pq n

p  Z / 2

pq n

Nn N1

Ejemplo 4: En un estudio de 300 accidentes de automóvil en cierta ciudad, 60 tuvieron consecuencias fatales. Con base en esta muestra, construir un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que tienen consecuencias fatales en dicha ciudad.

p 

n = 300

60  0. 2 300

N: desconocido  población infinita

1   0.90  / 2  0.05 Z 0,05   1.65

p  Z  / 2 p

0.2  1.65

0.2  0.8 300

0.162  P  0.238

Con una confianza del 90% se afirma que la verdadera proporción de accidentes automovilísticos que tienen consecuencias fatales, está variando entre 0.162 y 0.238. Ejemplo 5: Un candidato político está planeando su estrategia de campaña y quiere determinar qué tan conocido es. En una muestra aleatoria de 3000 de los 25000 votantes la localidad, 1800 manifestaron reconocer el nombre del candidato. Construir un intervalo del 95% de confianza para la verdadera proporción de votantes en el país que están familiarizados con dicho candidato. N = 25000

n = 3000

p 

1800  0.6 3000

n 3000   0.12  0.05 N 25000 Se debe utilizar el factor de corrección para poblaciones finitas. 1   0.95  / 2  0.025 Z   1.96 0,025

p  Z  / 2 p

0.6  1.96

0.6  0.4 3000

25000  3000 24999

0.58  P  0.62

Con una confianza del 95% podemos afirmar que la verdadera proporción de votantes en el país que están familiarizados con dicho candidato, se encuentra variando entre 0.58 y 0.62.

INTERVALO DE CONFIANZA PARA LA RAZÓN DE DOS VARIANZAS POBLACIONALES

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística 12

Li 

2 2

 Ls

Generalmente en investigaciones comparativas de dos poblaciones independientes se estudian la homogeneidad o la heterogeneidad a través de un intervalo de confianza para la razón de dos varianzas poblacionales. Sean x1 , x 2 , ... , x n1 tamaños

y1 , y 2 , ... , y n2 dos muestras aleatorias independientes de

y

n1 y n2 , tomadas de poblaciones normales

2 N ( 1 , 1 )

y

N (  2 , 2 2 )

con varianzas 12 y 2 2 desconocidas.



El intervalo de confianza del (1-)100% para la razón de varianzas es:

S12

S12

S2 2



F1  /2 , v , v 1 2

12 22



S2 2

v1  n 1  1

g.l. del numerador

v2  n 2  1

g.l. del denominador

F / 2 , v , v 1 2



Si el 1 pertenece al intervalo, entonces las varianzas son iguales.



Cuando el 1 no pertenece al intervalo, las varianzas son diferentes.

Ejemplo 6: Dos marcas de máquinas A y B han sido diseñadas para producir cierto tipo de producto. Tienen igual precio. Un fabricante, al decidir cuál comprar, ha observado en operación durante una hora nueve máquinas diferentes de cada marca. El número de artículos producidos por cada máquina fue: Marca A Marca B

: :

35 27

36 28

49 53

44 52

43 48

37 29

38 34

42 47

39 45

Con 90% de confianza, ¿Cuál máquina le recomendaría comprar, teniendo en cuenta la variabilidad? ¿Por qué? Marca A

1    0,90

Marca B

nA  9

nB  9

 / 2  0,05

x A  40,33

x B  40,33

1   / 2  0,95

S2 A  20,5

S2 B  115

20,5 115 F0,95 , 8 , 8



0,05 

2A 2B

2A

2B



20,5 115 F0,05 , 8 8

 0,61



20,5 20,5 2 115   A  115 3,44 0,291 2B 1  IC



2A  2B

Con una confianza del 90%, le recomendaría compra la marca A, porque presenta menor variabilidad.

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS POBLACIONALES

Li  1  2  L s x1 , x 2 , ... , x n1

Sean

 N 

N 1 , 12 1.-

2

, 2 2

 

y

una muestra aleatoria extraída de una población normal

y1 , y 2 , ... , y n2

entonces:

Cuando las varianzas poblacionales

 x1  x 2  2.-

una muestra aleatoria extraída de una población



z  /2

Cuando las varianzas poblacionales

a)

 i2 son conocidas:

12 n1



2 2 n2

 i2 son desconocidas:

Suponiendo que las varianzas poblacionales son iguales: 12 

 x1

 x2  

t0

( n1  1 ) S12  ( n 2  1 ) S 2 2 n1  n 2  2

22

 1 1    n n 2   1

t0  t1 /2 , n1  n2 2 b)

Suponiendo que las varianzas poblacionales son diferentes: 12  2 2

 x1

 x2  

t0

t0  t1  / 2 , g

S2 S12  2 n1 n2

g 

2   S2  1  S2   n n2   1  2

2

2

 S2   S2   2  1 n  n   1   2 n1  1 n2  1

Ejemplo 7: Una de las funciones del departamento de Sistemas de Cómputo del periódico incluye el informe de las actividades del sistema de la computadora central. En general, durante un

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística día cualquiera el sistema debe procesar más de veinte tareas diferentes. Los requerimientos de estas tareas varían, desde trabajos muy pequeños que requieren una cantidad mínima de acceso a los dispositivos de almacenamiento de datos (cartuchos), hasta trabajos grandes y complejos que requieren acceso a más de 200 cartuchos diferentes de almacenamiento de datos. Se tienen los siguientes datos: 2

5

9

45

50

23

8

34

21

9

10

45

23

12

Durante otro día se lograron procesar 15 tareas, obteniéndose un promedio de 25,7 y una varianza de 90. Con una confianza del 99%, ¿Qué podríamos afirmar acerca de los promedios?

Solución: Día 1

n 2  15

n1  14 x1  21,14 S2  265,05 1 2 y σ2 σ1 2



x 2  25,7 S 2  90 2

 0,99  0,01  0,005  0,995

t 0,995 , 27  2,771

desconocidas.

2  σ2 σ1 2

Primero verificar si 265,05

90 F0,995 , 13 ,14           4,25

0,69 



σ2 1 σ2 2

1 I C



1α α α2 1α2

Día 2

2  σ2 σ1 2

ó

265,05

2 σ1 2 σ2



90 F0,005 , 13 ,14           0,212

 13,89 2  σ2 σ1 2



Segundo para la diferencia de medias

 21,14

 25,7   2,771

13 x 265,05  14  90  1 1     27 15   14

 18,15  μ1  μ2  9,03

0  IC  μ1  μ2

Con una confianza del 99% podríamos afirmar que los promedios son iguales porque el cero pertenece al intervalo.

Ejemplo 8: Un profesor de la facultad de Ingeniería Agroindustrial enseña en dos secciones el mismo curso de control de calidad. En cada sección procede de la misma forma, esto es, utiliza la misma metodología así como el mismo sistema de evaluación; sin embargo, en cada una utiliza un texto diferente. Al terminar el periodo el profesor extrae una muestra aleatoria de cada sección, y obtiene las siguientes notas: Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística Texto : 1 : 2 :

78 51

78 53

Notas 72 81 90 49

74 62

76 83

80 80

57

28

Conocedor de que Usted es un excelente alumno de Inferencia Estadística, le pide su consejo para decidirse por sólo uno de los textos. Ayúdele a tomar una decisión significativa.

Solución: Texto 1

1  α  0,95

Texto 2

n1  7

α  0,05 α 2  0,025

n2  9

x1  77

1  α 2  0,975

x 2  61,44

t 0,975 , 8  2.306

S2 S2  10,33 2  387,28 1 2 y σ2 σ1 desconocidas. 2



2  σ2 σ1 2

Primero verificar si 10,33 387,28

σ2  1 σ2 2

F0,975 , 6 , 8        4,65

0,006 

 

σ2 1 σ2 2



2  σ2 σ1 2

ó

10,33 387,28 F0,025 , 6 , 8        0,179 1 IC

 0,149



σ2  σ2 1 2 σ2  σ2 1 2

Para la diferencia de medias 77  61,44



 2.306

10,33 7

0.18  μ1  μ 2



387,28 9

 30.94

0  IC  μ1  μ 2

1   2 Con una confianza del 95% le recomendaría usar el texto 1 ya que con este texto se ha obtenido una mayor nota promedio y una menor varianza.

g 

 10,33 387,28     9  7 

 10,33     7  6  g  8

2

2

 387,28    9    8

2

 8.54

Ejemplo 9: Los resultados del control de calidad de dos procesos manufactureros son: Tipo 1 Tipo 2 10 20 25 30 33 20 27 35 40 37 41 43 46 46 50 50 54 56 48 50 51 52 54 57 60 63 64 56 57 65 73 86 67 67 73 83

41 57 65 95

¿Permiten estos resultados concluir que los procesos son igualmente efectivos? Usar un nivel de confianza del 95%

Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística Ejemplo 10: Una cadena de supermercados se ha propuesto elevar el consumo promedio semanal por cliente en sus automercados. Para experimentar el método se escogen dos automercados en los cuales las ventas por cliente en el pasado, eran prácticamente iguales, con una varianza de 225. En uno de ellos no se experimenta el método y en una muestra de 15 clientes las ventas medias fueron de $125 con una desviación estándar de 10. En el otro, donde se experimentó el método, en una muestra de 14 clientes las ventas medias fueron de $130 con una desviación estándar de 17. ¿Opina Usted que el método es eficiente? INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES POBLACIONALES

Li  P1  P2  L s Dado un nivel de confianza 1-, para construir un intervalo para la diferencia de proporciones se utilizará:

( p1  p 2 )  z  / 2

p1  q1 p  q2  2 n1 n2

Ejemplo 11: Se considera cierto cambio en un proceso de fabricación de ciertos artículos. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, ¿se puede afirmar que el procedimiento nuevo es mejor? Obtenga una conclusión al nivel significancia del 10%. Procedimiento existente

n1  1500 75 p1   0,05 1500

Procedimiento nuevo

n2  2000 80 p2   0,04 2000

( 0,05  0,04 )  1,65

1    0,90   0,10  / 2  0,05 Z0,05   1,65

0,05  0,95 0,04  0,96  1500 2000

 0,0002  P1  P2  0,0218 El procedimiento nuevo será mejor sólo si la proporción de defectuosos es menor. En este caso el cero pertenece al intervalo de confianza por lo tanto se puede afirmar que ambas proporciones son iguales. Por lo tanto con una confianza del 90% podemos afirmar que el nuevo procedimiento no es mejor. Ejemplo 12: En una encuesta se preguntó sobre los hábitos de lectura, utilizando una muestra aleatoria de 350 señoras que trabajan y otra muestra independiente de 325 que no lo hacen. En el primer caso 105 manifestaron que estaban suscritas a cierto tipo de revista. En el segundo, la respuesta fue de 130 que no estaban suscritas ni mostraban interés por ninguna revista, argumentando la falta de tiempo. Al nivel del 1%, ¿se podrá afirmar que las señoras que trabajan leen menos que las señoras que no trabajan? Aquilino M. García Bautista

1

UNSM

Ing. de Sistemas e Informática

Inferencia Estadística Al reemplazar los datos en la fórmula, se obtiene:

( 0,3  0,6 )  2,58

0,3  0,7 0,6  0,4  350 325



 0,39  P1  P2   0,21

Con una confianza del 99% se puede afirmar que las Sras. que trabajan leen menos que las Señoras que no trabajan.

Aquilino M. García Bautista

1