Memoria Estadistica Inferencial Unidad 1

2 UNIDAD 1: DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO Conceptos básicos: Estadística descriptiva: recopila, ordena

Views 147 Downloads 0 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

2

UNIDAD 1: DISTRIBUCIONES FUNDAMENTALES PARA EL MUESTREO Conceptos básicos:

Estadística descriptiva: recopila, ordena, agrupa, analiza y representa datos. Estadística Inferencial: infiere en muestras en base a N para la toma de decisiones. Parámetro: medida para describir cualquier característica con respecto a la población. Estadístico: medida para describir cualquier característica con respecto a la muestra. Parámetro  =media poblacional  =Desviación poblacional  2 =Varianza poblacional

Estadístico x =media muestral s =desviación muestral s 2 =varianza muestral

DIFERENCIAS ENTRE PROPORCIONES POBLACIONALES VS PROPORCIONES MUESTRALES x Formulas: P  N p

Pq n



x (Proporción muestral) n

Factor de continuidad

N  n de corrección N 1

P1q1 P2 q2  n1 n2

( P1  P) 2 

Cota de error de la proporción:

E   P 2

E  

2

Pq n

n

 Pq 2

E2

Problemas: 1. Estudios realizados demuestran que el uso de gasolina para autos compactos vendidos en estados unidos esta normalmente distribuidos con una ¿Qué porcentaje de autos compactos recorre 30 millas por galón o más? Z

xM

Z



30  25.5 1 4.5 0.5

68% 0.341 3

Z  1

0.341 3

P=?

0.5

M  25.5

Z 1

30

Z 1

Área de Z: A(Z )  A(1)  0.5  0.3413  0.158

3

2. Se toma como muestra aleatoria de n=36 de una distribución de con una M=75 y con una  =12. a) La distribución muestral de la media x será aproximadamente _80__ con una M=_75__ y  = __2___ b) Para hallar la probabilidad de que la media muestral x exceda de 80, anote el evento de interés__0.62%___

USO DE LA t DE STUDENT Con  2 conocida con  conocida

Z

n  30

x

 n

 (x  )



2

N

Con  2 desconocida con  desconocida

x t s x  n

n  30

s

 (x  ) n 1

2

n 1 =grados de libertad (gl,D,v, df)

DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN MUESTRAL Formulas:

Z

Z

x

x 



N n N 1

n

pP pq p  n

N n N 1

    np

  npq

 2  npq

4

Problemas: 1. Muestras aleatorias de tamaño n se seleccionaron en poblaciones binomiales con parámetros P poblacionales dados aquí. Encuentre la media y la desviación estándar de la distribución muestral p en cada caso para n=100 y P=0.3; n=400 y P=0.1

 ?

 ?

    np  100(0.3)  30

  (400)(0.1)  40

  npq  (100)(0.3)(0.7)  4.56

  (400)(0.1)(0.9)  6

DEFINICIÓN DE LA DISTRIBUCIÓN DE LA MEDIA MUESTRAL Supongamos que cada una de nuestras muestras consta de 10 ingenieros industriales de 25 años de edad que viven en una cuidad de 100 mil habitantes (una población infinita, de acuerdo con nuestro tratamiento). Al calcular la altura media y la desviación estándar de esa altura, para que cada uno de estos ingenieros, rápidamente observaran que la media y la desviación estándar de la muestra serian diferentes. Una distribución de probabilidad de todas las medias posibles de las muestras, es una distribución de las medias de las muestras. Los estadísticos la conocen como distribución de muestreo de la media. Sugerencia El conocimiento de la distribución de muestreo permite a los estadísticos planear muestras de tal forma que los resultados sean significativos. Como sabemos que resulta caro recabar y analizar muestras grandes, por eso nosotros como ingenieros siempre procuramos obtener las muestras más pequeñas que proporcionen un resultado confiable. Problemas: 1. La hall corporation fabrica grandes sistemas de computo y siempre se ocupado con la confiabilidad de sus unidades de procesamiento centros de sistemas 666. De hecho la experiencia pasada ha mostrado que el tiempo improductivo mensual de los CPU 666 promedio 41min. Con la desviación estándar de 8 min. El centro de cómputo de una gran universidad estatal mantiene una instalación formada por 6 CPU del sistema 666 James Kitchen, el director del centro siente que se proporciona un nivel satisfactorio de servicio a la comunidad universitaria si el tiempo improductivo

5

promedio de las 6 CPU es menor de 50 min. Al mes. ¿Dado cualquier mes cual es la probabilidad se sienta satisfecho con la red de servicio?

  41m Z

x



n

  8 min 

n6

p ( x  50 )

50  41  2.755  area  0.497  0.5  0.997  99 .7% 8 6

2. El costo de las prescripciones de patentes se fija para dar apoyo a investigaciones y n desarrollo de estos medicamentos, que se pueden tardar hasta 20 años. Sin embargo una mayoría de personas de cierto país dice que los costos de medicamento de patentes (66%), los costos de hospital (64%) y las visitas de médicos (55%) son irracionalmente altos. Suponga que se toma una muestra aleatoria de 1000 adultos. Se la p (proporción muestral) la proporción de adultos que dicen que los precios de medicinas con recetas son irracionalmente altos. a) ¿Cuál es la probabilidad de que p exceda de 68%?

p ( p  0.68 )

Datos:

n  1000 Z

p =660 (66%)

P=680

pP 660  680   1.335 pq (680)(320) n 1000

3. Utilizar las tablas de áreas bajo la curva normal entre los valores dados: a) Z  0.3 y Z  1.56 =0.1179 =0.4406----------0.4406-0.1179=0.3227= 32.27% b) Z  1.3 y Z  1.74 =0.4032 =0.4591-----------0.4032+0.4591=0.8623=86.23% c)

Encuentre la probabilidad de que PZ  0.75  : Para z=0.75=> área=0.2734-------0.2734+0.5=0.7734=77.34%

6

4. Se diseño un nuevo sistema para el control de inventario de un pequeño fabricante, con el propósito de reducir el mismo para un motor eléctrico en particular, a menos de 3 000 motores por día. Se llevo a cabo un muestreo de inventario en reserva al final de cada uno de 8 días, seleccionados aleatoriamente; los resultados son los que se muestran en la siguiente tabla. Numero de motores 2905

2895

2725

3005

2835

2835

3065

2605

Utilizando la distribución de muestreo respectivo señale o indique mediante una grafica si hay evidencia que señale el promedio del numero de motores en el inventario es menor que 3 000 utilizando un coeficiente de confianza de 95% y un nivel de significancia de 5% Datos:

n 8

 0.05

  0.025 2

gl  n  1  7

x  2858 .75  2859  s  146 .76

Condición: p( x  3000 )

t

  3000

x   2859  3000   2.7172 s 146 .76 n 8

Aumento la confianza y disminuyo la significancia, si hay suficiente evidencia a la pregunta.

 0.05

t  1.9 t  2.7172

7

5. Los costos variables, principalmente de la mano de obra, hacen que los precios de la construcción varíen de una con respecto a otra. Un constructor necesita tener una ganancia media arriba de 8500 DLL para alcanzar una ganancia mensual establecida como meta. Las ganancias por cada una de las 5 construcciones más recientes del constructor, son de 8760 DLL, 6370 DLL, 9620 DLL, 8200DLL y 10350DLL, respectivamente. ¿Proporcionan los datos evidencia que indique que el constructor estaba trabajando al nivel de ganancia deseado con un nivel de significancia de   0.05 ? Datos:

n5

  8500

 0.05

x  8660  s  1520 .148

Condición: p( x  8500 )

t

gl  n  1  5  1  4

x   8660  8500   0.2353 s 1520 .148 n 5

0.95 El nivel de significancia t  2.13

Se encuentra entre 40% y 45% t  0.2353

DISTRIBUCIÓN DE MUESTREO DE LA DIFERENCIA DE MEDIAS: Z

x1  x 2

1

2

n1





2 2



n2

x  x  2

1

2

S1 S2  2 n1 n2

Para muestras pequeñas: t

x1  x2

2 n1



2 n2



x1  x2 x1  x2  1 1 1 1    n1 n2 n1 n2

8

 = Estimador ponderativo de la desviación n



(n1  1) s  (n2  1) s n1  n2  2 2 1

2 2



1 

i 1

n1  1

i 1

i 1

n1  n2  2

n

n

( xi  x1 ) 2

n

( xi  x1 ) 2  ( xi  x 2 ) 2

2 

( xi  x 2 ) 2

i 1

n2  1

Problemas: 1. Se seleccionaron dos muestras aleatorias independientes de las poblaciones: n1  80 n2  80 Los parámetros de las poblaciones y las medias muestrales así como las variables de

 2 muestrales se indican en la tabla: Parámetros y estadísticos Media poblacional Varianza poblacional Tamaño de la muestra Media muestral Varianza muestral

Población 1 1 1 80 11.6 27.9

2 2 2 80 9.7 38.4

Observe los datos y por intuición diga si los datos proporcionan Suficiente evidencia para que M 1  M 2 y realice la prueba utilizando un nivel de significación de 0.10 y sacar conclusiones: Condición: 1   2

Z

x  x  2

1

2

S1 S 22  n1 n2



11 .6  9.7  27 .9 38 .4  80 80

 2.087

0.90

z  1.29 z  2.08 Conclusión: si existe suficiente evidencia de que si hay un incremento de la madia poblacional 1 con respecto a la 2. Con nivel de significancia de 0.10

9

DISTRIBUCIÓN DE MUESTREO CON RESPECTO A 2 PROPORCIONES POBLACIONALES p1  p 2

Z

p1 

p1 q1 p2 q2  n1 n2

x1 n1

p2 

x2 n2



P

x1  x2 n1  n2

Z

p1  p 2   1 1 p q    n1 n2 

Problemas: 1. El administrador de un hospital conjetura que el porcentaje de cuentas hospitalarias no pagadas, aumento durante el año anterior; los registros del hospital muestran que las cuentas de 48 de 1284 personas admitidas en el mes de abril no habían liquidado después de 90 días; este número es similar a las 34 cuentas de 1002 pacientes admitidas durante el mismo mes del año anterior ¿con estos datos hay suficiente evidencia que indique un incremento en el porcentaje de cuentas liquidadas después de más de 90 días? Utilice nivel de significancia de 0.10 Datos: n1  1284

n2  1002

x1  48

x2  48

p1  

P

x1 48   0.037 n1 1284

p2 

x2 34   0.034 n2 1002



q  1  p  0.965

x1  x2 48  34   0.035 n1  n2 1284  1002

0.90 Z

Z

0.037  0.034 1   1 (0.035)(0.965)    1284 1002 

 0.387

0.037  0.034

Z   1.29

 0.385

Z   0.385

(0.037)(0.965) (0.034)(0.966)  1284 1002

La significancia aumento, por lo tanto los datos no son suficientes para indicar que la proporción de cuentas excede al % correspondiente al año anterior.

10

2. Un fabricante modifico una línea de producción para reducir el promedio de la fracción de defectuosos. Para determinar si la modificación fue efectiva, el fabricante saco una muerta aleatoria de 400 artículos antes de la modificación de la línea de producción, y otra muestra aleatoria de 400 artículos después de tal cambio. Los porcentajes de defectuosos en las muestras eran: antes 5.25%, después 3.5%, lleve a cabo la prueba y saque sus conclusiones, si la modificación no pudiera incrementar la fracción de defectuosos, utilice un nivel de significancia de 0.05: Datos: n1  400

n2  400

x1  21

x2  14

p1  0.0525

p2  0.035



P

Z

0.90

Z   1.65

x1  x2 21  14   0.04375  q  0.95625 n1  n2 400  400

Z   1.2

0.0525  0.035  1.2 (0.0525 )( 0.9475 ) (0.035 )( 0.965 )  400 400

Nuestra significancia aumentó.

DISTRIBUCIÓN DE MUESTREO PARA LA PROPORCIÓN POBLACIONAL: Parte de Z 

x



n

Z

p p pq n

Problemas:

1. Aproximadamente uno de cada 10 favorece el refresco de cola de marca A. Después de una campaña de promoción en una región de ventas dadas, se seleccionaron aleatoriamente 200 bebedores de ese producto, de los consumidores en el área del mercado, y se les entrevisto para determinar la efectividad de la campaña. El resultado de la encuesta mostro que un total de 26 personas expresaron su preferencia a la bebida de la marca A.

11

¿Son los datos suficientes para indicar un aumento en la aceptación de la marca en la región? Nivel de significancia de 0.10: Datos: n1  200 p

26  0.13 200

p1 

1  0.10 10

Z

p p  pq n

Z   1.29

0.13  0.10 1.4121 (0.10)(0.10) 200

Z   1.4142

Conclusión: Significancia disminuyo: Hay suficiente evidencia.

DISTRIBUCIÓN DE MUESTRA PARA UNA VARIANZA PROPORCIONAL (CHI-CUADRADA) X 2 Problemas:

1. Un fabricante de cemento afirmo que el concreto preparado con su producto tendría una resistencia a la compresión relativamente estable y que, medida en KNC 2 se ubicaría en una amplitud de 40. Una muestra de 10 mediciones arrojo una media x  312 y una varianza  2  195 .

¿Son suficientes los datos para rechazar la afirmación del fabricante? Datos: n1  10  c2 

gl  n  1  9

 2  10

(10  1)(95)  17.55 100

Regla de decisión:

 16.91

 c2   2  17 .55  16 .91 si, aumento confiabilidad y disminuyo significancia.

12

PRUEBAS DE LA RAZÓN DE VARIANZA: DISTRIBUCIÓN DE MUESTREO (ENTRE DOS VARIANZAS) f DE FISHER:

Problemas:

1. La variabilidad en la cantidad de impurezas presentes en un lote de productos químicos, utilizado para un proceso particular, depende del tiempo que tarda el proceso. Un fabricante que emplea 2 líneas de producción 1 y 2 hizo un pequeño ajuste al proceso 2 con la esperanza de reducir la variabilidad, así como la cantidad media de impurezas en los productos químicos. Muestras de n1  25 y n2  25 , mediciones de 2 lotes produjeron los siguientes medias y varianzas. x1  3.2 y S12  1.04

x2  3.0 y S22  0.51

¿Presentan los datos evidencia suficiente para indicar que las variaciones de proceso son menores para el 2? Nivel de significación   0.10

Formulas: Fc 

s12 s 2  s 22 (numerador) s 22  s12 2 (razón de varianzas) (numerador) 1 s2

v1  gl  n1  1 v2  gl  n2  1 Fc 

gl  25 gl  24

1.70 (Teórica)

1.04  2.03 0.05

Se redujo el nivel de significancia f  1.70 fc  2.03

13

UNIDAD 2: INTERVALOS FORMULAS A UTILIZAR:

Intervalo de confianza para  cuando  y  2 conocido n  30 x  Z

 n

2

   x  Z



2

n

S S    x  Z n n 2

x  Z 2

Intervalo de confianza para  cuando  y  2 desconocidos S S    x  t n n 2

x  t 2

Intervalo de confianza para proporción poblacional

p  Z 2

pq  P  p  Z n 2

pq n

pq  P  p  t n 2

p  t 2

pq n

Diferencias de 1  2 (Muestras) poblacionales

x1  x 2  Z  2

x1  x 2  t 2

 12 n1



 22 n2

 1  2  x1  x 2  Z  2

 12 n1



 22 n2

S12 S22 S2 S2   1  2  x1  x 2  t 1  2 n1 n2 n1 n2 2

1 1 x1  x 2  t Sp     1  2  x1  x 2  t Sp  n1 n2  2 2 Estimador ponderativo------ Sp 

1 1     n1 n2 

Varianza diferente

Varianza igual

(n1  1) s12  (n2  1) s22 n1  n2  2

Diferencias entre proporciones poblacionales  p q p  q2    P1  P2  p1  p 2  t Sp p1  p 2  t Sp  1 1  2 n2   n1 2 2

n  1S 2 X 2h sup erior

n  1S 2 X 2h

2 

 

n  1S 2 X 21h inf erior

n  1S 2 X 21hi

Para la varianza

Para la desviación

 p1  q1 p 2  q 2     n2   n1

14

S12 1 12 S12   fV V S22 fV1V2  22 S22 1 2

Para la razón de varianza

Cota del Error máximo permisible



E  Z

n

2

Pq n

E  Z 2

Determinación del tamaño de la muestra

Z  2 2

n

2

E2

Determinación del tamaño de la muestra para proporciones

n

Z 2h Pq E2

INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL Problemas: 1. Encuentre un intervalo de confianza (1 ) 100% para una media poblacional en los siguientes casos: a) Cuando  0.01

n  38

Al 99% con área de 0.4950

x  34

s 2  12

s  3.42

z  2.58 2

x  Z 2

 n

34  (2.58 )

   x  Z 2

 n

3.46 3.46    34  (2.58 )  32 .55    35 .44 38 38

b)  0.10

n  65

Al 90% con área de 0.45

x  1049

s 2  51

z  1.65 2

1049  (1.65 )

7.1414 7.1414    1049  (1.65 )  1047 .49    1050 .5 61 61

15

c)  0.05

n  89

x  63 .3

s 2  2.48

z  1.96

Al 95% con área de 0.475

2

63 .3  (1.96 )

1.548 1.548    63 .3  (1.96 )  62 .97    63 .627 89 89

2. Una muestra aleatoria de n=6 observaciones de una población normal generó los siguientes datos: 3.7, 6.4, 8.1, 8.8, 4.9, 5.0

 0.10

n6

x  6.15

s 2  3.95

s  1.98

gl  n  1  6  1  5

a. Encontrar un intervalo de confianza al 90% para  S S    x  t n n 2

x  t 2

6.15  (2.02 )

1.98 1.98    6.15  (2.02 ) 6 6

4.5    7.78

0.90 t  2.02

t  2.02

2

2

3. Se encuentra que la concentración promedio de Zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6g/ml, encuentre los intervalos de confianza de 95% y 99% para la concentración media de zinc en el sitio. Su póngase que   0.3 a.   0.3 b. ¿Qué tan grande se requiere una muestra si queremos tener 95% de confianza de que nuestra estimación de  difiera al menos de 0.05 Datos:

x  Z 2

 2  0.09

x  2.6 g / ml

n  36

 n

   x  Z

  0.3



2

Al 95% con área de 0.475

n

0.95 z  1.96 2

z  1.96 2

0.3 0.3 2.6  (1.96 )    2.6  (1.96 )  2.50    2.69 36 36

z  1.96 2

16

Al 99% z  2.58 2

2.6  (2.58 )

Calcular: E  Z  2

2

 n

 1.96

z  2.58

z  2.58

Para determinar la muestra:

De: E  Z 

0.99

0.3 0.3    2.6  (2.58 )  2.47    2.73 36 36

2

2

0.098 0.3  0.098  0.5 2 36 pero al ser intervalo--

 Z   n 2 n despejar  E 

2

   1.96 (0.3)  2   36     0.098  

Para obtener muestra máxima al 95%: 2

n

Z S 2 2

E2



(1.96 ) 2 (0.3) 2  138 (0.5) 2

INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Problemas: 1. Los siguientes datos representan el número de artículos producidos por el método 1 y método 2. Método 1 103

Método 2 97

94

82

110

87

123

92

98

175

88

118

Calcule un intervalo de confianza del 90% para la diferencia entre los tiempos de proporción de duración promedio de los 2 métodos.

Metodo 1 n1  5

n2  7

x  98.4 S1  8.73

x  110.7 S 2  32.18

S

2 1

 76.21

Metodo 2

2

2

1

 103.5

gl  7  5  12 gl  12  2  10

17

x1  x 2  t  2

S12 S 22   1   2  x 1  x 2  t  n1 n2 2

S12 S 22  n1 n2

98 .4  110 .7   1.81 76 .21  1035 .55   1   2  98 .4  110 .7   1.81 76 .21  1035 .55  5

7

5

 12.3  23.13  1   2  12.3  23.12  35.42  1   2  10.8

2. Encontrar un intervalo de confianza para la diferencia para la diferencia entre dos medias poblaciones con un coeficiente de confianza de 0.95 x  12.25

S S

1 2 2

x  9 .5

 2.36

S S

 5 .5

x1  x 2  t 2

2 2 2

 1.29  1.66

S12 S22 S2 S2   1  2  x1  x 2  t 1  2 n1 n2 n1 n2 2

12 .25  9.5  2.45

5.58 1.66 5.58 1.66   1   2  12 .25  9.5  2.45  4 4 4 4

2.75  3.29  1   2  2.75  3.29 .54  1   2  6.04

0.5 4

6.04

9.5

12.25

7

18

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN POBLACIONAL Problemas: 1. En una muestra aleatoria de 500 familias que se tienen televisiones en una ciudad “x” se encuentran que 340 están suscritas en mega cable, se encuentra un intervalo de confianza de 99% para la proporción real en familias que están suscritas a mega cable.

n  500 x  300 x 340 p   0.68 n 500  99%

pZ

2

0.680.32 pq  p  0.68  2.58 n 500 0.626  p  0.7338

¿Qué tan grande se sugiere que sea una muestra si queremos tener un 99% de confianza de que muestra estimación “P” este entre 0.02?

Z 2  p q 2.58 2 0.68 0.32  2 n   3621 E2 0.02 2

E  Z

2

pq 2.58  0.68 0.32   0.05 n 500

E

0.05  0.2 2

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES Problemas: 1. Encontrar el intervalo de confianza para la diferencia entre dos proporciones poblacionales con un coeficiente de confianza de 0.95.

p  0.73

p  0.67

n  0.73 x  620.5

n x

1 1

1 1

 850  569.5

19

 p q p  q2    P1  P2  p1  p 2  t Sp p1  p 2  t Sp  1 1  2 n2   n1 2 2

.73  .67  1.96

 p1  q1 p 2  q 2     n2   n1

 0.73  0.27 0.67  0.33   0.73  0.27 0.67  0.33       P1  P2  .73  .67  1.96   850  850   850  850

0.016  p1  p2  0.104

0.16

0.104

0.67

0.73

INTERVALOS DE CONFIANZA PARA LA RAZÓN DE VARIANZAS Dados los siguientes datos obtener un intervalo de confianza para la razón de varianzas:

n n

1 2

 10 8

 90%

S S

2 1 2 2

 1.04

v  n  1  10  1  9 v  n 1  8 1  7 1

2

2

 0.51

0.05

S12 1  12 S12   fV V S 22 f V1V2  22 S 22 1 2 2  1.04  1   1  1.04     2  3.29  0.51  3.68   2  0.51 

0.95

 0.5541 6.70

20

INTERVALOS DE CONFIANZA PARA LA VARIANZA Dados los siguientes datos, obtener un intervalo de confianza para la varianza con la distribución de Chi 2

n  10

gl  9

 0.05

s 2  195

2 Al 95% X   19 2

n  1S X

2

2

h sup erior

0.99 2 

n  1S

2

X 21h inf erior

10  1195   2  10  1195  92.3   2  650 19

2.7

X 2 (1 2)  2.7

X 2 2  19

21

UNIDAD 3 PRUEBAS DE HIPOTESIS Ho: Hipotesis nula Ha: Hipotesis alternativa No existe No hay riesgo No hay verificación

0.95

I (B)

Región

Si hay evidencia

aceptada -1.96

Si hay significación

≠ (-)

+1.96

Región de rechazo

Si hay riesgo

(+)

Error de tipo I (∞) Rechazar (Ho) Error de tipo II (B) Aceptación (Ho) Prueba unilateral o de una cola pero superior

1ra

2do

0.95

0.95 I (∞)

0.5000

∞=0.05

0.4500

0.4500 1.65 (+)

0.5000

-1.65 I (-)

Prueba unilateral o de una cola pero superior Una hipótesis estadística Una hipótesis estadística: es una aseveración o conjetura con respecto a una o más poblaciones.

22

La verdad o falsedad de una hipótesis estadística nunca se sabe con absoluta incertidumbre a menos que examinemos toda la población. Esto, por supuesto, sería poco práctico en l mayoría de las situaciones. En su lugar, tomamos una muestra aleatoria de la población de interés y utilizamos los datos contenidos en esta muestra para proporcionar evidencia que apoye o no la hipótesis. La evidencia de la muestra que es inconsistente con la hipótesis que se establece conduce al rechazo de esta, mientras que la evidencia que la apoya conduce a su aceptación. Debe quedar claro que el diseño de un procedimiento que decisión se debe hacer con la idea en mente de la probabilidad de una conclusión errónea. Debemos acostumbrarnos a comprender “Que la aceptación de una hipótesis simplemente implica que los datos no dan suficiente evidencia para rechazarla”. Por otro lado, el rechazo implica que la evidencia muestra la recluta. Dicho de otra forma el rechazo significa que hay una pequeña probabilidad de obtener la información muestra observada cuando, la hipótesis es verdadera. Hipótesis Nula: Esta se refiere a cualquier hipótesis que deseamos probar y se denota (Ho). El rechazo de la hipótesis nula conduce a la aceptación de una hipótesis alternativa, que se denota (HA). Una hipótesis nula con respecto a un parámetro poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro mientras que la hipótesis alternativa permite la probabilidad de varios valores.

PRUEBA DE HIPOTESIS PARA LA MEDIA CUANDO  2 ES CONOCIDA. n ≥ 30= Ƶ  

Ho: M=Mo Analiza si es una prueba

Desconocidas 0 ó 02 t= estudent

Dos extremos

Un extremo

Ho: M=Mo

Ho: M≤Mo

HA: M≠Mo

HA: M>Mo , HA: MƵ∞/2

Ƶc>Ƶ∞/2

tc>t∞/2

tc>t∞/2

Ƶc t  -0.792

gl=20

3.-

∞=0.05

t∞=1.72

gl= n1+n2-2

Para sacar gl REAL

 S12 S 22    2  n1 n 2 

0.95 gl=

1.04

4.- t=

t=

1.72

 X 1  X 2  do

Sp=

1 1 Sp  n1 n 2

85  81  2 1 1 4.478  12 10

   S12  S 2 2  2  n2   n1    n1  1 n 2  1 

12  14  10  152 12  10

= 4.478

= 1.04

- Regla de decisión, región critica lado derecho Tc>t∞ 1.04>1.725

NO

Se acepto Ho

Como son las predicciones en el incremento del producto nacional bruto en estados unidos para el próximo año hechas por ejecutivos de corporaciones y analistas del mercado accionario. Se muestran las predicciones en porcentajes de 5 ejecutivos de corporaciones y de 5 analistas de mercados, seleccionados aleatoriamente. Ejecutivos de 3.4 Analista de 3.3 Ejecutivos

empresas 2.8 mercado 3.9

3.9

3.7

3.4

3.4

3.8

4.0

Analistas

27 n1=5

n2=5

X =3.44

X =3.68

S= 0.41

0.31

S2= 0.1681

∞0.10

S2=0.0961

3. Proporciona los datos evidencias suficiente que señale una diferencia en el incremento medio diagnostico para PNB, hechas por ejecutivos de corporaciones y analistas del mercado accionario realice la prueba con ∞=0.10 obtenga el valor de P aproximado para la prueba interprete. Encuentre un intervalo de confianza de 90% para la diferencia entre las predicciones del producto nacional Bruto (PNB) promedio de los ejecutivos de corporaciones y analistas de mercado accionario. n1=5

n1=5

X =3.44

X =3.44

S=0.41

S=0.41 S2= 0.1681

∞=0.10

gl= n1+n2-2 gl= 5+5-2 gl= 8 -

S2= 0.1681 t∞=1.40 Porque nada más es una cola

Ho: M1-M2 =Do

HA: HA M1-M2