introduccion a La Inferencia Estadistica

INTRODUCCION A LA INFERENCIA ESTADISTICA PARA ECONOMIA Y EMPRESA ______________________________________________________

Views 178 Downloads 4 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

INTRODUCCION A LA INFERENCIA ESTADISTICA PARA ECONOMIA Y EMPRESA

______________________________________________________________________

José Ramón Cancelo

INTRODUCCION A LA INFERENCIA ESTADISTICA PARA ECONOMIA Y EMPRESA

© 2013 - José Ramón Cancelo de la Torre Reservados todos los derechos. Prohibida la reproducción total o parcial de la obra por cualquier medio, incluso para uso privado, sin la autorización previa por escrito del autor. Depósito Legal: C 1457-2013 ISBN-10: 84-695-8459-6 ISBN-13: 978-84-695-8459-0

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CONTENIDO PROLOGO ........................................................................................................................................................

7

CAPITULO 1. – DISTRIBUCIONES EN EL MUESTREO ........................................................................ 1.1 Conceptos básicos ............................................................................................................................ 1.2 Resultados generales ........................................................................................................................ 1.3 Poblaciones normales ....................................................................................................................... 1.4 Algunos resultados para muestras grandes .......................................................................................

9 10 27 32 61

CAPITULO 2. – ESTIMACION ...................................................................................................................... 2.1 Estimación puntual ........................................................................................................................... 2.2 Intervalos de confianza: planteamiento general ............................................................................... 2.3 Intervalos de confianza para poblaciones normales ......................................................................... 2.4 Algunos intervalos de confianza para muestras grandes .................................................................. Ejercicios propuestos de intervalos de confianza ....................................................................................

77 78 113 116 150 167

CAPITULO 3. – CONTRASTACION DE HIPOTESIS ............................................................................... 3.1 Planteamiento general ...................................................................................................................... 3.2 Contrastes de hipótesis en poblaciones normales ............................................................................ 3.3 Algunos contrastes de hipótesis para muestras grandes ................................................................... Ejercicios propuestos de contrastes de hipótesis .....................................................................................

185 186 207 283 315

BIBLIOGRAFIA ............................................................................................................................................... 333 TABLAS ESTADISTICAS ............................................................................................................................... 335

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

PROLOGO Este libro pretende ser un manual para un curso introductorio de Inferencia Estadística, de alrededor de tres créditos ECTS, dirigido a alumnos que cursan estudios de grado específicamente orientados a los ámbitos de la economía y de la empresa. El libro surge de la necesidad de adaptar el amplio contenido de la inferencia estadística al escaso tiempo del que se dispone para desarrollarlo en el aula, a los objetivos concretos asignados a esta materia en los grados de economía y empresa, y a la formación previa de los estudiantes. Para ello se ha optado por una orientación teórico−práctica, presentando de forma sucinta los conceptos básicos en los que se fundamenta la inferencia estadística, y prestando especial atención a la obtención de intervalos de confianza y a la aplicación de los procedimientos de contrastación de hipótesis a problemas concretos. La composición y paginación de la obra se ha diseñado pensando en la exposición de los contenidos en el aula, de modo que este manual se pueda utilizar directamente para desarrollar los temas en clase y no como simple material de apoyo. Así, las páginas se han orientado horizontalmente para facilitar su proyección en forma de diapositiva. También se ha intentado, en la medida de lo posible, paginar el texto de manera que toda la información necesaria en un determinado momento aparezca en la misma página, con el fin de facilitar el seguimiento de la presentación.

7

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

El material que se ha recopilado aquí se ha estado utilizando en la docencia de la materia Estadística e Introducción a la Econometría, de segundo curso del grado de ADE y tercer curso del doble grado de Derecho y ADE de la Universidade da Coruña. Como tal, se ha puesto a disposición de los alumnos en la plataforma Moodle de la UDC desde el curso 2010/2011, y se ha beneficiado de todos los cambios y mejoras que se han ido incorporando a lo largo de este tiempo. Agradezco de forma especial la colaboración de Pilar Uriz, cuyas sugerencias han ayudado a mejorar este texto. El autor

8

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CAPITULO 1. – DISTRIBUCIONES EN EL MUESTREO 1.1 Conceptos básicos 1.2 Resultados generales 1.3 Poblaciones normales 1.4 Algunos resultados para muestras grandes

9

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.1 CONCEPTOS BASICOS POBLACION: fenómeno aleatorio, caracterizado por una variable aleatoria X con función de distribución F(x): X∼F(x) Además, X tiene - una función de cuantía, P(X=xi), o - una función de densidad, f(x), según sea una variable discreta o continua.

10

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1: La Población Número de personas por vivienda en una determinada ciudad:

xi

1

2

3

4

P ( X = xi )

1/4

1/4

1/4

1/4

μ = E (X) =



σ 2 = var (X) = = ( 1 − 2.5 ) 2

xi P ( X = xi ) = 1

∑ (x

i

1 1 1 1 + 2 + 3 + 4 = 2.5 4 4 4 4

− μ ) 2 P (X = x i ) =

1 1 1 1 + ( 2 − 2.5 ) 2 + ( 3 − 2.5 ) 2 + ( 4 − 2.5 ) 2 = 1.25 4 4 4 4

11

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

En la práctica, desconocemos aspectos importantes de la distribución de probabilidad:

xi

1

2

3

4

P ( X = xi )

p1

p2

p3

p4

NECESITAMOS: aproximar el valor de los parámetros desconocidos. Para ello: utilizamos muestras e inferencia estadística.

12

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Se observa un subconjunto de la población Estadística Descriptiva

Se obtienen resultados para ese subconjunto Inferencia Estadística

Se extienden las conclusiones a toda la población

13

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

MUESTRA DE TAMAÑO n: cualquier subconjunto de n observaciones de la

población → ( X1, X2, …, Xn ) MUESTRA ALEATORIA SIMPLE: cuando el procedimiento de selección de las n

observaciones garantiza que: a) Los elementos de la muestra son independientes entre sí. b) Todos los elementos de la muestra tienen la misma distribución que la población. • Forma de hacerlo: Extracción con reposición. INFERENCIA ESTADISTICA: conjunto de técnicas y procedimientos estadísticos

que permiten extender las conclusiones de una muestra a toda la población.

14

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Muestra aleatoria simple de tamaño 2 Número de personas por vivienda, muestra aleatoria simple de tamaño 2:

( X1 , X 2 ) → ( ? , ? ) Posibles muestras que podemos observar:

X2

1

2

3

4

1

(1,1)

(1,2)

(1,3)

(1,4)

2

(2,1)

(2,2)

(2,3)

(2,4)

3

(3,1)

(3,2)

(3,3)

(3,4)

4

(4,1)

(4,2)

(4,3)

(4,4)

X1

15

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Probabilidad de observar cada posible muestra → por ejemplo, la muestra (1,1): P ( X1 = 1 , X 2 = 1 ) = ( m.a.s ) = P1 ( X1 = 1 ) P2 ( X 2 = 1 ) = ( m.a.s. ) = = P( X1 = 1 ) P( X 2 = 1 ) =

X2

1 1 1 = 4 4 16

1

2

3

4

1

1/16

1/16

1/16

1/16

2

1/16

1/16

1/16

1/16

3

1/16

1/16

1/16

1/16

4

1/16

1/16

1/16

1/16

X1

Consecuencia: • La muestra es una variable aleatoria con su distribución de probabilidad: ( X1, X2, …, Xn ) → F( x1, x2, …, xn ) 16

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

ESTADISTICO: cualquier función de la muestra. Estadísticos más utilizados: • media muestral x + x 2 + ... + x n x = 1 = n _

∑x

i

n

• varianza muestral _

_

_

( x 1 − x ) + ( x 2 − x ) + ... + ( x n − x ) s = n 2

2

2

2

=

∑ (x

_

i

− x )2

n

• cuasivarianza muestral _

_

_

( x 1 − x ) + ( x 2 − x ) + ... + ( x n − x ) s c2 = n −1 2

2

2

=



_

( xi − x )2 n −1

17

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

NOTA IMPORTANTE La terminología que se utiliza en ocasiones para las medidas de dispersión muestrales es confusa y puede llevar a error. Así, en algunos libros y programas informáticos: • A la cuasivarianza muestral, s c2 , se le llama varianza muestral o simplemente varianza. • A la varianza muestral, s2, se le llama varianza poblacional. Sin embargo, en este manual resaltaremos la diferencia entre varianza y cuasivarianza para evitar entrar en conflicto con la forma en que se definen las medidas de dispersión en Estadística Descriptiva.

18

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Lo mismo ocurre con: • La cuasidesviación típica muestral, sc = +

s c2 = +

∑ (x

_

i

− x )2

n −1

a la que se le denomina desviación estándar. • La desviación típica muestral,

s = +

s2 = +



_

( xi − x )2 n

a la que se le denomina desviación estándar poblacional.

19

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Media muestral Número de personas por vivienda, muestras aleatorias simples de tamaño 2, media muestral x1 + x 2 ( X1 , X 2 ) → x = 2 _

Posibles valores de la media muestral que podemos observar: X2

1

2

3

4

1

1

1.5

2

2.5

2

1.5

2

2.5

3

3

2

2.5

3

3.5

4

2.5

3

3.5

4

X1

20

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

_

Probabilidad de cada posible valor de la media muestral → por ejemplo, x =3.5: _

P ( x = 3 .5 ) = P [ ( X 1 , X 2 ) = ( 3 , 4 ) o ( X 1 , X 2 ) = ( 4 , 3 ) ] = = P [ ( X1 , X 2 ) = ( 3 , 4 ) ] + P [ ( X1 , X 2 ) = ( 4 , 3 ) ] = _

xi

_

1 1 2 + = 16 16 16

_

P ( x = xi )

1

1/16

1.5

2/16

2

3/16

2.5

4/16

3

3/16

3.5

2/16

4

1/16 21

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

POBLACION media = μ = 2.5

⇒ Parámetro (constante)

MUESTRA x1 + x 2 media = x = 2 _

⇒ Variable aleatoria con su distribución de probabilidad Función de cuantía de la media muestral, m.a.s tamaño 2

0.30 0.25 0.20 0.15 0.10 0.05 0.00 1

1.5

2

2.5

3

3.5

4

22

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Varianza muestral Número de personas por vivienda, muestras aleatorias simples de tamaño 2, varianza muestral _

_

(x1 − x) + (x 2 − x) 2 ( X1 , X 2 ) → s = 2 2

2

Posibles valores de la varianza muestral que podemos observar: X2

1

2

3

4

1

0

0.25

1

2.25

2

0.25

0

0.25

1

3

1

0.25

0

0.25

4

2.25

1

0.25

0

X1

23

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Probabilidad de cada posible valor de la varianza muestral → por ejemplo, s2=2.25: P ( s 2 = 2.25 ) = P [ ( X1 , X 2 ) = ( 1 , 4 ) o ( X1 , X 2 ) = ( 4 , 1 ) ] = = P [ ( X1 , X 2 ) = ( 1 , 4 ) ] + P [ ( X1 , X 2 ) = ( 4 , 1 ) ] =

s i2

1 1 2 + = 16 16 16

P ( s 2 = s i2 )

0

4/16

0.25

6/16

1

4/16

2.25

2/16

24

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

POBLACION varianza = σ2 = 1.25

⇒ Parámetro (constante)

MUESTRA _

_

(x1 − x ) + (x 2 − x ) 2 varianza = s = 2 2

2

⇒ Variable aleatoria con su dist. de prob.

Función cuantía de la varianza muestral, m.a.s. tamaño 2 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0.00 0

0.25

1

2.25

25

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Cuasivarianza muestral Número de personas por vivienda, muestras aleatorias simples de tamaño 2, cuasivarianza muestral _

_

(x1 − x) + (x 2 − x) 2 ( X1 , X 2 ) → s = 2 −1 2 c

X2 X1

1

2

3

4

2

s c2,i

P ( s c2 = s c2,i )

0

4/16

0.5

6/16

1

0

0.5

2

4.5

2

0.5

0

0.5

2

2

4/16

3

2

0.5

0

0.5

4.5

2/16

4

4.5

2

0.5

0

26

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.2 RESULTADOS GENERALES 1.2.1 Media muestral _

E(x) = μ σ2 var( x ) = n _

_

DT ( x ) =

σ n

27

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Demostraciones: 1 ⎛ x + x 2 + ... + x n ⎞ [ E( x1 ) + E( x 2 ) + ... + E( x n ) ] = = E(x) = E⎜ 1 ⎟ n n ⎠ ⎝ nμ 1 = ( μ + μ + ... + μ ) = = μ n n _

⎛ x + x 2 + ... + x n var ( x ) = var ⎜ 1 n ⎝ 1 = 2 ( σ 2 + σ 2 + ... + σ 2 ) n _

1 ⎞ [ var(x1 ) + var(x 2 ) + ... + var(x n ) ] = = ⎟ 2 n ⎠ n σ2 σ2 = = 2 n n

28

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Esperanza y varianza de la media muestral Número de personas por vivienda, muestra aleatoria simple de tamaño 2: _

xi

_

E(x) = 1

_

_

P ( x = xi )

1

1/16

1.5

2/16

2

3/16

2.5

4/16

3

3/16

3.5

2/16

4

1/16

1 2 3 4 3 2 1 + 1. 5 + 2 + 2.5 + 3 + 3. 5 + 4 = 2. 5 = μ 16 16 16 16 16 16 16

1 1.25 σ2 2 2 2 1 var(x ) = ( 1 − 2.5 ) + ( 1.5 − 2.5 ) + ... + ( 4 − 2.5 ) = 0.625 = = 16 16 16 2 n _

2

29

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.2.2 Varianza muestral y cuasivarianza muestral ⎛ n −1 ⎞ 2 2 E ( s2 ) = ⎜ ⎟ σ ≠ σ ⎝ n ⎠ E ( s c2 ) = σ 2

30

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Esperanza de la varianza muestral y de la cuasivarianza muestral Número de personas por vivienda, muestra aleatoria simple de tamaño 2:

s i2

P ( s 2 = s i2 )

s c2,i

P ( s c2 = s c2,i )

0

4/16

0

4/16

0.25

6/16

0.5

6/16

1

4/16

2

4/16

2.25

2/16

4.5

2/16

E ( s2 ) = 0

4 2 4 6 ⎛ 2 −1 ⎞ ⎛ n −1 ⎞ 2 + 0.25 + 1 + 2.25 = 0.625 = ⎜ ⎟ 1.25 = ⎜ ⎟σ 16 16 16 16 ⎝ 2 ⎠ ⎝ n ⎠

E ( s c2 ) = 0

2 4 6 4 + 0.5 + 2 + 4.5 = 1.25 = σ 2 16 16 16 16 31

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.3 POBLACIONES NORMALES 1.3.1 Una población • X∼N(μ,σ) • m.a.s tamaño n → ( X1, X2, …, Xn )

32

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

a) DISTRIBUCION DE LA MEDIA MUESTRAL CON σ CONOCIDA _



E(x) = μ



σ2 var ( x ) = n



_

_

x = suma de variables normales ∼ Normal

_

x ∼ N(μ,

σ ) n

_



x−μ ∼ N ( 0 ,1) σ n

33

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 2: En los supermercados se comercializan cajas de muesli de la marca Cerealia. El peso exacto de cada caja es aleatorio, aunque se sabe que sigue una distribución normal de media 500 gramos y desviación típica 5 gramos. Si obtenemos una muestra aleatoria simple de 16 cajas y las pesamos, calcular la probabilidad de que el peso medio de las cajas de la muestra sea mayor que 501.25 gramos.

34

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = peso de la caja ∼ N ( 500 , 5 ) * m.a.s. de tamaño n = 16 Dado que:

_

x ∼ N ( 500 ,

_

5 ) 16

x − 500 ∼ N ( 0 ,1) 5 16



⎛ _ ⎜ 501.25 − 500 x − 500 ⎞ ⎛ _ > P ⎜ x > 501.25 ⎟ = P ⎜ 5 ⎜ 5 ⎠ ⎝ ⎜ 16 16 ⎝

⎞ ⎟ ⎟ = P ( N (0 , 1 ) > 1 ) = 0.1587 ⎟ ⎟ ⎠

N ( 0 ,1) 15 .87 %

-3

-2

-1

0

1

1

2

3

35

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

b) DISTRIBUCION DE LA CUASIVARIANZA MUESTRAL (n − 1) s c2 2 ∼ χ n −1 σ2 ¿Por qué chi-cuadrado?



s = 2 c

∑ _

_

( xi − x ) 2 n −1



xi − x





( n − 1 ) s c2

∑ (x

⇒ ( n −1) s = 2 c

Normal − Normal →



suma ( normales ) 2



_

i

− x)2

Normal

χ2

36

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 3: La Dirección General de Tráfico está haciendo un estudio sobre la velocidad a la que se circula por un determinado punto negro. Se sabe que la velocidad sigue una distribución normal de media 57 kms/hora y desviación típica 0.6 kms/hora. Si obtenemos una muestra aleatoria simple de 10 coches y medimos su velocidad de paso, calcular la probabilidad de que la cuasivarianza de esa muestra sea menor que 0.2152 (kms/hora)2.

37

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = velocidad al pasar por el punto negro ∼ N ( 57 , 0.6 ) * m.a.s. de tamaño n = 10 (10 − 1) s c2 2 ∼ χ 10 −1 2 0.6

Dado que:

⎛ (10 − 1) s c2 (10 − 1) 0.2152 P s < 0.2152 = P ⎜⎜ < 2 2 0 . 6 0 . 6 ⎝

(

2 c

)

⎞ 2 ⎟⎟ = P χ10 = 0.20 −1 < 5.38 ⎠

(

)

2 χ 10 −1

20 %

0

2

4

6

5.38

8

10

12

14

16

18

20

22

24

26

38

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

c) DISTRIBUCION DE LA MEDIA MUESTRAL CON σ DESCONOCIDA Cuando la desviación típica de la población es desconocida, es preciso utilizar la siguiente distribución de probabilidad alternativa para la media muestral: _

x−μ ∼ t n −1 sc n

39

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

¿Por qué t de Student? _

x −μ ∼ N ( 0 ,1) σ n _

x −μ σ n (n − 1) s σ2

2 c

(n − 1)

_

=

x −μ sc n



N(0,1) χ

2 n −1

= t n −1

(n − 1)

(n − 1) s c2 2 ∼ χ n −1 σ2

40

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 4: Una empresa de alquiler de automóviles sabe que el número de días al año que un vehículo de su flota pasa en el taller de reparaciones sigue una distribución normal de media 14 días. Hemos obtenido una muestra aleatoria simple de 9 coches, y observado el número de días que cada coche de la muestra ha estado en el taller durante el pasado año, obteniendo una cuasidesviación típica muestral igual a 4.725 días. Calcular la probabilidad de que en media los coches de esa muestra hayan estado más de 16.2 días en el taller de reparaciones.

41

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = número de días al año que un coche pasa en el taller ∼ N ( 14 , σ ) * m.a.s. de tamaño n = 9 → sc = 4.725 _

x − 14 4.725

Dado que:

∼ t 9 −1 9

⎛ _ ⎜ x − 14 16.2 − 14 ⎛ _ ⎞ P ⎜ x > 16.2 ⎟ = P ⎜ > 4.725 ⎜ 4.725 ⎝ ⎠ ⎜ 9 9 ⎝

⎞ ⎟ ⎟ = P ( t 9−1 > 1.3968 ) = 0.10 ⎟ ⎟ ⎠

t 9−1 10%

-3

-2

-1

0

1

1.3968

2

3

42

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

NOTA IMPORTANTE La media muestral tiene asociadas dos distribuciones de probabilidad, según consideremos en el denominador la desviación típica poblacional (σ) o la cuasidesviación típica muestral (sc): _

x −μ ∼ N ( 0 ,1) σ n

_

x −μ sc

∼ t

n −1

n

La distribución concreta a utilizar en cada caso depende del contexto del problema: - Si se conoce σ 2 y utilizamos la distribución t de Student, el resultado obtenido no se considerará correcto y el ejercicio estará mal.

- Si no se conoce σ 2 y utilizamos la distribución normal, el resultado obtenido no se considerará correcto y el ejercicio estará mal.

Esta advertencia es válida para todas las aplicaciones de estas distribuciones que veremos a lo largo del curso. 43

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.3.2 Dos poblaciones, muestras independientes • Población 1:

X ∼ N ( μx , σx ) m.a.s tamaño m → ( X1, X2, …, Xm ) • Población 2:

Y ∼ N ( μy , σy ) m.a.s tamaño n → ( Y1, Y2, …, Yn ) • Las dos poblaciones son independientes entre sí. • Las dos muestras son independientes entre sí.

44

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

d) DISTRIBUCION DE LA DIFERENCIA DE MEDIAS MUESTRALES CON σx, σy CONOCIDAS _

_



E ( x − y ) = μx − μy



σ 2y σ 2x var ( x − y ) = + m n



_

_

_

_

x − y ∼ normal

⎛ x− y ∼ N ⎜ μx − μ y , ⎜ ⎝ _

_

σ ⎞⎟ σ 2x + m n ⎟ ⎠ 2 y

_



_

( x − y) − (μ x − μ y ) σ σ + m n 2 x

2 y

∼ N ( 0 ,1)

45

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Demostraciones: _

_

_

_



E ( x − y ) = E ( x ) − E ( y ) = μx − μy



σ 2y σ 2x + var ( x − y ) = ( X , Y independientes ) = var ( x ) + var ( y ) = m n



_

_

_

_

x − y ∼ normal − normal = normal

_

_

( propiedad de la normal )

46

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 5: La calificación final de los graduados del ámbito de humanidades se distribuye normal de media 5.6 y desviación típica 0.5, en tanto que la de los graduados en ciencias de la salud sigue una distribución normal de media 5.8 y desviación típica 0.9. Si extraemos dos muestras aleatorias simples de forma independiente, una de 50 graduados del ámbito de humanidades y otra de 75 graduados del ámbito de ciencias de la salud, calcular la probabilidad de que en las muestras obtenidas la nota media de humanidades sea mayor que la media de ciencias de la salud.

47

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = nota de los graduados del ámbito de humanidades ∼ N ( 5.6 , 0.5 ) * m.a.s. de tamaño m = 50 de la población X * Y = nota de los graduados del ámbito de ciencias de la salud ∼ N ( 5.8 , 0.9 ) * m.a.s. de tamaño n = 75 de la población Y Dado que:

⎛ x − y ∼ N ⎜ 5.6 − 5.8 , ⎜ ⎝ _

_

0.5 0.9 ⎞⎟ + 50 75 ⎟⎠ 2

2

_



_

( x − y) − (5.6 − 5.8) 2

2

0.5 0.9 + 50 75

∼ N ( 0 ,1)

48

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

⎛ ⎜ _ _ _ _ _ _ 0 − (5.6 − 5.8) ⎜ ( x − y) − (5.6 − 5.8) ⎞ ⎞ ⎛ ⎛ P ⎜ x > y⎟ = P ⎜ x − y > 0⎟ = P ⎜ > 2 2 2 2 ⎠ ⎠ ⎝ ⎝ 0 . 5 0 . 9 0 . 5 0 . 9 ⎜⎜ + + 50 75 50 75 ⎝ = P ( N (0 , 1 ) > 1.59

)

⎞ ⎟ ⎟ ⎟ = ⎟⎟ ⎠

= 0.0559

N ( 0 ,1)

5.59 %

-3

-2

-1

0

1

1.59

2

3

49

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

e) DISTRIBUCION DE LA DIFERENCIA DE MEDIAS MUESTRALES CON σx, σy DESCONOCIDAS E IGUALES Si las desviaciones típicas poblacionales σx = σy = σ son desconocidas, en la práctica debemos utilizar la siguiente distribución alternativa para la diferencia de medias muestrales: _

_

( x − y) − (μ x − μ y ) (m − 1) s

2 c,x

+ (n − 1) s

m+n −2

2 c,y

1 1 + m n

∼ t m+n−2

50

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 6: La cantidad de grasa que contiene una hamburguesa de la cadena de restaurantes de comida rápida Fastfood se distribuye normal de media 30 gramos, en tanto que la cantidad de grasa de una hamburguesa de su principal competidor, la cadena Quickmeal, se distribuye normal de media 34 gramos. Supongamos que extraemos dos muestras aleatorias simples de hamburguesas de forma independiente, una de cada cadena. De Fastfood tenemos 8 hamburguesas, con una cuasivarianza muestral de la cantidad de grasa igual a 4.41 gramos2; por su parte, de Quickmeal tenemos 15 hamburguesas y una cuasivarianza muestral igual a 3.24 gramos2. Suponiendo que la desviación típica poblacional de la cantidad de grasa por hamburguesa es la misma en las dos cadenas, ¿cuál es la probabilidad de que la diferencia de medias muestrales (media de Fastfood menos media de Quickmeal) sea menor que −3.2834 gramos?

51

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = contenido de grasa en las hamburguesas de Fastfood ∼ N ( 30 , σx ) * m.a.s. de tamaño m = 8 de la población X → s c2,x = 4.41 * Y = contenido de grasa en las hamburguesas de Quickmeal ∼ N ( 34 , σy ) * m.a.s. de tamaño n = 15 de la población Y → s c2, y = 3.24 * σx = σy = σ _

Dado que:

_

( x − y) − (30 − 34) (8 − 1) 4.41 + (15 − 1) 3.24 8 + 15 − 2

1 1 + 8 15

∼ t 8 + 15 − 2

52

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

_ ⎞ ⎛ _ P ⎜ x − y < − 3.2834 ⎟ = ⎠ ⎝

⎛ ⎜ ⎜ =P⎜ ⎜ ⎜ ⎝

_

_

( x − y) − (30 − 34) (8 − 1) 4.41 + (15 − 1) 3.24 8 + 15 − 2


1.28 ⎟ = P ⎜ > 2 2 ⎟ 256 256 ⎠ ⎜ 2 2 364 364 ⎝

⎞ ⎟ ⎟ = P F 10 − 1 > 2.59 16 − 1 ⎟ ⎟ ⎠

(

) = 0.05

F1610−−11

5%

0

1

2

2.59

3

4

60

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.4 ALGUNOS RESULTADOS PARA MUESTRAS GRANDES 1.4.1 DISTRIBUCION DE LA MEDIA MUESTRAL EN UNA POBLACION INDETERMINADA • Sea X una población cualquiera. _

• Muestra aleatoria simple de tamaño n → media muestral x =

x 1 + x 2 + ... + x n n

_

• x se obtiene a partir de una suma de variables aleatorias: - independientes - con la misma distribución

61

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

_

Por lo tanto, si n es grande x se distribuye aproximadamente normal según el Teorema Central del Límite:

_

x ⎯n⎯ ⎯→ N ( μ , →∞

σ ) n

_



x −μ ⎯n⎯ ⎯→ N ( 0 , 1 ) →∞ σ n

62

Introducción a la Inferencia Estadística para Economía y Empresa

1.4.2

DISTRIBUCION

DE

José Ramón Cancelo

LA

PROPORCION

MUESTRAL

EN

UNA

POBLACION BINOMIAL (1,p) • Población: X ∼ B ( 1 , p )

• μ = E(X) = p

xi

1

0

P ( X = xi )

p

1-p

,

σ2 = var(X) = p ( 1 – p )

_

• f = x : proporción en la muestra ⎛ ⎜⎜ p , f ⎯n⎯ N ⎯ → →∞ ⎝

p (1 − p) n

⎞ ⎟⎟ ⎠



f −p ⎯n⎯ ⎯→ N ( 0 , 1 ) →∞ p (1 − p) n

63

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 8:

El 58% de los hogares de A Coruña están abonados a la televisión de pago mediante cualquiera de las tecnologías actualmente disponibles en el mercado. Si obtenemos una muestra aleatoria simple de 200 hogares, ¿cuál es la probabilidad de que en la muestra la proporción de hogares abonados sea inferior al 53%? Datos del problema: * X = estar abonado a televisión de pago ∼ B ( 1 , 0.58 ) * m.a.s. de tamaño n = 200 ⇒ muestra grande Dado que:

f − 0.58 ⎯n⎯ ⎯→ N ( 0 , 1 ) →∞ 0.58 (1 − 0.58) 200

64

Introducción a la Inferencia Estadística para Economía y Empresa

P ( f < 0.53 )

⎛ ⎜ = P ⎜ ⎜ ⎜ ⎝

José Ramón Cancelo

⎞ ⎟ 0.53 − 0.58 ⎟ = 0.58 (1 − 0.58) ⎟ ⎟ 200 ⎠

f − 0.58 < 0.58 (1 − 0.58) 200

= P ( N(0,1) < − 1.43 ) = 0.0764

N ( 0 ,1)

7.64 %

-3

-2

− 1.43

-1

0

1

2

3

65

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

1.4.3 DISTRIBUCION DE LA MEDIA MUESTRAL EN UNA POBLACION POISSON • Población: X ∼ Poisson con parámetro λ

e − λ λx i P ( X = xi ) = xi ! • μ = E(X) = λ

,

σ2 = var(X) = λ

⎛ x ⎯⎯ ⎯→ N ⎜⎜ λ , n →∞ ⎝ _

, x i = 0, 1, 2, ...

λ n

⎞ ⎟ ⎟ ⎠

_



x−λ ⎯⎯ ⎯→ N ( 0 , 1 ) n →∞ λ n

66

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 9: El número de camiones que llega diariamente a una terminal portuaria se distribuye Poisson con parámetro igual a 10.5. Si extraemos una muestra aleatoria simple de 300 días, ¿cuál es la probabilidad de que la media de esa muestra sea mayor que 10.8? Datos del problema: *

X = número diario de camiones ∼ Poisson con parámetro 10.5

*

m.a.s. de tamaño n = 300 ⇒ muestra grande _

Dado que:

x − 10.5 ⎯n⎯ ⎯→ N ( 0 , 1 ) →∞ 10.5 300

67

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

⎞ ⎟ ⎟ = P ( N(0,1) > 1.60 ⎟ ⎟ ⎠

⎛ _ ⎜ _ x − 10.5 10.8 − 10.5 ⎛ ⎞ P ⎜ x > 10.8 ⎟ = P ⎜ > ⎜ 10.5 10.5 ⎝ ⎠ ⎜ 300 300 ⎝

)

= 0.0548

N ( 0 ,1)

5.48%

-3

-2

-1

0

1

1.60

2

3

68

Introducción a la Inferencia Estadística para Economía y Empresa

1.4.4

DISTRIBUCION

MUESTRALES

EN

DE

LA

José Ramón Cancelo

DIFERENCIA

POBLACIONES

DE

BINOMIALES

PROPORCIONES Y

MUESTRAS

INDEPENDIENTES • Población 1: X ∼ B ( 1 , px )

xi

1

0

P ( X = xi )

px

1-px

_

• m.a.s tamaño m → ( X1, X2, …, Xm ) → f x = proporción en la muestra = x

69

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

• Población 2: Y ∼ B ( 1 , py )

yi

1

0

P ( Y = yi )

py

1-py

_

• m.a.s tamaño n → ( Y1, Y2, …, Yn ) → f y = proporción en la muestra = y • Las dos poblaciones son independientes entre sí. • Las dos muestras son independientes entre sí.

70

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Dado que: • E ( fx ) = px

• E ( fy ) = py py ( 1 − py )

px ( 1 − px ) • var ( fx ) = m

• var ( fy ) =

⎯→ Normal • fx ⎯⎯ m →∞

⎯→ Normal • fy ⎯⎯ n →∞

n

tenemos que: • E ( fx − fy ) = E ( fx ) − E ( fy ) = px − py • var ( fx − fy ) = var ( fx ) + var ( fy ) =

py (1 − py ) px ( 1 − px ) + m n

• fx − fy ⎯m⎯ ⎯ ⎯→ Normal − Normal = Normal ,n → ∞

71

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

y por lo tanto:

fx − fy

⎛ ⎯⎯ ⎯ ⎯→ N ⎜ p x − p y , m ,n → ∞ ⎜ ⎝ ⇒

p y (1 − p y ) p x (1 − p x ) + m n (f x − f y ) − ( p x − p y )

p y (1 − p y ) p x (1 − p x ) + m n

⎞ ⎟ ⎟ ⎠



⎯⎯ ⎯ ⎯→ N ( 0 , 1 ) m ,n → ∞

72

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 10: Se sabe que el porcentaje de gallegos entre 35 y 44 años que son consumidores habituales de productos lácteos es igual al 41%, y que esta cifra baja al 35% para los que tienen entre 45 y 64 años. Si extraemos dos muestras aleatorias simples independientes, una de 600 personas entre 35 y 44 años y otra de 400 personas entre 45 y 64 años, ¿cuál es la probabilidad de que la proporción de consumidores habituales de productos lácteos sea menor en la muestra de 35 a 44 años que en la del grupo de 45 a 64?

73

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X= consumir habitualmente productos lácteos en la franja de edad 35-44 ∼ B (1, 0.41) * m.a.s. de tamaño m = 600 de la población X ⇒ muestra grande * Y= consumir habitualmente productos lácteos en la franja de edad 45-64 ∼ B (1, 0.35) * m.a.s. de tamaño n = 400 de la población Y ⇒ muestra grande Dado que: (f x − f y ) − (0.41 − 0.35) 0.41 (1 − 0.41) 0.35 (1 − 0.35) + 600 400

⎯⎯ ⎯ ⎯→ N ( 0 , 1 ) m ,n → ∞

74

Introducción a la Inferencia Estadística para Economía y Empresa

P ( fx < fy ⎛ ⎜ = P ⎜ ⎜ ⎜ ⎝

)

= P ( fx − fy < 0

José Ramón Cancelo

)=

(f x − f y ) − (0.41 − 0.35) 0.41 (1 − 0.41) 0.35 (1 − 0.35) + 600 400


2.2 ⇒ cambiamos de idea (Región de rechazo)

μ=3

μ =1

H 0 falsa

H 0 verdadera

No Re chazo H 0

2 .2

Re chazo H 0 197

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Probabilidades asociadas: 1) NIVEL DE SIGNIFICACION o PROBABILIDAD DE ERROR DE TIPO I Es la probabilidad de rechazar la hipótesis nula cuando es verdadera. _

α = P ( ETI ) = P ( R H 0 si H 0 V ) = P ( x > 2.2 si μ = 1 ) = _ 1 ⎞ ⎛ _ = P ⎜ x > 2.2 si x ∼ N ( 1 , ) ⎟ = ( ... ) = 0.0446 2 ⎠ ⎝

N (1,

1 ) 2

N (3,

1 ) 2

P ( ETI ) = 0.0446

-2

-1

0

1

2

3

2.2 Re chazo H 0

4

5

6

198

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

2) PROBABILIDAD DE ERROR DE TIPO II Es la probabilidad de no rechazar la hipótesis nula cuando es falsa. _

P ( ETII ) = P ( No R H 0 si H 0 F ) = P ( x < 2.2 si μ = 3 ) = _ 1 ⎞ ⎛ _ = P ⎜ x < 2.2 si x ∼ N ( 3 , ) ⎟ = ( ... ) = 0.1292 2 ⎠ ⎝

N(1,

1 ) 2

N(3,

1 ) 2

P ( ETII ) = 0.1292

-2

-1

0

1

2

No Re chazo H 0 2.2

3

4

5

6

199

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3) POTENCIA DEL CONTRASTE Es la probabilidad de rechazar la hipótesis nula cuando es falsa. _

Potencia = P ( R H 0 si H 0 F ) = P ( x > 2.2 si μ = 3 ) = _ 1 ⎞ ⎛ _ = P ⎜ x > 2.2 si x ∼ N ( 3 , ) ⎟ = ( ... ) = 0.8708 2 ⎠ ⎝

N(1,

N(3,

1 ) 2

1 ) 2

Potencia = 0.8708

-2

-1

0

1

2

3

2.2 Re chazo H 0

4

5

6

200

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

• Relación entre la potencia y la probabilidad de error de tipo II:

P ( ETII ) + Potencia = 0.1292 + 0.8708 = 1

N(1,

N(3,

1 ) 2

1 ) 2

Potencia = 0.8708

P ( ETII ) = 0.1292

-2

-1

0

1

No Re chazo H 0

2

3

2.2 Re chazo H 0

4

5

6

201

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.1.3 Determinación de la regla de decisión PROPUESTA 1: Escogemos la región de rechazo que Minimiza P ( error tipo I )

y

Minimiza P ( error tipo II )

PERO: • no podemos disminuir las dos probabilidades a la vez • lo que se necesita hacer para reducir una probabilidad conlleva un aumento de la otra

202

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

PROPUESTA 2: En la práctica los dos errores no tienen la misma importancia. Normalmente es peor cometer un error de tipo I (rechazar una hipótesis verdadera) que un error de tipo II (no rechazar una hipótesis falsa). Por lo tanto la regla de decisión se determina en dos etapas: Etapa 1) Se fija la probabilidad de cometer un error de tipo I (nivel de significación). Lo más habitual es 5%; también 10% o 1%. Etapa 2) Se escoge la región de rechazo que minimiza la probabilidad de error de tipo II, condicionado al nivel de significación fijado anteriormente.

203

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 1 (continuación): Supongamos que se nos propone utilizar la siguiente regla alternativa: _

⇒ mantenemos μ = 1

−0.36 < x < 2.49

(Región de no rechazo)

* RD 2 _

_

x < −0.36 o x > 2.49 ⇒ cambiamos de idea (Región de rechazo)

N (1,

-2

1 ) 2

-1

Re chazo H 0

N (3,

− 0.36

0

1

No Re chazo H 0

2

3

2.49 Re chazo H 0

4

5

1 ) 2

6

204

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Etapa 1) comparación de las probabilidades de error de tipo I Regla de decisión 2: _

_

α = P ( ETI ) = P ( R H 0 si H 0 V ) = P ( x < − 0.36 o x > 2.49 si μ = 1 ) = _ _ 1 ⎞ ⎛ _ = P ⎜ x < − 0.36 o x > 2.49 si x ∼ N ( 1 , ) ⎟ = ( ... ) = 0.0446 2 ⎠ ⎝

N (1,

1 ) 2

N (3,

1 ) 2

P ( ETI ) = 0 .0446

-2

-1

Re chazo H 0

− 0.36

0

1

2

No Re chazo H 0

Regla decisión 1 → P ( ETI ) = 0.0446

=

2.49

3

4

Re chazo H 0

5

6

0.0446 = P ( ETI ) ← Regla decisión 2

Conclusión: las dos reglas propuestas tienen la misma probabilidad de error de tipo I.

205

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Etapa 2) comparación de las probabilidades de error de tipo II Regla de decisión 2: _

P ( ETII ) = P ( No R H 0 si H 0 F ) = P ( − 0.36 < x < 2.49 si μ = 3 ) = _ _ 1 ⎞ ⎛ ) ⎟ = ( ... ) = 0.2358 = P ⎜ − 0.36 < x < 2.49 si x ∼ N ( 3 , 2 ⎠ ⎝

N(1,

1 ) 2

N(3,

1 ) 2

P (ETII) = 0.2358

-2

-1

Re chazo H 0 − 0.36

0

1

No Re chazo H 0

Regla decisión 1 → P ( ETII ) = 0.1292


k2

k1 = μ 0 − z

σ n

,

k 2 = μ0 + z

σ n

208

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: μ = μ0

N ( 0 ,1)

H1: μ > μ0 α

-3

-2

-1

0

1

z

2

3

Región de rechazo: _

x > k

k = μ0 + z

σ n

209

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: μ = μ0

N ( 0 ,1)

H1: μ < μ0

α

-3

−z

-2

-1

0

1

2

3

Región de rechazo: _

x < k

k = μ0 − z

σ n

210

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 2, apartado a: En los supermercados se comercializan cajas de muesli de la marca Cerealia. El peso exacto de cada caja es aleatorio, aunque se sabe que sigue una distribución normal de media desconocida y desviación típica 5 gramos. Extraemos una muestra aleatoria simple de 16 cajas y las pesamos, obteniendo una media muestral igual a 503.75 gramos. Contrastar la hipótesis de que el peso medio de las cajas de muesli de Cerealia es igual a 500 gramos, frente a la alternativa de que es menor que 500 gramos, con un nivel de significación del 5%.

211

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = peso de la caja de muesli de Cerealia ∼ N ( μ , 5 ) * ¿ μ ? , σ = 5 conocida * H0: μ = 500 H1: μ < 500 * m.a.s. de tamaño n = 16





_

μ = x = 503.75

* nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que: _

*

x −μ ∼ N ( 0 ,1) 5 16

212

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que μ ≤ 500 * H0: μ = 500 → hipótesis propuesta ∧

_

* H1: μ < 500 ⇒ me preocupa μ = x 497.95



Rechazo

H0: μ = 500



No Rechazo H0: μ = 500

* En la muestra _

x = 503.75

>

497.95

y por lo tanto no rechazo que en promedio las cajas de muesli de Cerealia pesen 500 gramos frente a la alternativa de que pesan menos, con un nivel de significación del 5%. 215

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 2, apartado b: Con los datos del apartado anterior, contrastar la hipótesis de que el peso medio en la población es igual a 500 gramos, frente a la alternativa de que es mayor que 500 gramos, con un nivel de significación del 5%. H0: μ = 500 H1: μ > 500 Procedimiento para hacer el contraste: * Sabemos que μ ≥ 500 ∧

_

* H1: μ > 500 ⇒ me preocupa μ = x >>> 500 * Regla de decisión: _

- Si x > k → _

- Si x < k →

Rechazo

H0: μ = 500

No Rechazo H0: μ = 500 ¿k? 216

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

_

α = P ( ETI ) = P ( R H 0 si H 0 V ) = P ( x > k si μ = 500 ) = _ ⎞ ⎛ _ 5 ⎜ )⎟ = = P x > k si x ∈ N ( 500 , ⎜ 16 ⎟⎠ ⎝

⎛ ⎜ k − 500 = P ⎜⎜ N(0,1) > 5 ⎜⎜ 16 ⎝

⎞ ⎟ ⎟ = ( fijado a priori ) = 0.05 ⎟ ⎟⎟ ⎠

N ( 0 ,1)

5%

-3

-2

-1

0

1

1.64

2

3

217

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* El valor que delimita la región de rechazo es: k − 500 = 1.64 ⇒ k = 500 + 1.64 5 16

5 = 502.05 16

* La regla de decisión es: _

- Si x > 502.05 _

- Si x < 502.05



Rechazo

H0: μ = 500

→ No Rechazo H0: μ = 500

* En la muestra _

x = 503.75

>

502.05

y por lo tanto rechazo que en promedio las cajas de muesli de Cerealia pesen 500 gramos frente a la alternativa de que pesan más, con un nivel de significación del 5%. 218

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 2, apartado c: Con los datos del apartado anterior, contrastar la hipótesis de que el peso medio en la población es igual a 500 gramos, frente a la alternativa de que la media es distinta de 500 gramos, con un nivel de significación del 5%. H0: μ = 500 H1: μ ≠ 500 Procedimiento para hacer el contraste: * Sabemos que μ puede ser mayor, menor o igual a 500 ∧

_

* H1: μ ≠ 500 ⇒ me preocupa μ = x ≠ ≠ ≠ 500 * Regla de decisión: _

_

- Si x < k1 o x > k2 → Rechazo _

- Si k1 < x < k2

H0: μ = 500

→ No Rechazo H0: μ = 500 ¿ k1 , k2 ?

219

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

_

_

α = P ( ETI ) = P ( R H 0 si H 0 V ) = P ( x < k 1 o x > k 2 si μ = 500 ) = _ _ ⎛ _ ⎞ 5 ⎜ = P x < k 1 o x > k 2 si x ∈ N ( 500 , )⎟ = ⎜ 16 ⎟⎠ ⎝

⎛ ⎜ k − 500 k − 500 ⎜ = P ⎜ N (0,1) < 1 o N(0,1) > 2 5 5 ⎜⎜ 16 16 ⎝

⎞ ⎟ ⎟ ⎟ = ( fijado a priori ) = 0.05 ⎟⎟ ⎠

N ( 0 ,1)

2 .5%

2 .5%

-3

-2

− 1.96

-1

0

1

2

1.96

3

220

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* Los valores que delimitan la región de rechazo son:

k 1 − 500 = − 1.96 ⇒ k 1 = 500 − 1.96 5 16 k 2 − 500 = 1.96 5 16

⇒ k 2 = 500 + 1.96

5 = 497.55 16 5 = 502.45 16

* La regla de decisión es: _

_

- Si x < 497.55 o x > 502.45 - Si

_

497.55 < x < 502.45

* En la muestra

_

x = 503.75

>



Rechazo

H0: μ = 500



No Rechazo H0: μ = 500

502.45

y por lo tanto rechazo que en promedio las cajas de muesli de Cerealia pesen 500 gramos frente a la alternativa de que no pesan 500 gramos, con un nivel de significación del 5%.

221

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.2.2 Contrastes para la varianza de la población El problema:

• X∼N(μ,σ) • ¿ σ2 ? , μ desconocida • m.a.s. de tamaño n





σ 2 = s c2

(n − 1) s c2 2 ∼ χ • n −1 σ2 • nivel de significación = P ( ETI ) = α (dado)

222

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0: σ2 = σ 20

χ 2n − 1

H1: σ2 ≠ σ 20

α

0

α

2

a

2

b

Región de rechazo: s c2 < k1 o s c2 > k2

k1 =

a σ 02 n −1

,

k2 =

b σ 02 n −1

223

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: σ2 = σ 20

χ 2n −1

H1: σ2 > σ 20

α

0

b

Región de rechazo: s c2 > k

k =

b σ 02 n −1

224

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): 2

H0: σ = σ

χ 2n −1

2 0

H1: σ2 < σ 20

α

0

a

Región de rechazo: s c2 < k

k =

a σ 02 n −1

225

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 3, apartado a: La Dirección General de Tráfico está haciendo un estudio sobre la velocidad a la que se circula por un determinado punto negro. Se sabe que la velocidad sigue una distribución normal de parámetros desconocidos, y se ha obtenido una muestra aleatoria simple de 10 coches, en la que la cuasivarianza es igual a 0.29. Contrastar la hipótesis de que la varianza poblacional de la velocidad en dicho punto negro es igual a 0.8 frente a la alternativa de que es distinta de 0.8, con un nivel de significación del 5%.

226

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = velocidad al pasar por el punto negro ∼ N ( μ , σ ) * ¿ σ2 ? , μ desconocida * H0: σ2 = 0.8 H1: σ2 ≠ 0.8 * m.a.s. de tamaño n = 10





σ 2 = s c2 = 0.29

* nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que:

( 10 − 1) s c2 2 * ∼ χ 10 −1 2 σ

227

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que σ2 puede ser mayor, menor o igual a 0.8 * H0: σ2 = 0.8 → hipótesis propuesta ∧

2

* H1: σ ≠ 0.8 ⇒ me preocupa σ 2 = s c2 ≠ ≠ ≠ 0.8 * Regla de decisión: - Si s c2 < k1 o s c2 > k2 → - Si k1 < s c2 < k2



Rechazo

H0: σ2 = 0.8

No Rechazo H0: σ2 = 0.8

¿ k1 , k2 ?

228

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

2 χ 10 −1

2 .5 %

2 .5 %

0

2

2.7

4

6

8

10

12

14

16

18

20

19.02

22

24

26

* Los valores que delimitan la región de rechazo son: k1

=

k2 =

2.7 × 0.8 10 − 1

= 0.240

19.02 × 0.8 10 − 1

= 1.691

229

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* La regla de decisión es: - Si s c2 < 0.240 o s c2 > 1.691 → - Si

0.240 < s c2 < 1.691



Rechazo

H0: σ2 = 0.8

No Rechazo H0: σ2 = 0.8

* En la muestra s c2 = 0.29

∈ ( 0.240 , 1.691 )

y por lo tanto no rechazo que la varianza de la velocidad a la que los coches pasan por el punto negro sea igual a 0.8, frente a la alternativa de que no sea igual a 0.8, con un nivel de significación del 5%.

230

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 3, apartado b: Con los datos del apartado anterior, contrastar la hipótesis de que la varianza de la velocidad es igual a 0.8, frente a la alternativa de que es mayor que 0.8, con un nivel de significación del 5%. H0: σ2 = 0.8 H1: σ2 > 0.8 Procedimiento para hacer el contraste: * Sabemos que σ2 ≥ 0.8 ∧

2

* H1: σ > 0.8 ⇒ me preocupa σ 2 = s c2 >>> 0.8 * Regla de decisión: H0: σ2 = 0.8

- Si s c2 > k →

Rechazo

- Si s c2 < k →

No Rechazo H0: σ2 = 0.8 ¿k? 231

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

2 χ 10 −1

5%

0

2

4

6

8

10

12

14

16

18

16.92

20

22

24

26

* El valor que delimita la región de rechazo es:

16.92 × 0.8 k = = 1.504 10 − 1 * La regla de decisión es: H0: σ2 = 0.8

- Si s c2 > 1.504

→ Rechazo

- Si s c2 < 1.504

→ No Rechazo H0: σ2 = 0.8

* En la muestra

s c2 = 0.29 < 1.504

y por lo tanto no rechazo que la varianza de la velocidad a la que los coches pasan por el punto negro sea igual a 0.8, frente a la alternativa de que es mayor que 0.8, con un nivel de significación del 5%.

232

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 3, apartado c: Con los datos del apartado anterior, contrastar la hipótesis de que la varianza de la velocidad es igual a 0.8, frente a la alternativa de que es menor que 0.8, con un nivel de significación del 5%. H0: σ2 = 0.8 H1: σ2 < 0.8 Procedimiento para hacer el contraste: * Sabemos que σ2 ≤ 0.8 ∧

2

* H1: σ < 0.8 ⇒ me preocupa σ 2 = s c2 0.296

→ No Rechazo H0: σ2 = 0.8

* En la muestra

s c2 = 0.29 < 0.296

y por lo tanto rechazo que la varianza de la velocidad a la que los coches pasan por el punto negro sea igual a 0.8, frente a la alternativa de que es menor que 0.8, con un nivel de significación del 5%.

234

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.2.3 Contrastes para la media de la población con σ desconocida El problema:

• X∼N(μ,σ) • ¿ μ ? , σ desconocida • m.a.s. de tamaño n





_

μ = x , sc

_



x −μ ∼ t n −1 sc n

• nivel de significación = P ( ETI ) = α (dado)

235

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0: μ = μ0

tn −1

H1: μ ≠ μ0

α

α

2

-3

-2

−t

-1

0

1

t

2

2

3

Región de rechazo: _

_

x < k1 o x > k2

k1 = μ 0 − t

sc n

,

k 2 = μ0 + t

sc n

236

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: μ = μ0

tn −1

H1: μ > μ0 α

-3

-2

-1

0

1

t

2

3

Región de rechazo: _

x > k

k = μ0 + t

sc n

237

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: μ = μ0

tn −1

H1: μ < μ0

α

-3

-2

−t

-1

0

1

2

3

Región de rechazo: _

x < k

k = μ0 − t

sc n

238

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 4, apartado a: Una empresa de alquiler de automóviles sabe que el número de días al año que un vehículo de su flota pasa en el taller de reparaciones sigue una distribución normal. Ha recogido una muestra aleatoria simple de 9 coches y observado para cada coche el número de días que ha estado fuera de servicio durante el pasado año, obteniendo una media igual a 16.2 y una cuasivarianza igual a 22.9. Contrastar la hipótesis de que para el conjunto de la flota el número medio de días al año que los coches pasan en el taller es igual a 12, frente a la alternativa de que es distinto de 12, con un nivel de significación del 5%.

239

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = número de días al año que un coche pasa en el taller ∼ N ( μ , σ ) * ¿ μ ? , σ desconocida * H0: μ = 12 H1: μ ≠ 12 ∧

_

* m.a.s. de tamaño n = 9 → μ = x = 16.2 , s c2 = 22.9 , sc = +

22.9 = 4.785

* nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que: _

*

x −μ 4.785

∼ t 9 −1 9 240

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que μ puede ser mayor, menor o igual que 12 * H0: μ = 12 → hipótesis propuesta ∧

_

* H1: μ ≠ 12 ⇒ me preocupa μ = x ≠ ≠ ≠ 12 * Regla de decisión: _

_

- Si x < k1 o x > k2 _

- Si k1 < x < k2



Rechazo

H0: μ = 12



No Rechazo H0: μ = 12

¿ k1 , k2 ?

241

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

t 9−1

2 .5 %

2. 5 %

-3

− 2.3060

-2

-1

0

1

2

2.3060

3

* Los valores que delimitan la región de rechazo son:

k 1 = 12 − 2.3060

22.9 = 8.32 9

k 2 = 12 + 2.3060

22.9 = 15.68 9

242

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* La regla de decisión es: _

_

- Si x < 8.32 o x > 15.68 → _

- Si 8.32 < x < 15.68



Rechazo

H0: μ = 12

No Rechazo H0: μ = 12

* En la muestra _

x = 16.2

>

15.68

y por lo tanto rechazo que en promedio los coches de la empresa pasen 12 días al año en el taller de reparaciones frente a la alternativa de que no pasen 12 días, con un nivel de significación del 5%.

243

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 4, apartado b (Propuesto): Contrastar la hipótesis de que el número medio de días al año que un coche está fuera de servicio es igual a 12, frente a la alternativa de que es mayor que 12, con un nivel de significación del 5%. H0: μ = 12 H1: μ > 12 Solución: _

* Se rechaza la hipótesis nula cuando x > 14.97. _

* En la muestra x = 16.2 > 14.97, y por lo tanto rechazo que en promedio los coches de la empresa pasan 12 días al año en el taller de reparaciones frente a la alternativa de que pasan más tiempo, con un nivel de significación del 5%.

244

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 4, apartado c (Propuesto): Contrastar la hipótesis de que el número medio de días al año que están fuera de servicio es igual a 12, frente a la alternativa de que es menor que 12, con un nivel de significación del 5%. H0: μ = 12 H1: μ < 12 Solución: _

* Se rechaza la hipótesis nula cuando x < 9.03. *

_

En la muestra x = 16.2 > 9.03, y por lo tanto no rechazo que en promedio los

coches de la empresa pasan 12 días al año en el taller de reparaciones frente a la alternativa de que pasan menos tiempo, con un nivel de significación del 5%.

245

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.2.4 Contrastes para la diferencia de medias poblacionales con σx, σy conocidas El problema:

• Población 1: X ∼ N ( μx , σx )

μx desconocida , σx conocida • Población 2: Y ∼ N ( μy , σy )

μy desconocida , σy conocida • Las dos poblaciones son independientes entre sí.

246

Introducción a la Inferencia Estadística para Economía y Empresa

• m.a.s tamaño m de la población X • m.a.s tamaño n de la población Y

José Ramón Cancelo

→ →



_



_

μx = x μy = y

• Las dos muestras son independientes entre sí. _



_

( x − y) − (μ x − μ y ) σ σ + m n 2 x

2 y

∼ N ( 0 ,1)

• nivel de significación = P ( ETI ) = α (dado)

247

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0: μx - μy = φ0

N ( 0 ,1)

H1: μx - μy ≠ φ0 α

-3

α

2

-2

−z

-1

0

1

z

2

2

3

Región de rechazo: _

_

_

_

x− y < k1 o x− y > k2 k1 = φ0 − z

2 σ 2x σ y + m n

,

k 2 = φ0 + z

2 σ 2x σ y + m n

248

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: μx - μy = φ0

N ( 0 ,1)

H1: μx - μy > φ0

α

-3

-2

-1

0

1

z

2

3

Región de rechazo: _

_

x− y > k k = φ0 + z

2 σ 2x σ y + m n

249

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: μx - μy = φ0

N ( 0 ,1)

H1: μx - μy < φ0

α

-3

−z

-2

-1

0

1

2

3

Región de rechazo: _

_

x− y < k k = φ0 − z

2 σ 2x σ y + m n

250

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 5, apartado a:

La calificación final de los graduados del ámbito de humanidades se distribuye normal de media desconocida y desviación típica 0.5, en tanto que la de los graduados en ciencias de la salud sigue una distribución normal de media desconocida y desviación típica 0.9. Extraemos dos muestras aleatorias simples de forma independiente, una de 50 graduados del ámbito de humanidades cuya nota media es 5.3, y otra de 75 graduados del ámbito de ciencias de la salud, con nota media 5.9. Contrastar la hipótesis de que en el conjunto de graduados la nota media en el ámbito de humanidades menos la nota media en el ámbito de ciencias de la salud es igual a −0.2, frente a la alternativa de que es mayor que −0.2, con un nivel de significación del 10%.

251

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = nota de los graduados del ámbito de humanidades ∼ N ( μx , 0.5 ) * ¿ μx ? , σx = 0.5 conocida * Y = nota de los graduados del ámbito de ciencias de la salud ∼ N ( μy , 0.9 ) * ¿ μy ? , σy = 0.9 conocida *

H0: μx − μy = −0.2 H1: μx − μy > −0.2

* m.a.s tamaño m = 50 de la población X * m.a.s tamaño n = 75 de la población Y

→ →



_



_

μ x = x = 5.3

μ y = y = 5.9

* nivel de significación = P ( ETI ) = α = 0.10 Además, se sabe que: _

*

_

( x − y) − (μ x − μ y ) 2

2

0.5 0.9 + 50 75

∼ N ( 0 ,1) 252

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que μx − μy ≥ −0.2 * H0: μx − μy = −0.2 → hipótesis propuesta _

_

* H1: μx − μy > −0.2 ⇒ me preocupa x− y >>> −0.2 * Regla de decisión: _

_

_

_

- Si x− y > k - Si x− y < k



Rechazo

H0: μx − μy = −0.2



No Rechazo H0: μx − μy = −0.2 ¿k?

253

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

N ( 0 ,1)

10%

-3

-2

-1

0

1

1.28

2

3

* El valor que delimita la región de rechazo es: k = − 0.2 + 1.28

0.5 2 0.9 2 + = − 0.04 50 75

* La regla de decisión es: _

_

- Si x− y > −0.04 _



_

- Si x− y < −0.04 → * En la muestra

_

H0: μx − μy = −0.2

Rechazo

No Rechazo H0: μx − μy = −0.2 _

x− y = −0.6


0.01. *

_

_

En la muestra x− y = −0.6 < −0.41, y por lo tanto rechazo que la diferencia de

notas medias es igual a −0.2 frente a la alternativa de que sea distinta de −0.2, con un nivel de significación del 10%. 255

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 5, apartado c (Propuesto):

Contrastar la hipótesis de que la nota media de los graduados en el ámbito de humanidades menos la nota media de los graduados en ciencias de la salud es igual a −0.2, frente a la alternativa de que es menor que −0.2, con un nivel de significación del 10%. H0: μx − μy = −0.2 H1: μx − μy < −0.2 Solución: _

_

* Se rechaza la hipótesis nula cuando x− y < −0.36. *

_

_

En la muestra x− y = −0.6 < −0.36, y por lo tanto rechazo que la diferencia de

notas medias es igual a −0.2 frente a la alternativa de que sea menor que −0.2, con un nivel de significación del 10%. 256

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.2.5 Contrastes para la diferencia de medias poblacionales con σx, σy desconocidas e iguales El problema: • Población 1: X ∼ N ( μx , σx ) μx desconocida , σx desconocida • Población 2: Y ∼ N ( μy , σy ) μy desconocida , σy desconocida • Las dos poblaciones son independientes entre sí. • Las dos poblaciones tienen la misma desviación típica: σx = σy = σ

257

Introducción a la Inferencia Estadística para Economía y Empresa

• m.a.s tamaño m de la población X • m.a.s tamaño n de la población Y

José Ramón Cancelo

→ →



_



_

μx = x ,

μy = y ,

s c2,x

s c2, y

• Las dos muestras son independientes entre sí. _



_

( x − y) − (μ x − μ y ) (m − 1) s

2 c,x

+ (n − 1) s

m+n −2

2 c,y

1 1 + m n

∼ t m+n−2

• nivel de significación = P ( ETI ) = α (dado)

258

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): t m+ n −2

H0: μx - μy = φ0 H1: μx - μy ≠ φ0

α

-3

Región de rechazo: _

_

_

α

2

-2

−t

-1

0

1

t

2

2

3

_

x− y < k1 o x− y > k2

k1 = φ0 − t

k 2 = φ0 + t

(m − 1) s c2,x + (n − 1) s c2, y m+n −2 (m − 1) s c2,x + (n − 1) s c2, y m+n −2

1 1 + m n 1 1 + m n 259

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): t m+ n −2

H0: μx - μy = φ0 H1: μx - μy > φ0

α

-3

-2

-1

0

1

t

2

3

Región de rechazo: _

_

x− y > k k = φ0 + t

(m − 1) s c2,x + (n − 1) s c2, y m+n −2

1 1 + m n

260

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: μx - μy = φ0

t m+ n −2

H1: μx - μy < φ0

α

-3

-2

−t

-1

0

1

2

3

Región de rechazo: _

_

x− y < k k = φ0 − t

(m − 1) s c2,x + (n − 1) s c2, y m+n −2

1 1 + m n

261

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 6, apartado a:

Una agencia de control alimentario está analizando el contenido de grasa de las hamburguesas de las dos cadenas de restaurantes de comida rápida con mayor cuota de mercado, Fastfood y Quickmeal. Para ello ha seleccionado dos muestras aleatorias simples independientes, una de cada cadena. La muestra de Fastfood está compuesta por 8 hamburguesas, con un contenido medio de grasa igual a 31.3 gramos y una cuasivarianza igual a 4.41. Por su parte, en la muestra de Quickmeal, de 15 hamburguesas, se obtuvo una media de 33.2 gramos y una cuasivarianza igual a 3.24. Suponiendo que el contenido de grasa de las hamburguesas producidas por estas dos cadenas se distribuye normal con la misma desviación típica, contrastar la hipótesis de que la diferencia del contenido medio de grasa en gramos (Fastfood − Quickmeal) es igual a 0.5, frente a la alternativa de que es menor que 0.5, con un nivel de significación del 10%. 262

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = contenido de grasa de las hamburguesas de Fastfood ∼ N ( μx , σx ) * μx , σx desconocidas * Y = contenido de grasa de las hamburguesas de Quickmeal ∼ N ( μy , σy ) * μy , σy desconocidas * σx = σy = σ * H0: μx − μy = 0.5 H1: μx − μy < 0.5

263

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo



_

* m.a.s. de tamaño m = 8 de la población X → μ x = x = 31.3 , s c2,x = 4.41 ∧

_

* m.a.s. de tamaño n = 15 de la población Y → μ y = y = 33.2 , s c2, y = 3.24 * nivel de significación = P ( ETI ) = α = 0.10 Además, se sabe que: _

*

_

( x − y) − (μ x − μ y ) (8 − 1) 4.41 + (15 − 1) 3.24 8 + 15 − 2

1 1 + 8 15

∼ t 8 + 15 − 2

264

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que μx − μy ≤ 0.5 * H0: μx − μy = 0.5 → hipótesis propuesta _

_

* H1: μx − μy < 0.5 ⇒ me preocupa x− y −0.60 →

Rechazo

H0: μx − μy = 0.5

No Rechazo H0: μx − μy = 0.5

266

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* En la muestra _

_

x− y = −1.9 < −0.60 y por lo tanto rechazo que en promedio las hamburguesas de Fastfood tengan medio gramo de grasa más que las de Quickmeal, frente a la alternativa de que la diferencia es menor que 0.5, con un nivel de significación del 10%.

267

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 6, apartado b (Propuesto):

Contrastar la hipótesis de que en promedio las hamburguesas de Fastfood tienen medio gramo más de grasa que las hamburguesas de Quickmeal, frente a la alternativa de que la diferencia de medias es distinta de 0.5, con un nivel de significación del 10%. H0: μx − μy = 0.5 H1: μx − μy ≠ 0.5 Solución: _

_

_

_

* Se rechaza la hipótesis nula cuando x− y < −0.94 o x− y > 1.94. *

_

_

En la muestra x− y = −1.9 < −0.94, y por lo tanto rechazo que en promedio las

hamburguesas de Fastfood tengan medio gramo más de grasa que las de Quickmeal, frente a la alternativa de que la diferencia es distinta de 0.5, con un nivel de significación del 10%. 268

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 6, apartado c (Propuesto):

Contrastar la hipótesis de que la diferencia del contenido medio de grasa en gramos (Fastfood − Quickmeal) es igual a 0.5, frente a la alternativa de que es mayor que 0.5, con un nivel de significación del 10%. H0: μx − μy = 0.5 H1: μx − μy > 0.5 Solución: _

_

* Se rechaza la hipótesis nula cuando x− y > 1.60. _

_

* En la muestra x− y = −1.9 < 1.60, y por lo tanto no rechazo que en promedio las hamburguesas de Fastfood tengan medio gramo más de grasa que las de Quickmeal, frente a la alternativa de que la diferencia Fastfood − Quickmeal sea mayor que 0.5, con un nivel de significación del 10%. 269

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.2.6 Contrastes para el cociente de varianzas poblacionales El problema: • Población 1: X ∼ N ( μx , σx ) μx desconocida , σx desconocida • Población 2: Y ∼ N ( μy , σy ) μy desconocida , σy desconocida • Las dos poblaciones son independientes entre sí.

270

Introducción a la Inferencia Estadística para Economía y Empresa

• m.a.s tamaño m de la población X • m.a.s tamaño n de la población Y

José Ramón Cancelo

→ →



σ 2x = s c2,x ∧

σ 2y = s c2, y

• Las dos muestras son independientes entre sí s c2,x



s

2 c,y

σ 2x

∼ F nm−−11

σ 2y

• nivel de significación = P ( ETI ) = α (dado)

271

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0:

H1:

σ σ σ σ

2 x 2 y

F nm−1−1

= τ0

α

2 α

2 x 2 y

≠ τ0 0

a

2

b

Región de rechazo: s c2,x s

2 c,y

< k1 o

k1 = a τ0

s c2,x s

2 c,y

> k2

, k 2 = b τ0

272

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0:

H1:

σ σ σ σ

2 x 2 y 2 x 2 y

F nm−1−1

= τ0 α

> τ0 0

b

Región de rechazo: s c2,x s

2 c,y

> k

k = b τ0

273

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”):

H0:

σ 2x σ 2y

F nm−1−1

= τ0 α

H1:

σ σ

2 x 2 y

< τ0 0

a

Región de rechazo: s c2,x s

2 c,y

< k

k = a τ0

274

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 7, apartado a:

El primer salario de los graduados en sociología sigue una distribución normal de parámetros desconocidos, al igual que el primer salario de los graduados en informática. Hemos extraído dos muestras aleatorias simples independientes, una de 10 de graduados en sociología y otra de 16 de graduados en informática, en las que obtuvimos cuasivarianzas muestrales iguales a 42849 y 91204, respectivamente. Contrastar la hipótesis de que las varianzas poblacionales de los primeros salarios son iguales frente a la alternativa de que son diferentes, con un nivel de significación del 5%.

275

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = primer salario de los graduados en sociología ∼ N ( μx , σx ) * μx , σx desconocidas * Y = primer salario de los graduados en informática ∼ N ( μy , σy ) * μy , σy desconocidas * H0:

H1:

σ 2x σ

2 y

σ 2x σ

2 y

= 1

≠ 1

276

Introducción a la Inferencia Estadística para Economía y Empresa

* m.a.s de tamaño m = 10 de la población X * m.a.s de tamaño n = 16 de la población Y

José Ramón Cancelo

→ →



σ 2x = s c2,x = 42849 ∧

σ 2y = s c2, y = 91204

* nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que: s c2,x

*

s c2, y

σ 2x

∼ F1610−−11

σ 2y

277

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que

* H0:

* H1:

σ 2x σ

2 y

σ 2x σ 2y

σ 2x σ

puede ser mayor, menor o igual que 1

2 y

= 1 → hipótesis propuesta

≠ 1 ⇒ me preocupa

s c2,x s c2, y

≠≠≠ 1

* Regla de decisión: - Si

s c2,x s

2 c,y

- Si k1
k2



Rechazo



H0:

No Rechazo H0:

σ 2x σ

2 y

σ 2x σ 2y

= 1

= 1

¿ k1 , k2 ? 278

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

F1610−−11 2 .5 %

2 .5 %

0

0.265

1

2

3

3.12

4

Para obtener el valor de a se ha hecho uso de la propiedad de la distribución F, por la cual:

(

P F nm−−11 < a

)=

0.025



1 ⎞ ⎛ P ⎜ F mn −−11 > ⎟ = 0.025 a ⎠ ⎝

279

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* Los valores que delimitan la región de rechazo son:

k 1 = 0.265 × 1 = 0.265 k 2 = 3.12 × 1 = 3.12 * La regla de decisión es: - Si

s c2,x s

2 c,y

< 0.265 o

- Si 0.265
3.12 →

< 3.12

2 c,y



Rechazo

H0:

No Rechazo H0:

σ 2x σ

2 y

σ 2x σ

2 y

= 1

= 1

* En la muestra

s c2,x s

2 c,y

=

42849 = 0.47 91204

∈ ( 0.265 , 3.12 )

y por lo tanto no rechazo que las varianzas poblacionales de los primeros salarios sean iguales frente a la alternativa de que son distintas, con un nivel de significación del 5%. 280

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 7, apartado b (Propuesto): Contrastar la hipótesis de que las varianzas de los primeros salarios son iguales frente a la alternativa de que la varianza del primer salario de los graduados en sociología es mayor, con un nivel de significación del 5%.

σ 2x

H0:

σ

2 y

= 1

,

H1:

σ 2x σ

2 y

> 1

Solución: * Se rechaza la hipótesis nula cuando

*

En la muestra

s c2,x s c2, y

=

s c2,x s

2 c,y

> 2.59.

42849 = 0.47 < 2.59, y por lo tanto no rechazo que las 91204

varianzas poblacionales de los primeros salarios sean iguales frente a la alternativa de que la varianza del primer salario de los graduados en sociología es mayor, con un nivel de significación del 5%.

281

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 7 apartado c (Propuesto): Contrastar la hipótesis de que las varianzas de los primeros salarios son iguales frente a la alternativa de que la varianza del primer salario de los graduados en sociología es menor, con un nivel de significación del 5%. H0:

σ 2x σ

2 y

= 1

,

H1:

σ 2x σ

2 y

< 1

Solución: * Se rechaza la hipótesis nula cuando

* En la muestra

s c2,x s c2, y

=

s c2,x s

2 c,y

< 0.332.

42849 = 0.47 > 0.332, y por lo tanto no rechazo que las 91204

varianzas poblacionales de los primeros salarios sean iguales frente a la alternativa de que la varianza del primer salario de los graduados en sociología es menor, con un nivel de significación del 5%.

282

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.3 ALGUNOS CONTRASTES DE HIPOTESIS PARA MUESTRAS GRANDES 3.3.1 Contrastes para la proporción poblacional El problema: • Población X ∼ B ( 1 , p ) xi

1

0

P ( X = xi )

p

1-p

• ¿p? • m.a.s de tamaño n ( → ∞ )





_

p (= x )





p−p ⎯n⎯ ⎯→ N ( 0 , 1 ) →∞ p (1 − p) n

• nivel de significación = P ( ETI ) = α (dado)

283

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0: p = p0

N ( 0 ,1)

H1: p ≠ p0

α

-3

α

2

-2

−z

-1

0

1

z

2

2

3

Región de rechazo: ∧

p < k1

o

k1 = p 0 − z



p > k2 p 0 (1 − p 0 ) n

,

k 2 = p0 + z

p 0 (1 − p 0 ) n

284

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: p = p0

N ( 0 ,1)

H1: p > p0

α

-3

-2

-1

0

1

z

2

3

Región de rechazo: ∧

p > k k = p0 + z

p 0 (1 − p 0 ) n

285

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: p = p0

N ( 0 ,1)

H1: p < p0 α

-3

−z

-2

-1

0

1

2

3

Región de rechazo: ∧

p < k k = p0 − z

p 0 (1 − p 0 ) n

286

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 8, apartado a: En un congreso de expertos se ha llegado al consenso de que el 60% de los hogares de A Coruña están abonados a la televisión de pago mediante cualquiera de las tecnologías actualmente disponibles en el mercado. Para evaluar la validez de esta conclusión hemos extraído una muestra aleatoria simple de 200 hogares, en la que obtenemos una proporción de abonados del 53%. Contrastar la hipótesis de que la proporción de abonados en los hogares de A Coruña es igual a 60%, frente a la alternativa de que es mayor del 60%, con un nivel de significación del 5%.

287

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = estar abonado a la televisión de pago ∼ B ( 1 , p ) * ¿p? * H0: p = 0.6 H1: p > 0.6 ∧

* m.a.s. de tamaño n = 200 ⇒ muestra grande → p = 0.53 * nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que: ∧

*

p−p ⎯⎯ ⎯→ N ( 0 , 1 ) n →∞ p (1 − p) 200

288

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que p ≥ 0.6 * H0: p = 0.6 → hipótesis propuesta ∧

* H1: p > 0.6 ⇒ me preocupa p >>> 0.6 * Regla de decisión: ∧

- Si p > k ∧

- Si p < k



Rechazo



No Rechazo H0: p = 0.6

H0: p = 0.6

¿k?

289

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

N ( 0 ,1)

5%

-3

-2

-1

0

1

1.64

2

3

* El valor que delimita la región de rechazo es: k = 0.6 + 1.64

0.6 (1 − 0.6) = 0.657 200

* La regla de decisión es: - Si - Si



p > 0.657 ∧

p < 0.657

* En la muestra



Rechazo



No Rechazo H0: p = 0.6



p = 0.53


0.668. *



En la muestra p = 0.53 < 0.532, y por lo tanto rechazo que la proporción de

abonados en A Coruña sea igual a 0.6 frente a la alternativa de que sea distinta de 0.6, con un nivel de significación del 5%.

291

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 8, apartado c (Propuesto):

Contrastar la hipótesis de que la proporción de abonados en A Coruña es igual a 60%, frente a la alternativa de que es menor que 60%, con un nivel de significación del 5%. H0: p = 0.6 H1: p < 0.6 Solución: ∧

* Se rechaza la hipótesis nula cuando p < 0.543. ∧

* En la muestra p = 0.53 < 0.543, y por lo tanto rechazo que la proporción de abonados en A Coruña sea igual a 0.6 frente a la alternativa de que es menor que 0.6, con un nivel de significación del 5%.

292

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.3.2 Contrastes para el parámetro de una población Poisson El problema: • Población X ∼ Poisson con parámetro λ e − λ λx i P ( X = xi ) = xi !

, x i = 0, 1, 2, ...

• ¿λ? • m.a.s tamaño n (→∞)





_

λ (= x )





λ−λ ⎯⎯ ⎯→ N ( 0 , 1 ) n →∞ λ n

• nivel de significación = P ( ETI ) = α (dado) 293

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0 : λ = λ0

N ( 0 ,1)

H1: λ ≠ λ0 α

-3

α

2

-2

−z

-1

0

1

z

2

2

3

Región de rechazo: ∧

λ < k1

o

k1 = λ 0 − z



λ > k2

λ0 n

,

k 2 = λ0 + z

λ0 n

294

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0 : λ = λ 0

N ( 0 ,1)

H1 : λ > λ 0

α

-3

-2

-1

0

1

z

2

3

Región de rechazo: ∧

λ > k

k = λ0 + z

λ0 n

295

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0 : λ = λ 0

N ( 0 ,1)

H1 : λ < λ 0 α

-3

−z

-2

-1

0

1

2

3

Región de rechazo: ∧

λ < k

k = λ0 − z

λ0 n

296

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 9, apartado a:

El número de camiones que llega diariamente a una terminal portuaria se distribuye Poisson con parámetro desconocido. Extraemos una muestra aleatoria simple de 300 días, en la que obtenemos un promedio diario igual a 11.3 camiones. Contrastar la hipótesis de que el parámetro desconocido de la distribución de probabilidad es igual a 10 frente a la alternativa de que es menor que 10, con un nivel de significación del 1%.

297

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = número diario de camiones ∼ Poisson con parámetro λ * ¿λ? * H0: λ = 10 H1: λ < 10 ∧

_

* m.a.s. de tamaño n = 300 ⇒ muestra grande → λ = x = 11.3 * nivel de significación = P ( ETI ) = α = 0.01 Además, se sabe que: ∧

*

λ−λ ⎯⎯ ⎯→ N ( 0 , 1 ) n →∞ λ 300 298

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que λ ≤ 10 * H0: λ = 10 → hipótesis propuesta ∧

* H1: λ < 10 ⇒ me preocupa λ 9.57

* En la muestra



Rechazo

H0: λ = 10



No Rechazo H0: λ = 10



λ = 11.3 > 9.57

y por lo tanto no rechazo que el parámetro de la distribución Poisson sea igual a 10 frente a la alternativa de que es menor que 10, con un nivel de significación del 1%. 300

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 9, apartado b (Propuesto): Contrastar la hipótesis de que el parámetro desconocido de la distribución de probabilidad es igual a 10 frente a la alternativa de que es distinto de 10, con un nivel de significación del 1%. H0: λ = 10 H1: λ ≠ 10 Solución: ∧



* Se rechaza la hipótesis nula cuando λ < 9.53 o λ > 10.47. *



En la muestra λ = 11.3 > 10.47, y por lo tanto rechazo que el parámetro de la

distribución Poisson sea igual a 10 frente a la alternativa de que es distinto de 10, con un nivel de significación del 1%.

301

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 9, apartado c (Propuesto): Contrastar la hipótesis de que el parámetro desconocido de la distribución de probabilidad es igual a 10 frente a la alternativa de que es mayor que 10, con un nivel de significación del 1%. H0: λ = 10 H1: λ > 10 Solución: ∧

* Se rechaza la hipótesis nula cuando λ > 10.43. ∧

* En la muestra λ = 11.3 > 10.43, y por lo tanto rechazo que el parámetro de la distribución Poisson sea igual a 10 frente a la alternativa de que es mayor que 10, con un nivel de significación del 1%.

302

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

3.3.3 Contrastes para la diferencia de proporciones poblacionales y muestras independientes El problema: • Población 1: X ∼ B ( 1 , px ) xi

1

0

P ( X = xi )

px

1-px

yi

1

0

P ( Y = yi )

py

1-py

• Población 2: Y ∼ B ( 1 , py )

• Las dos poblaciones son independientes entre sí. 303

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo



• m.a.s de tamaño m de la población X → ( X1, X2, …, Xm ) → p x • m.a.s de tamaño n de la población Y



→ ( Y1, Y2, …, Yn ) → p y

• Las dos muestras son independientes entre sí. ∧





( px − py ) − ( px − py ) p y (1 − p y ) p x (1 − p x ) + m n

⎯⎯ ⎯ ⎯→ N ( 0 , 1 ) m ,n → ∞

• nivel de significación = P ( ETI ) = α (dado)

304

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO A (“dos colas”): H0: px - py = δ0

N ( 0 ,1)

H1: px - py ≠ δ0

α

-3

α

2

-2

−z

-1

0

1

z

2

2

3

Región de rechazo: ∧



p x − p y < k1 k1 = δ 0 − z k 2 = δ0 + z





p x − p y > k2

o ∧















p y (1 − p y ) p x (1 −p x ) + m n p y (1 −p y ) p x (1 −p x ) + m n 305

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO B (“cola derecha”): H0: px - py = δ0

N ( 0 ,1)

H1: px - py > δ0 α

-3

-2

-1

0

1

z

2

3

Región de rechazo: ∧



px − py > k ∧

k = δ0 + z







p y (1 −p y ) p x (1 −p x ) + m n

306

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

CASO C (“cola izquierda”): H0: px - py = δ0

N ( 0 ,1)

H1: px - py < δ0 α

-3

−z

-2

-1

0

1

2

3

Región de rechazo: ∧



px − py < k ∧

k = δ0 − z







p y (1 −p y ) p x (1 −p x ) + m n

307

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 10, apartado a:

La Xunta de Galicia está realizando un estudio sobre el consumo habitual de productos lácteos por grupos de edad. En una muestra de 600 personas entre 35 y 44 años se obtuvo que el 42% de los encuestados consumía habitualmente este tipo de productos, en tanto que en una muestra de 400 individuos entre 45 y 64 años el porcentaje fue del 34%. Contrastar la hipótesis de que en el conjunto de la población la proporción de consumidores en la franja de edad 35-44 años es un 3% más alta que en la franja 45-64 años, frente a la alternativa de que la diferencia es distinta del 3%, con un nivel de significación del 5%.

308

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Datos del problema: * X = consumir habitualmente productos lácteos en la franja de edad 35-44 ∼ B ( 1 , px ) * Y = consumir habitualmente productos lácteos en la franja de edad 45-64 ∼ B ( 1 , py ) * ¿ px − py ? * H0: px − py = 0.03 H1: px − py ≠ 0.03 ∧

* m.a.s. de tamaño m = 600 de la población X ⇒ muestra grande → p x = 0.42 ∧

* m.a.s. de tamaño n = 400 de la población Y ⇒ muestra grande → p y = 0.34 * nivel de significación = P ( ETI ) = α = 0.05 Además, se sabe que: ∧

*



( px − py ) − ( px − py ) p y (1 − p y ) p x (1 − p x ) + 600 400

⎯⎯ ⎯ ⎯→ N ( 0 , 1 ) m ,n → ∞ 309

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Procedimiento para hacer el contraste: * Sabemos que px − py puede ser mayor, menor o igual que 0.03 * H0: px − py = 0.03 → hipótesis propuesta ∧



* H1: px − py ≠ 0.03 ⇒ me preocupa p x − p y ≠ ≠ ≠ 0.03 * Regla de decisión: ∧







- Si p x − p y < k1 o p x − p y > k2 ∧



- Si k1 < p x − p y < k2



Rechazo

H0: px − py = 0.03



No Rechazo H0: px − py = 0.03

¿ k1 , k2 ?

310

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

N ( 0 ,1)

2 .5 %

2 .5 %

-3

-2

− 1.96

-1

0

1

2

1.96

3

* Los valores que delimitan la región de rechazo son: k 1 = 0.03 − 1.96

0.42 (1 − 0.42) 0.34 (1 − 0.34) + = − 0.031 600 400

k 2 = 0.03 + 1.96

0.42 (1 − 0.42) 0.34 (1 − 0.34) + = 0.091 600 400

311

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

* La regla de decisión es: ∧







- Si p x − p y < −0.031 o p x − p y > 0.091 → ∧



- Si −0.031 < p x − p y < 0.091



Rechazo

H0: px − py = 0.03

No Rechazo H0: px − py = 0.03

* En la muestra ∧



p x − p y = 0.08

∈ (−0.031 , 0.091 )

y por lo tanto no rechazo que la proporción de consumidores en la franja de edad 35-44 sea un 3% más alta que en la franja 45-64, frente a la alternativa de que la diferencia sea distinta del 3%, con un nivel de significación del 5%.

312

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 10, apartado b (Propuesto): Contrastar la hipótesis de que en la franja de edad 35-44 años la proporción de consumidores es un 3% más alta que en la franja 45-64 años, frente a la alternativa de que la diferencia es mayor del 3%, con un nivel de significación del 5%. H0: px − py = 0.03 H1: px − py > 0.03 Solución: ∧



* Se rechaza la hipótesis nula cuando p x − p y > 0.081. ∧



* En la muestra p x − p y = 0.08 < 0.081, y por lo tanto no rechazo que la proporción de consumidores en la franja de edad 35-44 sea un 3% más alta que en la franja 45-64, frente a la alternativa de que la diferencia es mayor del 3%, con un nivel de significación del 5%. 313

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

Ejemplo 10, apartado c (Propuesto): Contrastar la hipótesis de que en la franja de edad 35-44 años la proporción de consumidores es un 3% más alta que en la franja 45-64 años, frente a la alternativa de que la diferencia es menor del 3%, con un nivel de significación del 5%. H0: px − py = 0.03 H1: px − py < 0.03 Solución: ∧



* Se rechaza la hipótesis nula cuando p x − p y < −0.021. ∧



* En la muestra p x − p y = 0.08 > −0.021, y por lo tanto no rechazo que la proporción de consumidores en la franja de edad 35-44 sea un 3% más alta que en la franja 45-64, frente a la alternativa de que la diferencia es menor del 3%, con un nivel de significación del 5%. 314

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIOS PROPUESTOS DE CONTRASTES DE HIPOTESIS EJERCICIO 1

El peso de los mejillones que hay en una lata de mejillones en escabeche es una variable aleatoria que sigue una distribución normal de media desconocida, desviación típica 106 gramos y varianza 11236. La hipótesis nula es que el peso medio en la población es igual a 136 gramos, y para contrastarla hemos extraído una muestra aleatoria simple de 17 latas, obteniendo una media igual a 192.5 gramos, una cuasidesviación típica igual a 109.9, y una cuasivarianza igual a 12078.01. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es distinta de 136, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la media muestral sea menor que 85.61 o mayor que 186.39. En este caso es igual a 192.5, y por lo tanto se rechaza la hipótesis nula. 315

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 2

Una empresa de comercio electrónico sabe que el número de visitantes por hora de su página web sigue una distribución normal con parámetros desconocidos. La hipótesis nula es que el número medio de visitas por hora es igual a 345. Para contrastarla hemos obtenido una muestra aleatoria simple de 15 intervalos horarios, en los cuales ha habido 295.8 visitas de media, con una cuasidesviación típica de 110.4, y una cuasivarianza de 12188.16. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es mayor que 345, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la media muestral sea mayor que 395.21. En este caso es igual a 295.8, y por lo tanto no se rechaza la hipótesis nula.

316

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 3

El número anual de horas extras que trabaja un empleado de los servicios de urgencia sigue una distribución normal de parámetros desconocidos. La hipótesis nula es que la varianza poblacional es igual a 106385, y para contrastarla hemos obtenido una muestra aleatoria simple de 13 empleados, en la que la media es igual a 335.4 horas, la cuasidesviación típica es 209.4, y la cuasivarianza 43848.36. Considerando un nivel de significación del 1%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la varianza en la población es menor que 106385, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la cuasivarianza muestral sea menor que 31649.54. En este caso es igual a 43848.36, y por lo tanto no se rechaza la hipótesis nula. 317

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 4

El número diario de accidentes de trabajo de cierta gravedad en España se distribuye Poisson con parámetro desconocido. La hipótesis nula es que la media diaria es igual a 13. Para contrastarla hemos obtenido una muestra aleatoria simple de 140 días, con una media de 13.6 accidentes, cuasidesviación típica igual a 6.4, y cuasivarianza 40.96. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es mayor que 13, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la media muestral sea mayor que 13.50. En este caso es igual a 13.6, y por lo tanto se rechaza la hipótesis nula.

318

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 5 En un país de la Unión Europea hay varias empresas que ofrecen conexión a internet mediante el teléfono móvil, y entre ellas están Intermovil y Moviltenet. Sabemos que el número de días que un cliente de Intermovil mantiene su relación con la empresa antes de pasarse a la competencia se distribuye normal con parámetros desconocidos, y lo mismo ocurre con un cliente de Moviltenet. También se sabe que las desviaciones típicas poblacionales son iguales en las dos compañías. La hipótesis nula es que la diferencia en el tiempo medio de permancencia (Intermovil menos Moviltenet) es igual a -58.3 días. Para contrastarla hemos extraído una muestra aleatoria simple de 10 antiguos clientes de Intermovil, con un tiempo medio igual a 165 días, cuasidesviación típica 105, y cuasivarianza 11025. De forma independiente, se obtuvo una muestra aleatoria simple de 7 antiguos clientes de Moviltenet, con media 165.6 días, cuasidesviación típica 44, y cuasivarianza 1936. Considerando un nivel de significación del 1%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de medias poblacionales es menor que -58.3, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la diferencia de medias muestrales sea menor que -168.55. En este caso es igual a -0.6, y por lo tanto no se rechaza la hipótesis nula. 319

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 6 Dos materias primas, A y B, se negocian diariamente en los mercados internacionales. El precio diario de A, en euros por tonelada, sigue una distribución normal de parámetros desconocidos, y lo mismo ocurre con el de B, también expresado en euros por tonelada. La hipótesis nula es que el cociente de las varianzas poblacionales (precio diario de A entre precio diario de B) es igual a 0.9. Para contrastarla hemos extraído dos muestras aleatorias simples independientes de cada precio. De la materia prima A tenemos una muestra de 10 días, en los que observamos un precio medio de 328.4 euros por tonelada, cuasidesviación típica 150, y cuasivarianza 22500. En la materia prima B la muestra es de 13 días, la media 381.4 euros / tonelada, la cuasidesviación típica 156, y la cuasivarianza 24336. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que el cociente de las varianzas es menor que 0.9, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando el cociente de cuasivarianzas muestrales sea menor que 0.293. En este caso es igual a 0.925, y no se rechaza la hipótesis nula. 320

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 7 Una empresa vende una parte de su producción en el mercado español, y el resto en otros mercados de la Unión Europea (UE). Se sabe que las ventas mensuales en el mercado español siguen una distribuye normal, con media desconocida, desviación típica igual a 130 unidades monetarias (um) y varianza 16900. Por su parte, las ventas en los mercados internacionales también se distribuyen normal, con media desconocida, desviación típica 71 um y varianza 5041. La hipótesis nula es que la diferencia en las ventas medias poblacionales a los distintos mercados (español menos resto UE) es igual a 13.9 um. Para contrastarla se ha obtenido una muestra aleatoria simple de 6 meses para el mercado español, con los siguientes resultados para las ventas mensuales: media 263.2 um, cuasidesviación típica 139.3, y cuasivarianza 19404.49. Para el resto de la UE se obtuvo una muestra aleatoria simple de 4 meses: en promedio en cada mes se vendió por importe de 299.9 um, con una cuasidesviación típica igual a 66.4, y una cuasivarianza igual a 4408.96. Considerando un nivel de significación del 1%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de las medias poblacionales es distinta de 13.9, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la diferencia de medias muestrales sea menor que -150.83 o mayor que 178.63. En este caso es igual a -36.7, y por lo tanto no se rechaza la hipótesis nula. 321

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 8

El servicio técnico oficial de un fabricante de electrodomésticos tiene un teléfono 902, al que los clientes han de llamar cuando algún aparato se avería. Se sabe que el número de llamadas horarias que se reciben en este teléfono se distribuye Poisson, aunque no se conoce el valor del parámetro de la distribución. La hipótesis nula es que el número medio de llamadas por hora es igual a 15, y para contrastarla hemos obtenido una muestra aleatoria simple de 100 intervalos horarios, con una media de 14.4 llamadas, cuasidesviación típica igual a 9.5, y cuasivarianza 90.25. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es distinta de 15, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la media muestral sea menor que 14.24 o mayor que 15.76. En este caso es igual a 14.4, y por lo tanto no se rechaza la hipótesis nula. 322

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 9

Un sindicato sabe que el salario semanal de los trabajadores en la industria alimentaria sigue una distribución normal de parámetros desconocidos. Su objetivo es medir la dispersión salarial, y su hipótesis nula es que la varianza poblacional es igual a 8145. Para contrastar esta hipótesis hemos obtenido una muestra aleatoria simple de 10 trabajadores, en la que la media es igual a 148.4 euros, la cuasidesviación típica es 47.5, y la cuasivarianza 2256.25. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la varianza en la población es distinta de 8145, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la cuasivarianza muestral sea menor que 2443.5 o mayor que 17213.1. En este caso es igual a 2256.25, y por lo tanto se rechaza la hipótesis nula. 323

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 10

El ayuntamiento de A Coruña está preocupado por el cumplimiento de la normativa sobre el aparcamiento regulado. La hipótesis nula es que solo el 44% de los automovilistas paga el tique de la ORA. Para contrastar esta hipótesis extraemos una muestra aleatoria simple de 160 automóviles aparcados en zona azul, en la que obtenemos una proporción muestral igual al 55.4%. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la proporción en la población es mayor que 44%, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la proporción muestral sea mayor que 50.44%. En este caso es igual a 55.4%, y por lo tanto se rechaza la hipótesis nula.

324

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 11

El importe de una compra con tarjeta de crédito es una variable aleatoria que sigue una distribución normal de media desconocida, desviación típica 243 euros y varianza 59049. La hipótesis nula es que el importe medio en la población es igual a 299 euros, y para contrastarla hemos obtenido una muestra aleatoria simple de 11 compras, con una media igual a 421 euros, una cuasidesviación típica igual a 275, y una cuasivarianza igual a 75625. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es mayor que 299, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la media muestral sea mayor que 419.16. En este caso es igual a 421, y por lo tanto se rechaza la hipótesis nula.

325

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 12

Una compañía aérea está considerando instalar en sus aviones el equipamiento necesario para que los viajeros puedan acceder a internet durante el vuelo. Dado que esto supone una inversión importante, sería necesario aumentar el precio del billete. La hipótesis nula es que el 67% de los viajeros está dispuesto a pagar un cargo adicional para tener internet. Para contrastar esta hipótesis obtiene una muestra aleatoria simple de 140 viajeros, en la que se observa una proporción muestral igual al 75.3%. Considerando un nivel de significación del 10%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la proporción en la población es menor que 67%, y realizar dicho contraste. Solución:

La hipótesis nula se rechazará cuando la proporción muestral sea menor que 61.91%. En este caso es igual a 75.3%, y por lo tanto no se rechaza la hipótesis nula. 326

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 13 Un gran grupo de distribución textil comercializa sus productos bajo dos marcas, Youngs y Classic. Se sabe que la facturación anual de una tienda de la marca Youngs es una variable aleatoria que se distribuye normal con parámetros desconocidos, al igual que las ventas anuales de una tienda Classic. También se sabe que las desviaciones típicas poblacionales son iguales en las dos marcas. La hipótesis nula es que la diferencia en las ventas anuales medias poblacionales (Youngs menos Classic) es igual a 70.9 unidades monetarias (um). Para contrastarla hemos extraído una muestra aleatoria simple de 8 tiendas de la marca Youngs, con unas ventas medias iguales a 200.4 um, cuasidesviación típica 60, y cuasivarianza 3600. De forma independiente, se obtuvo una muestra aleatoria simple de 5 tiendas de la marca Classic, con media 245.8 um, cuasidesviación típica 90, y cuasivarianza 8100. Considerando un nivel de significación del 1%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de las medias poblacionales es distinta de 70.9, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la diferencia de medias muestrales sea menor que -57.22 o mayor que 199.02. En este caso es igual a -45.4, y por lo tanto no se rechaza la hipótesis nula.

327

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 14 En el mes de junio muchas personas que perciben rentas de trabajo están obligadas a hacer la declaración del IRPF y, en caso de que salga positiva, a abonar una cantidad adicional a la que ya se les ha retenido. La cantidad que ha de abonar un trabajador asalariado que esté en esa situación es una variable aleatoria que se distribuye normal, con media desconocida, desviación típica igual a 99 euros y varianza 9801. Por su parte, la cantidad que han de pagar los trabajadores autónomos en las mismas circunstancias también se distribuye normal, con media desconocida, desviación típica 98 euros y varianza 9604. La hipótesis nula es que la diferencia en las cantidades medias a pagar en la población (asalariados menos autónomos) es igual a -30.1 euros. Para contrastarla se ha obtenido una muestra aleatoria simple de 10 asalariados, con los siguientes resultados para la cantidad adicional a pagar: media 257.4 euros, cuasidesviación típica 92, y cuasivarianza 8464. Para los autónomos se obtuvo una muestra aleatoria simple de 4 personas: en promedio cada uno ha de pagar 215.9 euros, con una cuasidesviación típica igual a 82.2, y una cuasivarianza igual a 6756.84. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de medias poblacionales es mayor que -30.1, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la diferencia de medias muestrales sea mayor que 65.26. En este caso es igual a 41.5, y por lo tanto no se rechaza la hipótesis nula.

328

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 15 Un consorcio de ayuntamientos está analizando la movilidad interurbana y las infraestructuras que habría que acometer para reducir los tiempos de desplazamiento. Se sabe que el tiempo que un trabajador de la zona emplea en ir y volver al trabajo (en minutos por semana) sigue una distribución normal con parámetros desconocidos. La hipótesis nula es que el tiempo medio por trabajador y semana en la población es igual a 329 minutos, y para contrastarla hemos obtenido una muestra aleatoria simple de 7 trabajadores. Los trabajadores de la muestra han tardado en promedio 459.6 minutos a la semana, con una cuasidesviación típica de 267.6, y una cuasivarianza de 71609.76. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la media en la población es menor que 329, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la media muestral sea menor que 132.46. En este caso es igual a 459.6, y por lo tanto no se rechaza la hipótesis nula. 329

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 16 El gasto mensual en alimentación de una familia gallega sigue una distribución normal de parámetros desconocidos, y lo mismo con el gasto en vestido y calzado. La hipótesis nula es que el cociente de las varianzas poblacionales (gasto mensual en alimentación entre gasto mensual en vestido y calzado) es igual a 2.2. Para contrastarla hemos extraído dos muestras aleatorias simples independientes de cada concepto de gasto. Para el gasto en alimentación tenemos una muestra de 15 familias, con un gasto medio de 235.9 euros, cuasidesviación típica 113, y cuasivarianza 12769. Para el gasto en vestido y calzado la muestra es de 9 familias, la media 227.7 euros, la cuasidesviación típica 118, y la cuasivarianza 13924. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que el cociente de las varianzas es distinto de 2.2, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando el cociente de cuasivarianzas muestrales sea menor que 0.669 o mayor que 9.086. En este caso es igual a 0.917, y por lo tanto no se rechaza la hipótesis nula. 330

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 17 Estamos analizando el grado de satisfacción con los distintos medios de transporte público interprovincial, para lo cual pedimos a los viajeros que hagan una valoración global del tiempo que dura el viaje, la comodidad y la puntualidad. La hipótesis nula es que la diferencia entre la proporción de viajeros satisfechos de los que viajan en tren, y la proporción de viajeros satisfechos entre los que viajan en autobús, es igual a 14.4%. Para contrastarla hemos obtenido una muestra aleatoria simple de 115 viajeros en tren, en la que observamos un 32.1% de satisfechos; entre los viajeros en autobús, la muestra aleatoria simple es de 215 personas, y el porcentaje de satisfechos del 13.7%. Considerando un nivel de significación del 5%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de proporciones poblacionales es distinta de 14.4%, y realizar dicho contraste. Solución: La hipótesis nula se rechazará cuando la diferencia de proporciones muestrales sea menor que 4.71% o mayor que 24.09%. En este caso es igual a 18.4%, y por lo tanto no se rechaza la hipótesis nula. 331

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

EJERCICIO 18 Dos cadenas de televisión, Cadena 12 y TV 19, estrenaron en la misma semana dos programas de contenidos muy similares; Cadena 12 lo hizo el martes, y TV 19 el jueves. La hipótesis nula es que la diferencia entre el porcentaje de espectadores del programa de Cadena 12 y el porcentaje de espectadores de la versión de TV 19 es igual a -21.5%. Para contrastarla hemos extraído una muestra aleatoria simple de 120 hogares que estaban viendo la televisión en el momento en que se emitió el programa de Cadena 12, y en la que observamos que el 67.6% estaba viendo el programa en cuestión. Hicimos lo mismo el jueves, y en una muestra aleatoria simple de 220 hogares había un 74.6% viendo el programa de TV 19. Considerando un nivel de significación del 10%, calcular la región de rechazo para contrastar la hipótesis nula frente a la alternativa de que la diferencia de proporciones poblacionales es menor que -21.5%, y realizar dicho contraste. Solución: La hipótesis nula se rechaza si la diferencia de proporciones muestrales es menor que -28.13%. En este caso es igual a -7%, y por lo tanto no se rechaza la hipótesis nula. 332

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

BIBLIOGRAFIA • Anderson, David, R.; Sweeney, Dennis, J.; y Williams, Thomas, A. (2001): Estadística para administración y economía, vol. II, International Thomson Editores, Madrid. • Casas Sánchez, José Miguel; Gutiérrez López, Pilar (2011): Estadística II: Inferencia Estadística, Editorial Universitaria Ramón Areces, Madrid. • Levin, Richard I.; y Rubin, David S. (2010): Estadística para administración y economía, Pearson, México. • Lind, Douglas, A.; Marchal, William G.; y Wathen, Samuel A. (2008): Estadística aplicada a los negocios y la economía, McGraw-Hill Interamericana, México. • Llorente Galera, Francisco; Martín Feria, Susana; y Torra Porras, Salvador (2001): Inferencia estadística aplicada a la empresa, Centro de Estudios Ramón Areces, Madrid. 333

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

• Martín-Pliego López, F. Javier; y Ruiz-Maya Pérez, Luis (2005): Fundamentos de Inferencia Estadística, Thomson Paraninfo, Madrid. • Newbold, Paul; Carlson, William L.; y Thorne, Betty M. (2013): Estadística para administración y economía, Pearson, Madrid. • Peña, Daniel (2008): Fundamentos de Estadística, Alianza Editorial, Madrid. • Triola, Mario F. (2013): Estadística, Pearson, México. • Weiers, Ronald M. (2006): Introducción a la estadística para negocios, Thomson, Madrid.

334

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

TABLAS ESTADISTICAS

335

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

P(X ≥ a) = p

DISTRIBUCION NORMAL (0,1)

p -3

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9

-2

-1

0

1

a

2

3

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.5000 0.4602 0.4207 0.3821 0.3446 0.3085 0.2743 0.2420 0.2119 0.1841 0.1587 0.1357 0.1151 0.0968 0.0808 0.0668 0.0548 0.0446 0.0359 0.0287 0.0228 0.0179 0.0139 0.0107 0.0082 0.0062 0.0047 0.0035 0.0026 0.0019

0.4960 0.4562 0.4168 0.3783 0.3409 0.3050 0.2709 0.2389 0.2090 0.1814 0.1562 0.1335 0.1131 0.0951 0.0793 0.0655 0.0537 0.0436 0.0351 0.0281 0.0222 0.0174 0.0136 0.0104 0.0080 0.0060 0.0045 0.0034 0.0025 0.0018

0.4920 0.4522 0.4129 0.3745 0.3372 0.3015 0.2676 0.2358 0.2061 0.1788 0.1539 0.1314 0.1112 0.0934 0.0778 0.0643 0.0526 0.0427 0.0344 0.0274 0.0217 0.0170 0.0132 0.0102 0.0078 0.0059 0.0044 0.0033 0.0024 0.0018

0.4880 0.4483 0.4090 0.3707 0.3336 0.2981 0.2643 0.2327 0.2033 0.1762 0.1515 0.1292 0.1093 0.0918 0.0764 0.0630 0.0516 0.0418 0.0336 0.0268 0.0212 0.0166 0.0129 0.0099 0.0075 0.0057 0.0043 0.0032 0.0023 0.0017

0.4840 0.4443 0.4052 0.3669 0.3300 0.2946 0.2611 0.2296 0.2005 0.1736 0.1492 0.1271 0.1075 0.0901 0.0749 0.0618 0.0505 0.0409 0.0329 0.0262 0.0207 0.0162 0.0125 0.0096 0.0073 0.0055 0.0041 0.0031 0.0023 0.0016

0.4801 0.4404 0.4013 0.3632 0.3264 0.2912 0.2578 0.2266 0.1977 0.1711 0.1469 0.1251 0.1056 0.0885 0.0735 0.0606 0.0495 0.0401 0.0322 0.0256 0.0202 0.0158 0.0122 0.0094 0.0071 0.0054 0.0040 0.0030 0.0022 0.0016

0.4761 0.4364 0.3974 0.3594 0.3228 0.2877 0.2546 0.2236 0.1949 0.1685 0.1446 0.1230 0.1038 0.0869 0.0721 0.0594 0.0485 0.0392 0.0314 0.0250 0.0197 0.0154 0.0119 0.0091 0.0069 0.0052 0.0039 0.0029 0.0021 0.0015

0.4721 0.4325 0.3936 0.3557 0.3192 0.2843 0.2514 0.2206 0.1922 0.1660 0.1423 0.1210 0.1020 0.0853 0.0708 0.0582 0.0475 0.0384 0.0307 0.0244 0.0192 0.0150 0.0116 0.0089 0.0068 0.0051 0.0038 0.0028 0.0021 0.0015

0.4681 0.4286 0.3897 0.3520 0.3156 0.2810 0.2483 0.2177 0.1894 0.1635 0.1401 0.1190 0.1003 0.0838 0.0694 0.0571 0.0465 0.0375 0.0301 0.0239 0.0188 0.0146 0.0113 0.0087 0.0066 0.0049 0.0037 0.0027 0.0020 0.0014

0.4641 0.4247 0.3859 0.3483 0.3121 0.2776 0.2451 0.2148 0.1867 0.1611 0.1379 0.1170 0.0985 0.0823 0.0681 0.0559 0.0455 0.0367 0.0294 0.0233 0.0183 0.0143 0.0110 0.0084 0.0064 0.0048 0.0036 0.0026 0.0019 0.0014

336

Introducción a la Inferencia Estadística para Economía y Empresa

DISTRIBUCION χ2

José Ramón Cancelo

P(X ≥ a) = p p Probabilidad

Grados de libertad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

a

0

0.995

0.99

0.975

0.95

0.90

0.80

0.20

0.10

0.05

0.025

0.01

0.005

0.00 0.01 0.07 0.21 0.41 0.68 0.99 1.34 1.73 2.16 2.60 3.07 3.57 4.07 4.60 5.14 5.70 6.26 6.84 7.43 8.03 8.64 9.26 9.89 10.52 11.16 11.81 12.46 13.12 13.79

0.00 0.02 0.11 0.30 0.55 0.87 1.24 1.65 2.09 2.56 3.05 3.57 4.11 4.66 5.23 5.81 6.41 7.01 7.63 8.26 8.90 9.54 10.20 10.86 11.52 12.20 12.88 13.56 14.26 14.95

0.00 0.05 0.22 0.48 0.83 1.24 1.69 2.18 2.70 3.25 3.82 4.40 5.01 5.63 6.26 6.91 7.56 8.23 8.91 9.59 10.28 10.98 11.69 12.40 13.12 13.84 14.57 15.31 16.05 16.79

0.00 0.10 0.35 0.71 1.15 1.64 2.17 2.73 3.33 3.94 4.57 5.23 5.89 6.57 7.26 7.96 8.67 9.39 10.12 10.85 11.59 12.34 13.09 13.85 14.61 15.38 16.15 16.93 17.71 18.49

0.02 0.21 0.58 1.06 1.61 2.20 2.83 3.49 4.17 4.87 5.58 6.30 7.04 7.79 8.55 9.31 10.09 10.86 11.65 12.44 13.24 14.04 14.85 15.66 16.47 17.29 18.11 18.94 19.77 20.60

0.06 0.45 1.01 1.65 2.34 3.07 3.82 4.59 5.38 6.18 6.99 7.81 8.63 9.47 10.31 11.15 12.00 12.86 13.72 14.58 15.44 16.31 17.19 18.06 18.94 19.82 20.70 21.59 22.48 23.36

1.64 3.22 4.64 5.99 7.29 8.56 9.80 11.03 12.24 13.44 14.63 15.81 16.98 18.15 19.31 20.47 21.61 22.76 23.90 25.04 26.17 27.30 28.43 29.55 30.68 31.79 32.91 34.03 35.14 36.25

2.71 4.61 6.25 7.78 9.24 10.64 12.02 13.36 14.68 15.99 17.28 18.55 19.81 21.06 22.31 23.54 24.77 25.99 27.20 28.41 29.62 30.81 32.01 33.20 34.38 35.56 36.74 37.92 39.09 40.26

3.84 5.99 7.81 9.49 11.07 12.59 14.07 15.51 16.92 18.31 19.68 21.03 22.36 23.68 25.00 26.30 27.59 28.87 30.14 31.41 32.67 33.92 35.17 36.42 37.65 38.89 40.11 41.34 42.56 43.77

5.02 7.38 9.35 11.14 12.83 14.45 16.01 17.53 19.02 20.48 21.92 23.34 24.74 26.12 27.49 28.85 30.19 31.53 32.85 34.17 35.48 36.78 38.08 39.36 40.65 41.92 43.19 44.46 45.72 46.98

6.63 9.21 11.34 13.28 15.09 16.81 18.48 20.09 21.67 23.21 24.72 26.22 27.69 29.14 30.58 32.00 33.41 34.81 36.19 37.57 38.93 40.29 41.64 42.98 44.31 45.64 46.96 48.28 49.59 50.89

7.88 10.60 12.84 14.86 16.75 18.55 20.28 21.95 23.59 25.19 26.76 28.30 29.82 31.32 32.80 34.27 35.72 37.16 38.58 40.00 41.40 42.80 44.18 45.56 46.93 48.29 49.64 50.99 52.34 53.67

337

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

P(X ≥ a) = p

DISTRIBUCION t DE STUDENT

p Probabilidad

Grados de libertad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

0.20

0.10

0.05

0.025

0.01

0.005

1.3764 1.0607 0.9785 0.9410 0.9195 0.9057 0.8960 0.8889 0.8834 0.8791 0.8755 0.8726 0.8702 0.8681 0.8662 0.8647 0.8633 0.8620 0.8610 0.8600 0.8591 0.8583 0.8575 0.8569 0.8562 0.8557 0.8551 0.8546 0.8542 0.8538

3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104

6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973

12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423

31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573

63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500

-3

-2

-1

0

1

a

2

3

338

Introducción a la Inferencia Estadística para Economía y Empresa

José Ramón Cancelo

P(X ≥ a) = p

DISTRIBUCION F

p G. de L. del denominador

5%

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Grados de libertad del numerador 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

161.45 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54

199.50 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68

215.71 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29

224.58 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06

230.16 19.30 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90

233.99 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79

236.77 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71

238.88 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64

240.54 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59

241.88 19.40 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54

242.98 19.40 8.76 5.94 4.70 4.03 3.60 3.31 3.10 2.94 2.82 2.72 2.63 2.57 2.51

243.91 19.41 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48

244.69 19.42 8.73 5.89 4.66 3.98 3.55 3.26 3.05 2.89 2.76 2.66 2.58 2.51 2.45

245.36 19.42 8.71 5.87 4.64 3.96 3.53 3.24 3.03 2.86 2.74 2.64 2.55 2.48 2.42

245.95 19.43 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40

G. de L. del denominador

2 .5 %

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

a

0

Grados de libertad del numerador 1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

647.79 38.51 17.44 12.22 10.01 8.81 8.07 7.57 7.21 6.94 6.72 6.55 6.41 6.30 6.20

799.50 39.00 16.04 10.65 8.43 7.26 6.54 6.06 5.71 5.46 5.26 5.10 4.97 4.86 4.77

864.16 39.17 15.44 9.98 7.76 6.60 5.89 5.42 5.08 4.83 4.63 4.47 4.35 4.24 4.15

899.58 39.25 15.10 9.60 7.39 6.23 5.52 5.05 4.72 4.47 4.28 4.12 4.00 3.89 3.80

921.85 39.30 14.88 9.36 7.15 5.99 5.29 4.82 4.48 4.24 4.04 3.89 3.77 3.66 3.58

937.11 39.33 14.73 9.20 6.98 5.82 5.12 4.65 4.32 4.07 3.88 3.73 3.60 3.50 3.41

948.22 39.36 14.62 9.07 6.85 5.70 4.99 4.53 4.20 3.95 3.76 3.61 3.48 3.38 3.29

956.66 39.37 14.54 8.98 6.76 5.60 4.90 4.43 4.10 3.85 3.66 3.51 3.39 3.29 3.20

963.28 39.39 14.47 8.90 6.68 5.52 4.82 4.36 4.03 3.78 3.59 3.44 3.31 3.21 3.12

968.63 39.40 14.42 8.84 6.62 5.46 4.76 4.30 3.96 3.72 3.53 3.37 3.25 3.15 3.06

973.03 39.41 14.37 8.79 6.57 5.41 4.71 4.24 3.91 3.66 3.47 3.32 3.20 3.09 3.01

976.71 39.41 14.34 8.75 6.52 5.37 4.67 4.20 3.87 3.62 3.43 3.28 3.15 3.05 2.96

979.84 39.42 14.30 8.71 6.49 5.33 4.63 4.16 3.83 3.58 3.39 3.24 3.12 3.01 2.92

982.53 39.43 14.28 8.68 6.46 5.30 4.60 4.13 3.80 3.55 3.36 3.21 3.08 2.98 2.89

984.87 39.43 14.25 8.66 6.43 5.27 4.57 4.10 3.77 3.52 3.33 3.18 3.05 2.95 2.86

339

340