Ejercicios Resueltos[1]

Pontificia Universidad Católica de Chile Facultad de Ciencias Económicas y Administrativas Ejemplo resueltos Nº1 EAS-2

Views 140 Downloads 2 File size 143KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Pontificia Universidad Católica de Chile Facultad de Ciencias Económicas y Administrativas

Ejemplo resueltos Nº1

EAS-201A Semestre II 2006 Profesor: Víctor Correa S.

Ejemplo 1 Supón que 15.000 personas de una ciudad con 500.000 habitantes están viendo cierto programa de televisión. Si se entrevistan a una muestra aleatoria simple de 200 personas de la ciudad, ¿cuál es la probabilidad de que menos de cuatro personas estén viendo el programa? a) Calcula la probabilidad exacta. b) Utiliza la aproximación del TLC. Solución Sean las variables aleatorias, X1, X2, . . . , X200,

donde, Xi = 1 si en la i-ésima extracción, la persona

seleccionada está viendo el programa, 0 si no. Dado que se dice que es una muestra aleatoria, las variables anteriores, deben ser independientes (es decir las extracciones son con reemplazo) con la misma distribución Bernoulli, Xi ∼ B(π), donde π = proporción en el universo de las 500.000 personas que están viendo el programa = 15.000/500.000 = 0,03. Se pide Pr[X1 +X2 +. . . + X200 < 4 ] = Pr[X1 +X2 +. . . + X200 ≤ 3 ]. a) Dado que, X1 +X2 +. . . + X200 ∼ B( n= 200; π = 0,03 ), la probabilidad exacta es p(0)+ p(1) + p(2) +p(3), donde:

 200  (0,03) x (0,97) 200 − x . p( x) =   x  Resulta

Pr[X1 +X2 +. . . + X200 ≤ 3 ] = 0,1472.

b) Usando el TLC,

X ∼ a N (π ; ⋅

π (1 − π ) 0,03 ⋅ 0,97 ) = N (0,03; ) = N (0,03 ; (0,0121) 2 ) n 200

podemos obtener la probabilidad aproximada: Pr[X1 +X2 +. . . + X200 ≤ 3 ] = Pr[ X ≤ 3/200 = 0,015) ≈ φ ( ( 0,015 –0,03) / 0,0121 ) = φ ( ( – 1,24) = 0,1075. Con la corrección por continuidad, resulta una aproximación mejor: Pr[ X ≤ (3 + 0,5)/200 = 0,0157) ≈ φ ( ( 0,0175 –0,03) / 0,0121 ) = φ ( ( – 1,03) = 0,151.

Ejemplo 2 Se selecciona una muestra aleatoria de 16 observaciones de una distribución normal con media µ y desviación estándar 12 y que se selecciona independientemente otra muestra aleatoria de 25 observaciones de una distribución normal con la misma media y

1

desviación estándar 20. Sean

X y Y las medias muestrales de las dos muestras.

Calcula Pr[  X - Y  < 5]. Solución Dado que se trata de muestras aleatoria, X1, X2, . . . , X16, son iid N(µ , 122 ) y Y1, Y2, . . . , Y25, son iid N(µ , 202 ).

Por lo tanto,

X ∼ N(µ , 122/16) y Y ∼ N(µ , 202/25). Como las muestras son

independientes, entonces, las variables anteriores son también independientes y por lo tanto se tiene, 2 2 2 2 2 X - Y ∼ N(µ - µ , 12 /16 +20 /25) = X - Y ∼ N( 0 , 12 /16 +20 /25) = N( 0, 5 ).

Pr[ 

Así,

X - Y  < 5] = Pr[ -5 < X - Y < 5 ] =

Pr[( -5 –0)/5 < ( X

- Y - 0)/5< (5 –0)/5) ] = Pr[ -1 < Z < 1 ] = φ (1,0) - φ (-1,0) = 0,68.

Ejemplo 3 Se va a seleccionar una muestra aleatoria de tamaño n de una distribución normal con media µ y varianza σ2 = 9. Determina el valor de “n” para el cual Pr[  X -µ  < 1] ≥ 0,95. Solución 2 X ∼ N(µ , 3 /n). Entonces:

Pr[  X -µ  < 1] = Pr[-1 < X -µ < 1] = Pr[-1/(3/ n ) < ( X -µ)/(3/ n ) < 1/(3/ n )] = φ ( n /3 ) - φ (- n /3 ) = 2φ ( n /3 ) –1 ≥ 0,95. Así, n /3 ≥ 1,96, n ≥ 35. Ejemplo 4 Un sondeo pregunta a una muestra aleatoria simple con reemplazo de 1.100 adultos varones, “¿juegas fútbol?” Supón que el 12% de todos los adultos varones de Santiago juegan fútbol. a) Halla la media y error estándar del estadístico: P = proporción de personas en la muestra que juega fútbol. b) ¿Cuál es la distribución en el muestreo aproximada de P? c) Halla la probabilidad de que entre el 10% y 14% de la muestra juegue fútbol. d) ¿Qué tamaño de muestra se precisaría para reducir el error estándar de la proporción muestral a la mitad del valor que hallaste en a)? Solución a)

P = proporción en la muestra de varones que juegan fútbol. E(P) = π =0,12; Error estándar de P = ee(P) = Raiz(π (1-π )/1100) = Raiz(0,12 (1- 0,12 )/1100) = 0,010.

b) Por el TLC, para n = 1100, P tiene una distribución aproximadamente normal con media 0,12 y varianza (0,010) 2. c)

De b), Pr(0,10 < P < 0,14) = φ ( (0,14-0,12)/0,010 ) - φ ( (0,10–0,12)/0,010 ) = φ ( 2,00 ) - φ ( -2,00 ) = 0,9772 – 0,0228 = 0,9544.

d)

2

e)

Se busca n tal que ee(P) = Raiz(0,12 (1-0,12 )/n) = 0,010/2 = 0,005. Despejando se obtiene, n = 4.224 varones adultos.

Ejemplo 5 Una compañía de TV por cable que da servicio a 1.200.000 hogares, aplica una encuesta a una muestra aleatoria simple de 100 hogares. El número medio de horas que los hogares de la muestra utilizan el servicio resultó 3,8 horas diarias con una desviación estándar de 2,11. a) Describe los parámetros, estimadores y estimaciones, implícitos en el enunciado anterior. Explica dos propiedades de uno de los estimadores y porque son útiles para estimar el parámetro. La compañía cree que el número medio de horas al día que utilizan el servicio los 1.200.000 hogares es 4,5 y la desviación estándar 2,00. Suponiendo que la compañía tiene razón, se pide: b)

Encuentra la distribución asintótica del promedio de horas al día en una muestra aleatoria simple de 100 hogares. Explica cómo se interpreta la distribución anterior y la relación con el valor 3,8.

c)

Calcula la probabilidad de que el promedio de horas del servicio utilizada por los hogares, en una muestra aleatoria simple 100 hogares, resulte menor que 4,0 horas.

Solución a) Parámetros: µ = número medio de horas al día que los 1.200.000 hogares utilizan el servicio de TV Cable. σ2 = desviación estándar del n° de horas al día que los 1.200.000 hogares utilizan el servicio de TV Estimadores: Y

= número medio de horas al día que los hogares de la muestra utilizan el servicio de TV Cable

S2 = desviación estándar del n° de horas al día que los hogares de la muestra utilizan el servicio de TV. 3,8 y 2,11 son estimaciones de µ y σ2 respectivamente. El estimador Y es insesgado y consistente con respecto a µ. Es decir, su media es µ y su error estándar o varianza tiende a cero cuando el tamaño de la muestra tiende a infinito. Lo anterior significa que para una muestra grande como la de este ejemplo n = 100 > 30, la estimación 3,8 estará próxima a µ . b) Por el TLC la distribución asintótica de Y es,

Y

a

~ N (µ ,

σ2 ) = N (4,5; 0,04) dado que n = n

100 > 30, µ = 4,5; σ2 = (2,00)2 = 4,00. La distribución anterior, representa el histograma de frecuencias del n° de horas promedio Y , en infinitas muestras aleatorias simples de n = 100, seleccionadas desde la población de 1.200.000 hogares. (0,7 ptos) El valor 3,8 es uno de los promedios anteriores.

3

Aquí un gráfico puede valer más que mil palabras: c) Se pide Pr( Y < 4,0) usando la distribución de Y , se tiene que, Pr( Y < 4,0) ≈ φ ( (4,0 – 4,5)/0,2 ) = φ (-2,5) = 0,0062.

Ejemplo 6 Un indicador de la salud financiera de una empresa es el cuociente, A/P, entre su activo y pasivo. Se planea seleccionar muestras aleatorias independientes X 1 ,..., X n1 , Y1 ,..., Yn 2 de n1 empresas quebradas y n2 empresas sin problemas respectivamente. Suponiendo que ambas poblaciones se distribuyen normalmente con medias µ 1 y µ 2 respectivamente y varianzas iguales, σ 2 = σ 12 = σ 22 se pide: Encuentra un estimador insesgado ∆ˆ para la diferencia de los A/P promedios, ∆ = µ 1 − µ 2 y su distribución muestral. b) Se propone el siguiente estimador para la varianza: a)

σˆ

2

∑ =

n1 i =1

( X i − X ) 2 + ∑ j =1 (Y j − Y ) 2 n2

n1 + n 2

Demuestra que el estimador anterior es sesgado

y sugiere, a partir de éste, un estimador insesgado. c) Se observaron los A/P correspondientes en los balances del año anterior en dos muestras del mismo tamaño n1 = n2 = 10 y se obtuvieron los siguientes resultados: Sin Problemas Quebradas 1,026 0,786 0,356 0,311

Media Varianza

Obtenga una estimación de ∆ y del error estándar del estimador. Un experto afirma que el hecho que ∆ˆ > 0, no significa, necesariamente, que en la población, el promedio de las empresas sin problemas sea mayor que el promedio de las quebradas. Explique la afirmación anterior. Solución a) Estimador insesgado de ∆ = µ1 - µ2,

∆ˆ = Xbarra - Ybarra.

El estimador es insegado porque tanto Xbarra como Ybarra son estimadores insesgados de µ1 y µ2 ˆ ) = E(Xbarra) - E(Ybarra) = µ1 - µ2 = ∆. respectivamnete, entonces: E( ∆ Se tiene que en el muestreo: Xbarra ∼ Normal(µ1 , σ2 /n1) y Ybarra ∼ Normal(µ2 , σ2 /n2) ˆ ∼ Normal(µ1 -µ2 , σ2 (1/n1+1/n2) ) Entonces, dada la independencia de las muestras se tiene que ∆ b)

E (σˆ

2

∑ )=

n1 i =1

E ( X i − X ) 2 + ∑ j =1 E (Y j − Y ) 2 n2

n1 + n 2

( n1 − 1)σ 2 + (n 2 − 2)σ 2 ( n1 + n 2 − 2) 2 = σ ≠ σ 2 así, σˆ 2 es sesgado. n1 + n 2 n1 + n 2 Claramente, para que sea insesgado, el denominador de σˆ 2 debe cambiarse por n1 + n2 –2, así un E (σˆ 2 ) =

nuevo estimador insesgado de la varianza es:

4

σˆ c)

2 P

∑ =

n1

i =1

( X i − X ) 2 + ∑ j =1 (Y j − Y ) 2 n2

n1 + n 2 − 2

Estimación de ∆ : Error estandar de De b), σˆ P = 2

( n1 − 1) S12 + ( n 2 − 1) S 22 = n1 + n 2 − 2

∆ˆ = Xbarra - Ybarra. = 1,026 – 0,786 = 0,24. ∆ˆ :

ˆ )gorro = Raiz(σ2gorro (1/10+1/10) ) ee( ∆

9 ⋅ 0,356 + 9 ⋅ 0,311 = 0,3335 10 + 10 − 2

ˆ )gorro = Raiz( 0,3335 (1/10+1/10) ) = 0,26 ee( ∆ La estimación 0,24 es el resultado de un estimador que tiene una fluctuación aleatoria, de modo que ∆ˆ >0 puede ser fruto del azar. Los posibles resultados de ∆ˆ están centrados en ∆ pero están dispersos a la izquierda y derecha. Es decir, por ejemplo, puede ocurrir que en las poblaciones, ∆= ˆ > µ1 - µ2 =- 0,05 < 0, pero si repetimos el muestreo, podríamos obtener una estimación como, ∆ 0 en más de 40% de los casos (1-φ ( (0 –(-0,05))/0,26 ) = 1-0,58 =0,42).

Ejemplo 7 Considere una muestra de tamaño n y las distribuciones de tres estimadores de un parámetro θ : c θ2 θˆ1 ~ N(θ + , (1 − c)) , n n θ2 ˆ θ 2 ~ N(θ , ) n θˆ3 ~ N(θ ; 0,01θ 2 )

0