Inferencia

Modelización y Tratamiento de la Incertidumbre Víctor Chaparro Parra Caso práctico III: Inferencia Estadística Bayesiana

Views 264 Downloads 17 File size 93KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Modelización y Tratamiento de la Incertidumbre Víctor Chaparro Parra Caso práctico III: Inferencia Estadística Bayesiana

TAREA III. Estimando proporciones y predicción de futuras muestras* . Se ha realizado un estudio sobre los efectos de la exposición a niveles moderados de plomo (encontrado en determinados alimentos) en el desarrollo cognitivo a largo plazo de los niños. Los investigadores analizaron el contenido en plomo en los dientes de leche de los niños, una vez que se les habían caído. De los 29 niños estudiados que tenían un contenido en plomo superior a 22.22 ppm (partes por millón), 22 terminaron la Educación Secundaria y otros 7 no la terminaron. Suponemos una distribución a priori p ∼ Be(1, 1) para la proporción de alumnos que terminan la Educación Secundaria. 1. Escribe la función de verosimilitud, L(p) = P (X = x|p), y la distribución a posteriori, f (p|x) (salvo constantes multiplicativas). La función de verosimilitud para el caso de modelo binomial (para x éxitos obtenidos en n experimentos idénticos de Bernoulli), viene dada por: ( ) n x L(p) = P (X = x|p) = p (1 − p)n−x , x = 0, · · · , n. x En este caso concreto, n = 29 y x = 22, por tanto: L(p) =

( ) 29 22 p (1 − p)7 . 22

En general, la distribución a posteriori satisface la siguiente relación: Aposteriori ∝ Apriori × V erosimilitud. En base a esto, teniendo en cuenta que p ∼ Be(α, β) se tiene, salvo constantes multiplicativas, que la distribución a posteriori viene dada por: f (p|x) ∝ f (p)P (x|p) ∝ pα−1 (1 − p)β−1 px (1 − p)n−x , con p ∈ (0, 1) y f (p|x) = 0 para p ∈ / (0, 1). Por tanto, p|x ∼ Be(α′ = x+α, β ′ = n−x+β). Con los valores concretos del problema en estudio, la distribución a posteriori estará dada por p|x ∼ Be(23, 8) . *

En el anexo A pueden consultarse los cálculos realizados con R.

1

2. Obtén una muestra aleatoria de tamaño 1000 de la distribución a posteriori de p, y representa su densidad empírica, comprándola en la misma gráfica con la densidad a priori y a posteriori de p. En la gráfica que se muestra en la figura 1 se han representado, en rojo la densidad empírica, obtenida a partir de la muestra aleatoria de tamaño 1000; en verde, la densidad a priori (Be(1, 1)) y en azul, la densidad a posteriori (Be(23, 8)).

Figura 1

Se observa como la densidad empírica a posteriori es muy parecida a la densidad a posteriori. 3. Calcular la media a posteriori y la desviación típica a posteriori. La media a posteriori es E(p|x) =

α′ = 0.742, α′ + β ′

y la desviacion típica a posteriori es √ σ = V (p|x) =

[

α′ β ′ (α′ + β ′ )2 (α′ + β ′ + 1)

]1/2 = 0.077.

4. Calcula un intervalo de probabilidad al 90 % para p. Al conocer explícitamente la distribución a posteriori, podemos obtener el intervalo de probabilidad al 90 % directamente de los cuantiles correspondientes, que en este caso, coinciden con el decil 1 para el extremo inferior y el decil 9 para el superior. Por tanto, con una probabilidad del 90 %, se tiene: p ∈ [0.639, 0.838] . 5. Contrastar la hipótesis H0 : p ≤ 0.4, frente a H1 : p > 0.4. 2

Para contrastar la hipótesis nula H0 frente a la alternativa H1 hay que calcular las probabilidades correspondientes P r(H0 |p) y P r(H1 |p). Como conocemos explícitamente la distribución a posteriori, se tiene que ∫ 0.4 P r(H0 |p) = FP (p ≤ 4) = fP (p|α′ , β ′ )dp = 4.93 × 10−5 , 0

y P r(H1 |p) = 1 − P r(H0 |p) = 0.999, descartándose la hipótesis nula frente a la alternativa por ser P r(H1 |p) > P r(H0 |p). Este resultado se puede intuir si nos fijamos en la gráfica de la densidad a posteriori en p = 0.4 (figura 1) , viendo que el área a la izquierda de ese punto bajo la función es prácticamente despreciable comparándola con el área a la derecha. 6. En una siguiente fase del estudio, se reciben datos de otros 10 niños que han presentado un contenido en plomo de más de 22.22 ppm. Calcular la probabilidad predictiva de que al menos 9 de ellos terminen la Educación Secundaria. La probabilidad de que haya k éxitos en los m siguientes ensayos, sabiendo que hubo x éxitos en los n primeros ensayos, está dada por ∫ P r(k éxitos en m|x) = 0

) m k p (1 − p)m−k f (p|x)dp = k ( ) m Γ(n + α + β) Γ(α + x + k)Γ(β + n − x + m − k) = . k Γ(α + x)Γ(n − x + β) Γ(α + β + m + n)

1(

Como nos piden la probabilidad de que al menos 9 de cada 10 niños terminen la Educación Secundaria, calculamos la probabilidad pedida como sigue, utilizando la anterior expresión con los valores de α, β, n, x, m y k que ya conocemos:

P r(p ≥ 9|x) = P r(9 éxitos en 10|22) + P r(10 éxitos en 10|22) = 0.190 + 0.0761 = 0.266 . TAREA IV. Estimando una media normal con una a priori discreta

**

Suponemos que estamos interesados en estimar el total anual de precipitaciones en forma de nieve (en cm), µ, en un pueblo del norte de la Península. Suponemos que los totales anuales recogidos y1 , . . . , yn , provienen de una población que sigue una distribución normal de media µ y varianza conocida σ 2 = 102 cm2 . 1. Antes de recoger los datos, suponemos que tenemos las siguientes creencias a priori acerca de la probabilidad de que la media de las precipitaciones totales anuales µ, tome los siguientes valores: µ g(µ)

20 0.1

30 0.15

40 0.25

50 0.25

60 0.15

70 0.1

La distribución a priori aparece representada en la gráfica de la figura 2. **

Los cálculos realizados con R pueden consultarse en el anexo B.

3

Figura 2

2. Se tiene registro de las precipitaciones de nieve en cm, y, de los últimos 12 años: y (cm)

38.6

42.4

57.5

40.5

51.7

67.1

33.4

60.9

64.12

40.1

40.7

6.4

La función de verosimilitud es para el modelo normal-normal: [ ( )n ∏ ( ) ] n 1 1 yi − µ 2 L(µ) = √ exp − . 2 σ 2πσ i=1 Calcula el valor de la verosimilitud para todos los posibles valores de µ reflejados en la distribución a priori. Utilizando esta expresión para la función de verosimilitud, su valor calculado con R para cada µ se muestra en la tabla 1. µ L(µ)

20 8.91 × 10−41

30 3.32 × 10−30

40 7.58 × 10−25 Tabla 1

En la figura 3 aparece la gráfica de L frente a µ.

4

50 1.06 × 10−24

60 9.19 × 10−30

70 4.88 × 10−40

Figura 3

Como puede verse, el mayor valor de la verosimilitud se da para µ = 50, disminuyendo ésta hacia los extremos. Por tanto, se puede decir que de los valores de la probabilidad que conocemos a priori, el más verosímil es el de µ = 50. 3. Calcular la distribución a posteriori para µ. En el caso discreto, la distribución a posteriori se calcula de igual forma que en el caso continuo, esto es, f (µ|y) = L(y|µ) · f (µ). En la tabla 2 aparecen los resultados obtenidos mediante R, obtenidos con la función ‘discrete.bayes.2’ de R, que permite calcular la distribución a posteriori para un modelo de dos parámetros, como es la normal, y una distribución a priori discreta. µ f (µ|y)

20 1.95 × 10−17

30 1.09 × 10−6

40 4.16 × 10−1

50 5.84 × 10−1

60 3.03 × 10−6

Tabla 2

En la gráfica de la figura 4 se muestra la distribución a posteriori.

5

70 1.07 × 10−16

Figura 4

4. Calcular un intervalo de probabilidad al 80 % para µ. El intervalo obtenido con R es µ ∈ [40, 50] . 5. Repetir los apartados 3-4 cuando la distribución a priori se toma como µ ∼ N (µ0 = 60, σ02 = 52 ). La distribución a posteriori en este caso tiene la forma:  ( µ0 )[  1( 1 + n σ02 µ − f (µ|y) ∝ f (µ)f (y|µ) ∝ exp − + 1  2 σ02 σ 2 + σ2 0



n¯ y )]2  σ2 , n  σ2

esto es, la distribución a priori de µ|x sigue una distribución normal N (a, b), donde

a=

µ0 σ02 1 σ02

+ +

n¯ y σ2 n ; σ2

b2 =

1 σ02

1 +

n σ2

.

Calculándolo con R obtenemos una media de a = 49.00 y una varianza de b2 = 2.452 . Por tanto, la distribución a posteriori obtenida es N (49.00, 2.45) . En la siguiente figura se pueden ver la forma de la distribución a priori (N (60, 52 )) y la distribución a posteriori:

6

Figura 5

Como se puede observar, los valores de medidas centrales como la media para la distribución a posteriori son mucho más parecidos a los de la muestra, con y¯ = 45.28 y M e = 41.55, que los de la distribución a priori. El intervalo de probabilidad al 80 % para µ, conociendo explícitamente la distribución a posteriori, se puede calcular mediante los cuantiles 20 y 80 para el extremo inferior y superior respectivamente, obteniéndose que con dicha probabilidad µ ∈ [46.93, 51.06] .

7

Anexos A. TAREA III: Script R # distribución a priori de p: Be(1,1) # distribución a posterior de p: Be(22,8) ## generamos muestra aleatoria de tamaño n = 1000 y se la asignamos a 'x' x