Distribuciones de Probabilidad Conjunta

DISTRIBUCIONES DE PROBABILIDAD CONJUNTA Algunos experimentos estadísticos pueden incluir más de una variable aleatoria l

Views 174 Downloads 2 File size 177KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

DISTRIBUCIONES DE PROBABILIDAD CONJUNTA Algunos experimentos estadísticos pueden incluir más de una variable aleatoria las cuales actúan en forma conjunta, y es de interés determinar la probabilidad correspondiente a los diferentes valores que estas variables puedan tomar. En esta sección revisamos las distribuciones de probabilidad para dos variables aleatorias que intervienen en forma conjunta. Caso discreto Definición Sean X, Y: variables aleatorias discretas. Entonces su función de de probabilidad conjunta es f(x,y)

distribución

Esta función satisface las siguientes propiedades 1) xy (f(x,y)0) 2)

  f ( x , y)  1 x

y

3) P(X=x,Y=y) = f(x,y) También se puede definir la distribución de probabilidad acumulada conjunta: F(x,y) = P(Xx,Yy) =

  f ( s, t ) , -x,y

s x t  y

.

Ejemplo. Una caja contiene 4 baterías defectuosas, 3 baterías en regular estado, y 2 baterías aceptables. Se toman dos baterías al azar. a) Encuentre la distribución de probabilidad conjunta. Solución Sean las variables aleatorias discretas X: cantidad de baterías defectuosas Y: cantidad de baterías en regular estado 2-X-Y: es la cantidad de baterías en buen estado que se obtienen en la muestra. Siguiendo el modelo hipergeométrico, se tiene que la cantidad de formas diferentes de tomar x baterías defectuosas de las 4 existentes, y baterías en regular estado, de las 3 existentes, y 2-x-y baterías aceptables de las 2 existentes, es  4    x

 3    y 



2

 

  2  x  y

 9

Además hay   formas diferentes de tomar dos baterías de la caja. Por lo tanto, la distribución  2 de probabilidad conjunta es P(X=x, Y=y) = f(x,y) =

 4    x

 3    y

   

 

2   2  x  y  , x,y = 0,1,2; x+y2 9  2

b) Calcule la probabilidad de obtener una defectuosa y una aceptable Solución

P(X=1, Y=0) = f(1,0) =

 4    1

 3    0

   

 

2   2  1  0  = 0.2222 9  2

Caso continuo Definición Sean X, Y: dos variables aleatorias continuas, entonces su función de densidad conjunta es f(x,y) Esta función satisface las siguientes propiedades 1) f(x,y)0, x, y 



2)   f ( x , y)dxdy  1  

d b

  f (x, y)dxdy

3) P(aXb, cYd) =

c a

La función de densidad de probabilidad de dos variables aleatorias continuas X, Y, es una superficie en el espacio. La probabilidad P(aXb, cYd) es entonces una porción del volumen debajo de la superficie y sobre el rectángulo aXb, cYd

La función de distribución conjunta acumulada es: y

P(Xx, Yy) = F(x,y) =

x

  f (u, v )dudv

.

  

Ejemplo. Suponga que el tiempo de mantenimiento semanal de una máquina depende de dos variables aleatorias contínuas (horas): X: duración del mantenimiento mecánico Y: duración el mantenimiento eléctrico Suponga que la densidad de probabilidad conjunta es  2  ( x  2 y), 0  x, y  1 f(x,y) =  3  0, otros x, y a) Verifique que es una función de densidad de probabilidad Solución 1) f(x,y)0, x, y. 2)





  f ( x , y)dxdy  1 :

 





11

2

2 11

  f (x, y)dxdy    3 (x  2 y)dxdy  3   (x  2 y)dxdy

  1 2

00

00

1

2 x 2 1 2 y  2xy ]10 dy   (  2 y)dy  [  y 2 ]10  1 30 2 30 2 3 2

= [

b) Calcule la probabilidad que en alguna semana, el mantenimiento mecánico dure menos de 15 minutos y el mantenimiento eléctrico dure más de 30 minutos Solución 1 1/ 4

P(X1/4, Y1/2) = 

1/ 2

2

 (x  2 y)dxdy = 13/96 0 3

DISTRIBUCIONES MARGINALES DE PROBABILIDAD Estas definiciones corresponden a funciones de probabilidad de cada variable. Definición Caso discreto (dos variables) Sean X,Y variables aleatorias discretas y f(x,y) su función de probabilidad

conjunta.

Entonces, las funciones de probabilidad f ( x , y) g(x)=P(X=x)=  y

h(y)=P(Y=y)=

 f ( x , y) x

Se denominan funciones marginales de probabilidad

.

Caso continuo (dos variables) Sean X,Y variables aleatorias continuas y f(x,y) su función de densidad de probabilidad conjunta. Entonces, las funciones de densidad de probabilidad 

g(x)=  f ( x , y)dy  

h(y)=  f ( x , y)dx 

Se denominan funciones marginales de densidad de probabilidad

.

Para cada variable la distribución marginal se obtiene sumando la función de probabilidad sobre la otra variable. Ejemplo. En el problema de las baterías, encuentre la distribución marginal g(x) correspondiente a la cantidad de baterías defectuosas. Solución: 2

g(0) =  f (0, y) =f(0,0)+f(0,1)+f(0,2) = 0.2778 y0 2

g(1) =  f (1, y ) =f(1,0)+f(1,1)+f(1,2) = 0.5556 y0

2

g(2) =  f (2, y ) =f(2,0)+f(2,1)+f(2,2) = 0.1667 y0

En este ejemplo, también se puede expresar g(x) mediante una fórmula similar al modelo hipergeométrico, separando las variables en dos grupos: X y las demás: g(x) =

 4    x

  



 

5   2  x  9  2 

, x=0, 1, 2

Ejemplo. Encuentre la densidad marginal g(x) para el problema del mantenimiento de la máquina: Solución: 

g(x) =

1



2 2 2   f (x, y)dy  0 3 (x  2y)dy  3 xy  y



1 0



2 ( x  1), 0x1 3

Se puede ver que las distribuciones marginales g(x), h(y) son en realidad funciones de probabilidad de X, Y en forma separada. Estas funciones deben cumplir las propiedades respectivas. Por ejemplo, verifique g(x), X continua: 4) g(x)0, x 

5)  g( x )dx

1



Son evidentes, al sustituir g(x) con la definición correspondiente Las distribuciones marginales pueden usarse para calcular probabilidad de cada variable. Ejemplo. Calcule P(aXb): b

P(aXb) =

 g( x )dx a

DISTRIBUCIONES CONDICIONALES DE PROBABILIDAD Recordemos la fórmula de probabilidad condicional para eventos P(A|B) = P(AB)/P(B) Si definimos los eventos A: X=x B: Y=y Siendo X, Y variables aleatorias discretas con distribución de probabilidad conjunta f(x,y), entonces, P(X=x|Y=y) =

P( X  x , Y  y) P( Y  y )

Que se puede expresar con la notación establecida para las distribuciones conjuntas: f(x|y) =

f ( x , y) h( y)

f(x|y) también satisface las propiedades de las funciones de probabilidad Definición Sean X, Y variables aleatorias discretas con distribución de probabilidad f(x,y) Entonces, la distribución condicional de X dado que Y=y, es f(x|y) =

f ( x , y) h( y)

Y la distribución condicional de Y dado que X=x, es

f(y|x) =

f ( x , y) g( x )

.

Definición Sean X, Y variables aleatorias continuas con densidad de probabilidad f(x,y) Entonces, la densidad condicional de X dado que Y=y, es f(x|y) =

f ( x , y) h( y)

Y la densidad condicional de Y dado que X=x, es f(y|x) =

f ( x , y) g( x )

.

Las distribuciones condicionales también se pueden usar para calcular probabilidad: b

Caso discreto:

P(aXb|Y=y) =

 f ( x | y)

xa b

Caso continuo:

P(aXb|Y=y) =

 f ( x | y)dx a

Ejemplo. En el ejemplo de las baterías, encuentre la distribución condicional de X dado que Y=1 Solución f(x|1) = f(x,1)/h(1) 2

Pero, h(1) =

 f ( x ,1) =f(0,1)+f(1,1)+f(2,1) x0

Por lo tanto f(x|1) =

f ( x ,1) f (0,1)  f (1,1)  f (2,1)

Calcule la probabilidad que la segunda batería sea defectuosa dado que la primera es regular: Solución P(X=1|Y=1) =

f (1,1) 0.3333 = =0.6667 f (0,1)  f (1,1)  f (2,1) 0. 5

Para este ejemplo, se puede formular de manera general la probabilidad condicional. Ejemplo. Determine f(x|y)  4    x

 3    y

   

f(x|y) =

f ( x , y)  h( y)

   3    y

  

  

Ejemplo. Calcule P(X=1|Y=1) Solución

2   2  x  y  9  2   6   2  y  9  2 

 4    x

   





2   2  x  y  , x,y=0,1,2; x+y2 6   2  y

P(X=1|Y=1) = f(1|1) =

f ( x , y)  h( y)

 4    1

  

  

2   2  1  1 = 0.6667 6   2  1

Ejemplo. En el problema del mantenimiento de la máquina, a) Encuentre la densidad condicional f(y|x) Solución 2 ( x  2 y) f ( x , y) 3 x  2y   f(y|x) = , 0x,y1 2 g(x ) x1 (x  1) 3 b) Calcule la probabilidad que el mantenimiento eléctrico (Y) dure menos de 15 minutos dado que el mantenimiento mecánico (X) duró 30 minutos

Solución P(Y0.25|X=0.5) =

0.25

0.25 0.5  2 y

 f ( y | 0 .5 )  

0

0

0. 5  1

dy =0.125

VARIABLES ALEATORIAS ESTADÍSTICAMENTE INDEPENDIENTES Sean X,Y variables aleatorias continuas y f(x,y) su distribución de probabilidad conjunta. Su densidad condicional es: f(x|y) =

f ( x , y) h( y)

y su densidad marginal se define como: 

g(x) =  f ( x , y)dy 

Sustituyendo la densidad condicional en la densidad marginal: 

g(x) =  f ( x | y)h( y)dy 

Supongamos que f(x|y) no depende de y. Esto significa que la expresión f(x|y) no contendría a la variable y. Por lo tanto, puede salir del integral: 

g(x) = f(x|y)  h( y)dy 



Pero  h( y)dy  1 pues h(y) es también una función de densidad de probabilidad . 

Entonces g(x) = f(x|y). Sustituyendo en la densidad condicional inicial se obtiene f(x,y) = g(x) h(y) Definición Se dice que X, Y son variables aleatorias contínuas estadísticamente independientes si y solo si f(x,y) = g(x) h(y), en el dominio de x, y Esta definición se puede extender a más variables aleatorias continuas.

.

En el caso de variables aleatorias discretas, para que esta definición sea cierta, debe cumplirse que en cada punto, el producto de las distribuciones marginales sea igual a la distribución conjunta . MEDIA Y VARIANZA PARA VARIABLES ALEATORIAS CONJUNTAS Sean X, Y variables aleatorias con distribución de probabilidad conjunta f(x,y) Sea G(X,Y), alguna expresión con X,Y. Por lo tanto G también es una variable aleatoria. Definición Si X, Y son variables aleatorias discretas La media o valor esperado de G(X,Y), es  G( X , Y )  E G( X , Y ) 

  G( x , y)f ( x, y) X

Y

Si X, Y son variables aleatorias contínuas valor esperado de G(X,Y), es    G ( X , Y )  E G( X , Y )    G( x , y )dxdy

La media o

 

.

.

Ejemplo Calcule la media de la suma de baterías defectuosas y baterías en estado regular en el ejemplo anterior: Solución G(X,Y) = X+Y; E X  Y  

2

2

  ( x  y )f ( x , y ) x 0 y0

Siendo f(x,y) =

 4    x

 3    y

   

 

= (0+0)f(0,0) + (0+1)f(0,1) + ... + (2+2)f(2,2)

2   2  x  y  , x, y = 0, 1, 2; x+y2 9  2 

Ejemplo En el ejemplo del mantenimiento de la máquina, calcule la media de la duración de la suma del tiempo de mantenimiento semanal eléctrico y mecánico: Solución G(X,Y) = X+Y E X  Y  

1 1

  (x  y)f ( x, y)dxdy 0 0

Siendo f(x,y) =

2 ( x  2 y) , 0x,y1 3

CASO ESPECIAL Si G(X,Y) = X  X  E X  

 xf (x , y)   x  f (x, y)   xg(x ) X

Y

x

y

x

Si G(X,Y) = Y  Y  E Y  

  yf( x, y)   y f ( x, y)   yh( y) X

Y

y

x

y

en donde g(x), h(y) son las distribuciones marginales

.

Igualmente para el caso continuo: Si G(X,Y) = X   X  E X    xg( x )dx 

Si G(X,Y) = Y   Y  E Y    yh( y)dy 

.

en donde g(x), h(y) son las densidades marginales COVARIANZA La definición de varianza se extiende a variables aleatorias conjuntas y se denomina covarianza Definición Sean X, Y variables aleatorias discretas con distribución conjunta f(x,y) Entonces, la covarianza de X, Y es  XY  Cov X , Y   E ( X   X )( Y   Y )   ( x   X )( y   Y )f ( x , y ) x

y

Sean X, Y variables aleatorias continuas con densidad conjunta f(x,y) Entonces, la covarianza de X, Y es  XY  Cov X , Y   E ( X   X )( Y   Y ) 





  (x  

X

.

)( y   Y )f ( x , y )dxdy

 

Igualmente, se puede obtener una fórmula alterna para calcular la covarianza:  XY  Cov X , Y   E XY   X  Y

.

Demostración Cov[X,Y] = E[(X-X)(Y-Y)] = E[XY - XY - YX + XY] = E[XY] - YE[X] - XE[Y] + XY = E[XY] - YX - XY + XY = E[XY] - XY Propiedades de la covarianza Si X, Y son variables aleatorias estadísticamente independientes, entonces Cov[X,Y] = 0 Demostración Si X, Y son variables aleatorias estadísticamente independientes, se tiene que f(x,y) = g(x) h(y) Por lo tanto, E[XY] =

 xyf( x, y)   xyg(x )h( y)   xg( x ) yh( y) x

y

x

y

x

y

= E[X] E[Y] sustituya en la fórmula de la covarianza: Cov[X,Y] = E[XY] - XY = E[X]E[Y] - XY = XY - XY = 0

.

La demostración es similar si X, Y son variables aleatorias continuas. Signos de la covarianza La covarianza tiene signo positivo si valores grandes de X están asociados con valores grandes de Y, o si valores pequeños de X están asociados con valores pequeños de Y. La covarianza tiene signo negativo si valores grandes de la una variable están asociados con valores pequeños de la otra variable. Este comportamiento se puede observar en la definición de covarianza: Cov X , Y   E ( X   X )( Y   Y ) 

 ( x   x

X

)( y   Y )f ( x , y)

y

Si los valores de X, Y son ambos grandes o ambos pequeños, el producto de sus diferencias con respecto a sus medias tendrá signo positivo, y la suma de estos términos tendrá signo positivo. También es cierto con variables continuas Definición Sean X, Y variables aleatorias conjuntas (discretas o continuas) entonces, el coeficiente de correlación de X, Y es:  XY 

Cov X , Y    XY ,  1   XY  1  X Y X Y

.

El símbolo  del alfabeto griego se lee “ro” y es una medida estandarizada de la covarianza. Esta definición puede extenderse a más variables aleatorias conjuntas.