Modelos de Probabilidad

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD REFERENTES

Views 33 Downloads 0 File size 375KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

REFERENTES TEÓRICOS UNIDAD III: MODELOS DE PROBABILIDAD No siempre es posible determinar las probabilidades para los distintos valores que toma una variable aleatoria. Afortunadamente se han desarrollado funciones que permiten valorar probabilidades asociadas a distintas variables aleatorias. Estas funciones se denominan MODELOS DE PROBABILIDAD, y son distribuciones especiales o particulares. Entonces, en muchas situaciones dado un problema que requiere asignación de probabilidades, se identifica la variable aleatoria asociada y se selecciona un modelo de probabilidad adecuado, que describa el comportamiento de dicha variable aleatoria, y se utiliza este modelo para calcular probabilidades. En general estos modelos son buenas aproximaciones de la realidad, ya que han sido probados analítica y experimentalmente. Vamos a estudiar modelos para variables discretas y continuas. Para poder seleccionar un modelo apropiado es necesario conocer las características de los mismos. Las características que estudiaremos de cada modelo son las siguientes: • Definición de la variable • Expresión matemática de la función de probabilidad. Parámetros del modelo: valores que determinan la función. • Forma de la función de distribución de probabilidades. • Valor esperado, varianza, desvío y asimetría. MODELOS PARA VARIABLES ALEATORIAS DISCRETAS Los modelos para variables discretas que vamos a estudiar son dos: el modelo Binomial y el modelo de Poisson, que como veremos están relacionados. Modelo Binomial Sea un experimento aleatorio que se realiza una sola vez y que puede tener sólo dos resultados éxito o fracaso: A la probabilidad de éxito se denomina "p" A la probabilidad de fracaso se denomina "q" Al haber únicamente dos soluciones se trata de sucesos complementarios, por lo tanto se verifica que: p+q=1 por tanto q=1–p Sea Y una variable aleatoria relacionada con los resultados de este experimento, de modo que si el resultado es éxito la variable toma valor 1 y si es fracaso toma valor 0. Esta variable y el experimento asociado se conocen con el nombre de variable y experimento de Bernoulli. Ahora bien, sean n experimentos de tipo Bernoulli independientes entre sí, entonces la variable X: “cantidad de éxitos en n experimentos de Bernoulli” tiene distribución binomial. X = Y1 +Y2 + Y3 +... +Yn La distribución binomial parte de un experimento de Bernoulli, se aplica cuando se realizan un número "n" de veces el experimento de Bernoulli. La variable X puede tomar valores entre: 1

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

0: si todos los experimentos han sido fracaso n: si todos los experimentos han sido éxitos Ejemplo 1: se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10. Por las características del experimento asociado a una variable aleatoria binomial se verifica: Cada ensayo o intento tiene sólo dos resultados posibles “éxito” ó “fracaso”. La probabilidad de un “éxito” permanece “fija” en cada repetición del experimento de Bernoulli o ensayo. Los ensayos son independientes. El modelo de probabilidad para obtener X éxitos en n ensayos de Bernoulli –distribución binomial- se obtiene del siguiente modo: Sea p = probabilidad de éxito y 1 – p = probabilidad de fracaso. La probabilidad de una secuencia de n intentos con x éxitos es: n p. p. p...( 1 – p) (1 – p)…( 1 – p) = px. ( 1 – p)n-x x

n–x n n! = x x! (n − x )!

El número de secuencias distintas que contienen x éxitos es: Por tanto la expresión general para la distribución binomial es: P(X = x) =

n! . px. ( 1 – p)n-x x! (n − x )!

Donde x = 0,1,2,…n

Los parámetros de la expresión matemática del modelo son n y p y se escribe: X ~ Bin (n,p) que se lee: “x tiene distribución binomial con parámetros n y p” En cuanto a la forma de la distribución depende de los valores de los parámetros: 1) Si se considera n constante se tiene: a) Si p < 0,5 tiene asimetría positiva, sesgo a la derecha P(X=x)

X

2

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

b) Si p→ 0,5 entonces la asimetría → 0 P(X=x)

X c) Si p > 0,5 tiene asimetría negativa, sesgo a la izquierda

P(X=x)

X 2) Si se considera p constante y n → ∞ entonces la asimetría → 0 P(X=x)

X Respecto a las propiedades o parámetros de la distribución se tiene: E(X) = µ = n.p E[(x – µ)2] = σ2 = n.p.(1 – p) Observación: Si n es grande la calculadora no tiene capacidad para calcular la probabilidad P(X = x) =

n! . px. ( 1 – p)n-x entonces se usan tablas. x! (n − x )!

3

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Ejemplo 2: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? " x " es el número de aciertos. En este ejemplo " x " igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son 6 aciertos, entonces x = 6) " n" es el número de ensayos. En nuestro ejemplo son 10 " p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5 La fórmula quedaría:

Luego: P (x = 6) = 0,205 Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda. Ejemplo 3:¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado 8 veces? " x " (número de aciertos) toma el valor 4 " n" toma el valor 8 " p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666) La fórmula queda:

Luego: P (x = 4) = 0,026 Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el número 3 al tirar un dado 8 veces. Realice el siguiente ejercicio: Según un análisis efectuado por una empresa aproximadamente el 3% de los envíos al exterior presentan algún reclamo. Próximamente la empresa realizará 5 envíos. Se define la variable aleatoria: X: “número de reclamos en 5 envíos” a) Calcule y dibuje la distribución de probabilidad de esta variable. b) Calcule la esperanza y la varianza. c) Determine las probabilidades de que: 1) No se presente ningún reclamo 2) Se presenten dos reclamos. 3) Se presente a lo sumo un reclamo. 4) Se presente al menos un reclamo. Modelo de Poisson. Una variable aleatoria que tiene distribución de Poisson puede ser definida como. X: cantidad de ocurrencias (éxitos) en un intervalo continuo En la práctica el concepto de continuo se asocia con intervalos de tiempo o espacio.

4

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Ejemplos: X: cantidad de clientes que llegan a un banco en 3 minutos Y: cantidad de células de cierto tipo que aparecen en la lente de un microscopio por cm2. Para llegar a la formulación del modelo probabilístico debe suponerse que el experimento asociado responde a un Proceso de Poisson. Este proceso consiste en el conteo de ocurrencias en un intervalo continuo, que por tanto cumple con la propiedad de poder subdividirse en subintervalos tan pequeños como se necesite, esto de modo tal que se verifiquen las siguientes condiciones: La probabilidad de más de una ocurrencia en un subintervalo es cero. La probabilidad de una ocurrencia en un subintervalo es la misma “fija” para todos los intervalos y es proporcional a la longitud del mismo. El número de ocurrencias en un subintervalo es independiente del número de ocurrencias en los demás intervalos. Si λ > 0 es el número promedio de ocurrencias o éxitos en un intervalo, entonces la distribución de Poisson sigue el siguiente modelo: P(X=x) =

e − λ .λx x!

En este caso, a diferencia de la distribución binomial, el número de valores posibles de X es infinito. El modelo tiene un único parámetro que es λ y se escribe: X ~ Poi (λ λ) que se lee: “x tiene distribución de Poisson con parámetro λ ” La forma de la gráfica de la distribución tiene en general asimetría positiva, sesgo a la derecha, y depende de λ.

P(X=x)

X

Si ocurre que λ→ ∞ entonces asimetría → 0. Para λ > 5 ya es bastante simétrica. Esta distribución si bien se aproxima a cero después de los primeros valores, tiene infinitos valores posibles para X.

5

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Observación: La distribución de Poisson parte de la distribución binomial. Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado de veces y la probabilidad de éxito "p" en cada ensayo es reducida, es decir si n crece y p disminuye de tal manera que n.p= λ se mantiene constante, entonces se verifica que: lim

n→∞

n! e − λ .λx . px. ( 1 – p)n-x = x! (n − x )! x!

Por lo tanto las dos distribuciones se acercan en la práctica, para aproximar probabilidades binomiales se usa Poisson para n ≥ 30 y p ≤ 0.1 ó para n ≥ 20 y p ≤ 0.05, en general cuando se cumple " p " < 0,10 y " p . n " < 10. Para calcular probabilidades con el modelo de Poisson también se utilizan tablas, por las dificultades de cálculo con calculadora. Respecto a las propiedades del modelo, por lo dicho anteriormente, son similares a las de la distribución binomial se tiene: E(X) = µ = n.p = λ

(observe µ = λ )

E[(x – µ)2] = σ2 = n.p = λ (observe que a partir de la varianza de la distribución binomial, si p es pequeña (1 – p) tiende a 1). Ejemplo 4: Si la probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, y se realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes? Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribución de Poisson.

Luego, P (x = 3) = 0,0892 Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9% Ejemplo 5: La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos?

Luego, P (x = 5) = 4,602 Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%.. Realice el siguiente ejercicio: Suponga que la variable número de fallas de un alambre delgado de cobre, esta descripta por una distribución de Poisson con una media de 2,3 fallas por milímetro. Determine las siguientes probabilidades: a) Se presenten dos fallas en un milímetro. b) Se presenten 10 fallas en 5 milímetros c) Se presente al menos una falla en 2 milímetros. Ayuda: Utilice unidades consistentes. 6

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

MODELOS PARA VARIABLES ALEATORIAS CONTINUAS Distribución uniforme Una variable aleatoria tiene distribución uniforme si puede tomar cualquier valor dentro de un intervalo de números reales y todos ellos tienen la misma probabilidad. La función de densidad, viene definida por:

f(x)=

1 b-a

a≤x≤b

La función de distribución es:

0 F(x) =

x-a b-a

a≤x≤b 1

En cuanto a E(x)= µ =

x≤a

x≥b

a+b (b − a )2 y Var(X) = σ2=  2 12

 Una aplicación importante de esta distribución es la generación de números aleatorios, que se realiza conforme a la distribución uniforme con a=0 y b= 1. Ejemplo: el precio medio del fardo grande de alfalfa especial para el próximo año, se estima que puede oscilar entre 140 y 160 pesos. Podría ser, por tanto, de 143 pesos, o de 143,4 pesos, o de 143,45 pesos, o de 143,455 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad.

En este caso:

b: es el extremo superior =160 a: es el extremo inferior =140 Por lo tanto, la función de distribución es Es decir, que el valor final esté entre 140 pesos y 141 pesos tiene un 5% de probabilidad, que esté entre 141 y 142, otro 5%, etc. El precio medio esperado del fardo para el próximo año es de 150 pesos ya que:

7

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Distribución exponencial Una variable aleatoria con distribución de Poisson es el conteo del número de ocurrencias (éxitos) en un intervalo continuo. Una variable aleatoria que mide el espacio o el lapso entre esas ocurrencias es continua y tiene distribución exponencial. Es decir una distribución exponencial se aplica para medir tiempo o espacios entre ocurrencias cuando el número de ocurrencias sigue una distribución de Poisson.

Observación: Sea la variable aleatoria Y: “número de fallas por milímetro de alambre”. Si λ es el número promedio de fallas por milímetro entonces Y es Poi(λ). Por lo tanto P(Y=y)=

e − λ λy y!

Se busca la función de densidad de la variable aleatoria continua: X: “distancia desde el punto inicial del alambre hasta el sitio donde hay una falla”. Sea la variable auxiliar: N : número de fallas en x milímetros de alambre. N es Poi(xλ) por tanto P(N=n)=

e − xλ ( xλ )n n!

La variable que interesa es X y la distancia hasta la primera falla es mayor que x milímetros si no hay fallas en esos x milímetros por lo tanto: P(X >x)= P(N = 0) =

e − xλ ( xλ )0 = e − xλ entonces P(X < x) = 1 – e − xλ =F(x) 0!

Como f(x) = F’(x) entonces f(x) = –(–λ) e − xλ es decir la función de densidad de x es: f(x) = λ e − xλ , que es precisamente la expresión matemática de la distribución exponencial.

Definición: La variable aleatoria X que es igual a la distancia entre ocurrencias sucesivas de un proceso de Poisson con media λ > 0, tiene distribución exponencial y la función de densidad de probabilidad es la siguiente: f ( x; λ ) = λe − λx con 0 ≤ x ≤ ∞ Tiene un único parámetro λ que es la media de la distribución de Poisson asociada. En cuanto a E(x)= µ =

f x;

1

µ

=

1 λ

1

µ

y Var(X) = σ2=

e

1 − x

µ

1 λ2

por esto la función también se escribe:

con 0 ≤ x ≤ ∞ y µ media de la distribución exponencial.

F ( x; λ ) = 1 − e − λx con 0 ≤ x ≤ ∞

La función de distribución (acumulada) es:

Los gráficos de las funciones de densidad y de distribución (acumulada) son:

8

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Cálculo de probabilidad con la exponencial: Se usa F(x) = P( X < x) = 1 – e − xλ , que representa el valor del área encerrada por la curva de f(x) desde 0 a x. Realice el siguiente ejercicio: En una gran red de computadoras la variable número de usuarios que accede por hora puede modelarse con un proceso de Poisson con media igual a 25 accesos por hora. a) ¿Cuál es la probabilidad de que no haya accesos en un intervalo de 6 minutos? b) ¿Cuál es la probabilidad de que el tiempo que transcurre hasta el siguiente acceso este entre 2 y 3 minutos? c) Determine el intervalo de tiempo para el cual la probabilidad de que no se presenten accesos al sistema durante ese tiempo sea 0.9.

Distribución normal o Gaussiana Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal. Esta distribución es frecuentemente utilizada en las aplicaciones

estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. Al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de campana". En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal. Como los siguientes: Caracteres morfológicos de individuos (personas, animales, plantas, etc.) de una especie, por ejemplo tallas, pesos, envergaduras, diámetros, perímetros, etc. Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen. Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio, etc.

9

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

Errores cometidos al medir ciertas magnitudes. Valores estadísticos muestrales, por ejemplo: la media. Otras distribuciones como la binomial o la de Poisson son aproximaciones normales. Y en general cualquier característica que se obtenga como suma de muchos factores.

Es posible demostrar que el modelo de la función de densidad que corresponde a una distribución normal es el siguiente:

Representación gráfica de esta función de densidad

La distribución normal queda entonces definida por dos parámetros, su media y su varianza. Si X es una variable aleatoria con esta distribución se escribe: X: ~ N ( µ, σ2 ) En cuanto a la influencia de los parámetros en la gráfica de la función, ocurre que si σ2 se mantiene constante, la variación de µ produce desplazamientos rígidos de la campana sobre el eje de las X, ya que µ mide posición o ubicación de la curva. En cambio si µ se mantiene constante, la variación de σ2 modifica la forma de la campana de tal modo que, a menor varianza la curva tiene menor base y mayor altura, ya que σ2 mide dispersión. La función de distribución (acumulada de la función de densidad normal) F(x) tiene las siguientes características:

10

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

F(x) es el área sombreada de esta gráfica

La gráfica de F(x) es:

F(x 1 F(b F(a

X a

b

Cálculo de probabilidad con la distribución normal Como la distribución de probabilidades para variable continua se realiza conforme al área de la función de densidad y sólo es posible calcular probabilidad por intervalos, es necesario para el cálculo utilizar la función acumulada F(x). Resolver la integral que define la distribución acumulada normal no siempre es posible y existen infinitas curvas normales que dependen de µ y σ por lo tanto tampoco es posible construir infinitas tablas. Entonces para calcular probabilidades, se utiliza un elemento de la familia de normales, que se denomina "normal tipificada", tiene media igual a 0 y varianza igual a 1 y su ventaja reside en que hay tablas, o rutinas de cálculo que permiten obtener esos mismos valores, donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución. Además, toda distribución normal se puede transformar en una normal tipificada:

Si X es una variable aleatoria normal con E(x)=µ y Var(x)=σ2 entonces Z= aleatoria normal con E(z)= 0 y Var(z)= 1, es decir Z ~ N( 0,1) La función de densidad de Z es

11

x-µ σ

es una variable

UNIVERSIDAD BLAS PASCAL Carrera: INGENIERÍA EN TELECOMUNICACIONES Asignatura: INTRODUCCIÓN A LA PROBABILIDAD

y su función de distribución es

Mediante el siguiente gráfico de la función de densidad ϕ(z), es posible visualizar lo que representa F(z):

La variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada o estandarizada. La distribución normal tipificada tiene la ventaja de que las probabilidades acumuladas, para cada valor de z, se encuentran recogidas en una tabla.

Entonces es posible usar la tabla para calcular probabilidades de cualquier distribución normal si se considera que: Si X:~ N(µ, σ2) entonces P(X< x) = P(

X-µ σ