Citation preview

ESTADÍSTICA Y PROBABILIDAD

M.Sc. Est. Carlos Daniel Gonzales Hidalgo.

1

1. PROBABILIDAD 1.1. INTRODUCCIÓN La estadística representa un método para la toma de decisiones frente a la incertidumbre y como tal, se basa en la teoría de probabilidades, pues la probabilidad es la medida de la incertidumbre y de los riesgos asociados con ella. Por ello, el estudiante, antes que aprender procedimientos estadísticos para tomar decisiones, debe tener un concepto claro de la teoría de probabilidad. Un tratamiento preciso de la teoría de probabilidad requiere de dos enfoques, uno inicial, basado en la teoría de conjuntos, y un segundo basado en las distribuciones de probabilidad. El primer enfoque nos permite comprender con claridad el concepto de probabilidad, así como obtener un listado de axiomas y propiedades fundamentales de la teoría de probabilidad. Con el segundo enfoque, llegamos a representaciones matemáticas que facilitan el cálculo de probabilidades, mediante fórmulas que se ajustan regularmente a ciertos fenómenos o experimentos. 1.2. EXPERIMENTO En estadística se considera experimento al proceso mediante el cuál se obtienen los datos, ya sea de naturaleza cualitativa o cuantitativa. 1.2.1. EXPERIMENTO DETERMINÍSTICO Se llama así al fenómeno o experimento que siempre tiene que ocurrir. Es decir se presenta de una única manera y existen fórmulas matemáticas que describen el fenómeno y con las que se pueden determinar el resultado del experimento. Ejemplos: 1.

El experimento consiste en dejar en el aire un plumón, éste siempre tiene que caer, pues la ley de la gravedad hará que sea atraída al suelo. 2. Elevamos el precio de un bien, inmediatamente se reducirá la cantidad demandada. 1.2.2. EXPERIMENTO NO DETERMINISTICO O ALEATORIO Se llama así al fenómeno o experimento en el que no se puede determinar con certeza su resultado, debido a que las causas que lo originan son no predecibles por ser aleatorias. ¿Por qué se dice que el experimento es no determinístico o aleatorio? Por que: a. Sus resultados son producto del azar. b. Se puede repetir, cada experimento muchas veces sin cambiar las condiciones. c. Sus resultados posibles se pueden enlistar en un conjunto.

2

Ejemplos: 1.

Lanzar una moneda sobre una mesa es un experimento aleatorio; unas veces resulta cara otras veces sello. Si en este experimento “cargásemos” la moneda (revistiendo la cara con un metal pesado) de tal manera que al lanzarla a una mesa siempre resulte cara, el experimento deja de ser aleatorio y pasaría a ser determinístico. 2. Consideremos un partido entre dos equipos de Fútbol; desde el punto de vista de los resultados (goles). Siempre queda un margen de azar en la determinación del número de goles a favor o en contra. 3. Los juegos de lanzar dados, barajas, loterías, ruletas, carrera de caballos, etc. son típicamente aleatorios. 4. Observar la vida útil de un artículo. 1.3. ESPACIO MUESTRAL () Se denomina espacio muestral, al conjunto formado por todos los resultados posibles de un experimento aleatorio. En notación matemática el espacio muestral se define como sigue:  = {x / x es resultado de un experimento aleatorio} Ejemplos: Describir el espacio muestral asociado a cada uno de los experimentos aleatorios: 1. Lanzar una moneda al piso y observar el resultado que ocurre en la cara superior de la moneda.  = {c, s}  n () = 2 2. Lanzar dos monedas consecutivas al piso y observar el resultado que ocurre en la cara superior de las monedas.  = {(c, c), (c, s), (s, c), (s, s)}  n () = 4

1

2 C

=

( C, C )

S

=

( C, S )

C

=

( S, C )

C

S S = ( S, S ) _________________________________________________ 2

*

2

=

4 3

3. Elegir el Presidente de una asociación, de un grupo de 5 candidatos (A, B, C, D, E).  = {A, B, C, D, E}  n () = 5 4. Lanzar una moneda hasta obtener cara y contar el número de lanzamientos.  = {1, 2, 3,…} 5. Determinar la vida útil de un artículo.  = {w  / w  0} 1.4. EVENTO O SUCESO Se llama evento o suceso a todo subconjunto del espacio muestral. A los eventos se les denota con las primeras letras mayúsculas del alfabeto, así decimos: A = Es un evento  A   A  se le considera evento seguro y a  evento imposible. Ejemplo: Suponga que se lanza dos monedas consecutivas al piso y se observa el resultado que ocurre en la cara superior de las monedas. Enliste los siguientes eventos: a). Se obtuvo exactamente una cara. b). Se obtuvo exactamente dos sellos. c). Se obtuvo por lo menos una cara. d). Se obtuvo mas de una cara. e). Se obtuvo a lo más dos caras. f). Se obtuvo menos de dos caras. Solución.  = {(c, c), (c, s), (s, c), (s, s)}  n () = 4 a). A = {(c, s), (s, c)}  n (A) = 2 b). B = {(s, s)}  n (B) = 1 c). C = {(c, c), (c, s), (s, c)}  n (C) =3 d). D = {(c, c)}  n (D) = 1 e). E = {(c, c), (c, s), (s, c), (s, s)}  n (E) = 4 f). F = {(c, s), (s, c), (s, s)}  n (F) = 3

4

1.5. ALGEBRA DE EVENTOS Usando las leyes del álgebra de conjuntos se puede formar nuevos eventos, los cuales son subconjuntos del mismo espacio muestral de donde provienen los eventos dados. Así para los eventos dados. Así, para los eventos A, B Y C de  se cumplen las siguientes leyes: 1.5.1. LEY DE IDEMPOTENCIA: a) Unión: AA =A b) Intersección: AA =A 1.5.2. LEY ASOCIATIVA: a) Unión: A(BC) = (AB)C = (ABC) b) Intersección: A(BC) = (AB)C = (ABC) 1.5.3. LEY CONMUTATIVA: a) Unión: AB = BA b) Intersección: AB =BA 1.5.4. LEY DISTRIBUTIVA: a) Unión: A(BC) = (AB)  (AC) b) Intersección: A(BC) =(AB)  (AC) 1.5.5. LEYES DE MORGAN: a) Unión: (AB)´ =A´  B´ b) Intersección: (AB)´ = A´  B´ 1.5.6. LEYES DEL COMPLEMENTO: a) Unión: AA´ = 

b) Intersección: AA´ =  1.5.7. LEY DE IDENTIDAD: a) Unión: A=A y A =  b) Intersección: A = 

y A=A

5

1.6. TÉCNICAS DE CONTEO 1.6.1. PERMUTACIONES Permutación es un arreglo lineal de todos los elementos de un conjunto o parte de los elementos del conjunto (subconjunto) tomados en un orden definido. El número total de permutaciones está en función al número de elementos tomados a la vez para cada permutación. Según esto podemos distinguir tres casos: a) Permutaciones simples.

a.1.

n n

P = n

a.2.

n r

P = n / (n-r) 

b) Permutaciones con objetos repetidos. P

n n1, n2, n3,...nk

= n / (n1 * n2 * … *nk)

c) Permutaciones circulares.

PCn = (n-1)  Ejemplos: 1. Se invita a 5 gerentes de grandes Empresas de Chiclayo, para dar a los alumnos de Marketing y Negocios Internacionales de la UCV, una conferencia sobre exportación. ¿De cuántas maneras distintas se pueden sentar los gerentes en una fila?

P = 5 = 5*4*3*2*1 =120

5 5

2. De un grupo de 4 personas, se tiene que elegir a 3 personas que deben ocupar el cargo de presidente, secretario, y vocal. ¿De cuántas maneras se pueden hacer los arreglos?

P = 4 / (4-3) = 24

4 3

3. El número de formas diferentes de permutar 12 objetos iguales en todo, salvo el color, de los cuales 3 son negros, 4 son blancos y 5 son rojos es,

P

12 3, 4, 5

= 12 / (3 * 4 *5) =27720

4. ¿De cuántas maneras diferentes pueden sentarse 9 personas alrededor de una mesa elipsoidal? PC9 = (9-1)  =8

6

1.7. COMBINACIONES Cuando hablamos de combinaciones, no debemos tener en cuenta el orden de los elementos; sólo nos interesa que se combine un elemento con otro. nCr = n / r(n-r) Ejemplos: 1. ¿Cuántos cables de conexión se necesitan para que dos aulas cualesquiera, de doce aulas existentes en total en una Universidad, puedan comunicarse directamente? C2 = 12 / 2 (12-2) = 66

12

2. Una caja contiene 20 tornillos similares, de los cuales 10 son buenos, 8 tienen defectos del tipo A, 5 tienen defectos del tipo B, y 3 los dos tipos de defectos.¿Cuántos elementos tiene el espacio muestral que resulta de escoger al azar 11 tornillos de manera que 2 tengan defectos Ay B, 3 defectos sólo A, 2 con defectos sólo B y 4 sin defectos?

C4 * 5C3 * 3C2 * 2C2 = 6300

10

3. Dados los eventos A de 4 elementos, y B de 8 elementos.¿Cuántos eventos de 6 elementos pueden formarse si cada uno debe contener: a) Un solo elemento de A? b) Por lo menos un elemento de A? Solución: a)

4

C1 * 8C5 = 224 formas.

b)

4

C1 * 8C5+ 4C2 * 8C4+ 4C3 * 8C3+ 4C4 * 8C2 = 896 formas.

1.8. PROBABILIDAD DE OCURRENCIA DE OCURRENCIA DE UN EVENTO 1.8.1. DEFINICIÓN DE PROBABILIDAD CLÁSICA Si A es un evento de , la probabilidad de que ocurra el evento A está dada por:

P(A)= n(A) / n ()

Experimento aleatorio

Evento (A) n(A)

Espacio muestral n()

P(A)= n(A) / n ()

7

Ejemplo: Suponga que el experimento aleatorio consiste en lanzar un dado y observar el resultado que ocurre en la cara superior del dado. Calcular la probabilidad de que ocurra: a) b) c) d)

El número 6. Por lo menos el número 4. A lo más el número 2. Por lo menos el número 1.

Solución:  = {1, 2, 3, 4, 5, 6}  n () = 6 a) A= {6}  n (A) = 1 P(A)= n(A) / n () = 1/6 b) B= {4, 5, 6} n (B) = 3. P(B)= n(B) / n () = 3/6 c) C = {1, 2}  n (C) = 2. P(C)= n(C) / n () =2/6 d) D = {1, 2, 3, 4, 5, 6}  n (D) = 6 P(D)= n(D) / n () =6/6 1.8.1. DEFINICIÓN DE FRECUENCIA RELATIVA La probabilidad de un evento (que suceda o que resulte) es la proporción de veces que el evento sucedería en una serie prolongada de eventos repetidos. Ejemplo: La tabla siguiente, muestra el estado civil de 30 Trabajadores de una Empresa. Año 2005. ESTADO CIVIL SOLTERO CASADO TOTAL

ni 20 10 30

Si se selecciona un trabajador al azar, ¿cuál es la probabilidad de que sea soltero? Solución: P(Soltero)= 20 / 30

8

1.9. AXIOMAS DE PROBABILIDAD A.1. 0 P(A)  1 A.2. P() =1 A.3. Si A y B son dos eventos en , tales que A y B son mutuamente excluyentes (AB = )  P(AB) = P(A)+P(B) Este axioma se puede extender para k eventos mutuamente excluyentes A1, A2,…, AK, es decir P( A1A2 …AK) = P(A1)+P(A2)+…+P(AK) 1.10. TEOREMAS DE PROBABILIDAD T.1. P( ) = 0

T.2. P(A´) = 1- P(A) T.3. Si AB  P(A)  P(B) T.4. Si A y B no son mutuamente excluyentes ( AB  )  P(AB) = P(A)+P(B) -P (AB) T.5. Si A, B y C no son mutuamente excluyentes

 P(ABC) = P(A)+P(B)+P(C) -P (AB) - P (AC)- P (BC)+ P (ABC) Ejemplos: 1. La probabilidad de que la señora hablantina reciba por lo menos 8 llamadas telefónicas en un día es 0.2 y la probabilidad de que reciba a lo más 5 llamadas telefónicas en un día es 0.3. Hallar la probabilidad de que la señora hablantina reciba 6 ó 7 llamadas en un día. Solución:  = {0,1 ,2 ,3 ,4 ,5, 6, 7, 8, 9,...} A= {8, 9,…}  P(A) = 0.2 B= {0, 1, 2, 3, 4, 5} P(B)=0.3 C = {6, 7}  P(C) = ? ABC =  P (ABC) = P() P(A) + P(B) + P(C) = 1 0.2 + 0.3 + P( C) = 1  P( C) = 0.5 9

2. Un escolar entra a una tienda de golosinas. La probabilidad de que compre caramelos es 0.7, la probabilidad de que compre galletas es 0.5 y la probabilidad de que compre ambos (caramelos y galletas) es 0.3. Hallar la probabilidad de compre caramelos, o galletas o ambos. Solución: Sean los eventos: A = El niño compra caramelos B = El niño compra galletas AB = El niño compra caramelos y galletas P(AB) = P(A)+P(B) -P (AB) = 0.7 + 0.5 – 0.3 = 0.9 1.11. PROBABILIDAD CONDICIONAL A menudo se quiere determinar la probabilidad de que ocurra un evento sabiendo que otro evento ha ocurrido. La probabilidad condicional (o condicionada) de que un evento B ocurra dado que otro evento a ha ocurrido se denota por P(B/A). Esta notación se lee “. La probabilidad de que B ocurra dado que A ha ocurrido” o simplemente la probabilidad de B dado A” P(B/A) = P (AB) / P(A) , Si P(A) 0 Ejemplo: Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3 son profesionales. Además, 1/3 de las mujeres son no profesionales. a) Se elige al azar un socio del club: a.1) Calcular la probabilidad de que sea hombre y profesional. a.2) Calcular la probabilidad de que sea hombre, dado que es profesional. b) Se eligen tres socios al azar: b.1) Si las tres son mujeres, ¿cuál es la probabilidad de que sólo l de ellas sea profesional? b.2) Si resultan ser del mismo sexo, ¿cuál es la probabilidad de que sean mujeres?. Solución: PROFESIONAL NO PROFESIONAL TOTAL HOMBRE (H) 60 30 90 MUJER (M) 40 20 60 TOTAL 100 50 150 a) a.1) P(H  P) = 60/150 = 0.4 a.2) P(H/P) = P (HP) / P(P) = (60/150) / (100/150) = 0.6 b) b.1) b.2)

A = Las tres son mujeres B = Sólo una es profesional P(B/A) = ( 40C1 * 20C2)/ 60C3 A = Los tres son del mismo sexo B = Las tres son mujeres P(B/A) = ( 60C3 )/ (90C3 + 60C3) = 0.23 10

1.12. EVENTOS INDEPENDIENTES Se dice que el evento B es independiente del evento A, si, P(B/A) = P(B) Se verifica que, si P(B/A) = P(B), entonces, P(A/B) = P(A) y recíprocamente En consecuencia, podemos afirmar que: Los eventos A y B son independientes si, y sólo si, P(B/A) = P(B) y P(A/B) = P(A). Esto equivale a decir que A y B son independientes si sólo si P(AB) = P (A) P(B) Ejemplo: Suponga que en un proceso de producción se utilizan las máquinas. 1 y 2, que trabajan en forma independiente para producir cierto bien. Si la probabilidad de que ambas máquinas fallen es 1/5 y de que falle sólo la 2 es 2/15. Calcular la probabilidad de que a) Falle sólo la máquina 1. b) La producción continúe. Solución: P(AB) =1/5 = 3/15, P(A´B) = 2/15, entonces, P(B)= 5/15 Además de P(AB) = P (A) P(B), resulta, P(A) = 9/15 a) P(AB´) = P (A) P(B´) = 9/15 * 10/15 = 6/15 b)

P(A´B  AB´  A´B´ ) = P(A´B) + P(AB´) + P( A´B´ ) = P(A´) P(B) + P(A) P(B´) + P( A´) P(B´) = 6/15 * 5/15 + 9/15*10/15 + 6/15 * 10/15 = 12/15

11

1.13. PROBABILIDAD TOTAL Si k eventos: A1, A2,..,AK, constituyen una partición del espacio muestral , entonces, para cualquier evento B en , P(B) = P(A1) * P(B/A1)+P(A2)*P(B/A2)+…+P(AK)*P(B/AK) 

A1

A2



AK

B

TEOREMA DE BAYES Para cualquier evento Ai de la partición, se tiene: P(Ai/B) = P (Ai ) P(B/ P(Ai) / P(B) , Si P(B)  0

Ejemplo: Las probabilidades de que los socios S 1 y S2 sean elegidos presidente de un club son respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las cuotas mensuales de los socios son de 0.9 si sale elegido S1 y de 0.2 si sale elegido S2. a) ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales de los socios?. b) Si se aumenta la cuota mensual, ¿ cómo se modifican las probabilidades de que salgan elegidos los socios S1 y S2 ?. Solución: S1

0.9

A

0.2

A

0.4

0.6

S2

a) P(A) = P(S1) * P(A/S1)+P(S2)*P(A/S2) = 0.4*0.9 + 0.6*0.2 = 0.48 b) P(S1/A) = P (S1 ) P(A/ P(S1) / P(A) = 0.75 P(S2i/B) = P (S2) P(B/ P(S2) / P(A) = 0.25 La probabilidad de S1 se modifica de 0.4 A 0.75 y la de S2 se modifica de 0.2 a 0.25 12

Laboratorio Nº 01 1. Sean A, B, y C tres eventos cualesquiera de un espacio muestral , expresar cada uno de los siguientes eventos compuestos en términos de operaciones entre A, B y C: a) b) c) d) e)

Ocurra por lo menos uno de los eventos. Ocurran todos los eventos. Ocurra exactamente uno de los eventos No ocurran ninguno de los eventos. No ocurra más de uno de los eventos.

2. Cada uno de cuatro amigos elige una bebida al azar en la cafetería. Describa el espacio muestral del experimento si hay disponibles en tres sabores denominados por L, N y F, ¿cuántos elementos tiene?. 3. Un lote de N artículos contiene k defectuosos, describir el espacio muestral del número de artículos extraídos hasta obtener el último defectuoso. 4. Un experimento consiste en observar la vida útil de dos objetos, describa el evento “la duración del primero más la duración del segundo es al menos 4 años”. 5. En un edificio de 10 pisos entran al ascensor al primer piso tres personas. Cada una baja al azar a partir del segundo piso. ¿De cuántas maneras distintas estas personas pueden bajar en pisos diferentes?. 6. Cierto producto se arma en tres etapas. En la primera hay 5 líneas de ensamblado, en la segunda 6, y en la tercera 4. ¿De cuántas maneras distintas puede hacerse circular el producto durante el proceso de ensamblado? 7. Una caja contiene 8 dulces de piña; 6 de naranja y 4 de fresa. ¿Cuántos elementos tiene el espacio muestral que resulta de extraer al azar un dulce de cada sabor? 8. Cierta marca de sierra eléctrica es calificada por especialistas, en cuanto a rendimiento, como: “Muy buena”, (B1); o, “buena”, (B2); o “regular”, (B3), y en cuanto al precio, como “cara”, (C1), o “barata”; (C2). ¿ De cuántas maneras es calificada la sierra eléctrica por los especialistas?. 9. Un grupo de 5 hombres y 10 mujeres, se divide al azar en 5 grupos de 3 personas cada una. Calcular el número de maneras en que cada grupo contenga un hombre. 10. ¿De cuántas maneras diferentes puede un padre dividir 8 regalos entre sus 3 hijos, si el mayor debe recibir 4 regalos y los menores 2 cada uno?

13

11. Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6 y 2/5 respectivamente. Si la probabilidad de al menos una de las dos componentes falle es 7/30, calcular la probabilidad de que: a) Ninguno de las dos componentes fallen. b) Sólo una de las componentes falle. 12. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es 0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 0.04. Calcular la probabilidad de que: a) Todos los objetos sean no defectuosos. b) Exactamente un objeto sea defectuoso. 13. Doscientas personas están distribuidas de acuerdo a su sexo y lugar de procedencia de la siguiente manera: 130 son hombres, 110 son de la capital y 30 son mujeres y de provincias. Si se eligen dos personas al azar calcular la probabilidad de que: a) Ambos sean hombres y de provincias. b) Al menos uno de los dos escogidos sea mujer. 14. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4 tienen algún tipo de defecto. Un cliente pide para comprar 3 de tales artículos pero que no tengan defectos. Si el comerciante escoge al azar y de una sola vez 4 de tales artículos, ¿cuál es la probabilidad de que con las 4 unidades escogidas satisfaga el pedido del cliente? 15. Cien personas fueron encuestadas acerca de sus preferencias sobre tres productos A, B, y C. Se encontró que 50 prefieren el A, 37 el B, y 30 el C. Además 12 prefieren A y B, 8 sólo A y C, 5 sólo B y C, y 15 sólo C. De cinco personas encuestadas elegidas al azar, calcular la probabilidad de que 2 de ellas prefieran B, y C, 2 sólo A y B, y una prefiera los tres productos. 16. Si P(A)=5/8, P(B)=3/4 y P(A/B)=2/3, calcular P(A/B´) 17. Si P(B)=3/15, P(B/A)=1/5, y P(AB)=1/15, calcular P(AB´) 18. De 20 clientes de crédito de una tienda comercial, 100 tienen créditos menores que $ 200, 15 tienen créditos de al menos $ 500, y 110 tienen créditos menores de 4 años. Además 30 clientes tienen créditos de al menos 4 años y de 200 a menos de $500, y 10 clientes tienen créditos al menos $500 y menos de 4 años. a) Si se elige un cliente al azar, ¿cuál es la probabilidad de que tenga crédito menos de de 4 años si tiene saldo de crédito de menos de $ 200? b) Si se eligen dos clientes al azar y resultan de al menos de 4 años de crédito, ¿cuál es la probabilidad de que uno tenga saldo de crédito de $ 500 o más? 19. Sólo el 60% de la mercadería que recibe un comerciante del fabricante A es de calidad excepcional, mientras que el 90% de la mercadería que recibe del fabricante B es de calidad excepcional. Sin embargo la capacidad del fabricante B es limitada, y, por esta razón sólo el 30% de la mercadería le es permitido adquirir del fabricante B, el 70% la adquiere de A. Se inspecciona un embarque que acaba de llegar y se encuentra que es de calidad excepcional, ¿cuál es la probabilidad de que provenga del fabricante A?. 14

2. DISTRIBUCIONES DE PROBABILIDAD 2.1. INTRPODUCCIÓN En la primera unidad desarrollamos algunos modelos probabilísticas a través de espacios maestrales. Esto facilitó la comprensión del concepto de probabilidad y la obtención de algunas propiedades fundamentales de la teoría de probabilidad, sin embargo, para estudiar situaciones prácticas más generales, necesitamos ampliar estos conceptos para que tengamos distribuciones(o modelos) de probabilidad que representen todos los tipos de variables definidas e en la asignatura de Estadística Descriptiva. Así todo lo estudiado en tal asignatura para hacer un tratamiento descriptivo de las variables cuantitativas tendrá su correspondiente distribución( o modelo teórico). Estas variables numéricas a las cuales asociamos distribuciones de probabilidad, serán llamadas variables aleatorias. 2.2. VARIABLE ALEATORIA Una variable estadística es una característica (cualitativa o cuantitativa) que se mide u observa en una población. Si la población es aleatoria y la característica es cuantitativa la variable estadística es denominada variable aleatoria. Las variables aleatorias se clasifican en discretas y continuas. Definición. Se denomina variable aleatoria, a una variable estadística cuantitativa definida en un espacio muestral . El dominio de la variable aleatoria X es el espacio muestral  y el rango es un subconjunto de los números reales que denotaremos por RX, siendo, RX = {x  / x = X (w), w  } Ejemplo: Sea  el espacio muestral que se obtiene al lanzar al aire una moneda tres veces consecutivas, esto, es,  = {SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}. Si X es el número de caras obtenidas, entonces X es una variable aleatoria cuyo rango es: RX = {0, 1, 2, 3}.

2.2.1. VARIABLE ALEATORIA DISCRETA: FUNCIÓN DE PROBABILIDAD Y FUNCIÓN DE DISTRIBUCIÓN ACUMULADA. 2.2.1.1. PROBABILIDAD EN EL RANGO RX. 15

Una variable aleatoria discreta asume cada uno de sus valores con cierta probabilidad que denotaremos por PX (probabilidad inducida por X). En efecto, si el rango de la variable aleatoria X es el conjunto finito de números, RX = {1, 2, …, xn}y si B ={xi} es un evento en RX, entonces, PX = ({xi}) = P ({x  / X (w) = xi}), PX = xi = P ({w  / X (w) = xi}). 2.2.1.2. FUNCIÓN DE PROBABILIDAD Sea X una variable aleatoria discreta. Se denomina función (ley o modelo o distribución) de probabilidad de X a la función f(x) definida por f(x) = PX = x para todo x número real y que satisface las siguientes condiciones: i) f(x) >= 0 para todo x  R, y

ii)

 f ( xi)  1

xiRx

NOTAS. 1. Si A  RX, entonces, la probabilidad de A es el número:

 P X

P ( A) 

xiRx

 xi  =

 f ( xi )

xiRx

2. La función de probabilidad de una variable aleatoria X se puede expresar: por una ecuación: f(x) = PX = x = expresión de x, o por el conjunto de pares {(xi,pi)/pi = f(xi), xi  RX} o por una tabla, si RX es finito. Valores de xi de X Probabilidad Pi = P X  xi 

x1 p1

x2 p2

x3 p3

… …

xn pn

La gráfica de una distribución de probabilidades discreta es la gráfica de bastones. Ejemplo: Sea X la variable aleatoria definida como el número de caras que ocurren al lanzar un moneda 4 veces. a) Determinar la distribución de probabilidades de X. b) Calcular la probabilidad P0 0,816) = 1 - P (Y < 0,816) = 1 - 0,7925 (aprox.) = 0,2075 Luego, el 20,75% de la población tiene una renta inferior a 3 millones ptas. b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más elevada. Vemos en la tabla el valor de la variable estándar cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por encima se sitúa el 10% superior. Ese valor corresponde a Y = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal estándar:

32

Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 millones de ptas. constituyen el 10% de la población con renta más elevada. c) Nivel de ingresos mínimo y máximo que engloba al 60% de la población con renta media Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la media y este valor de Y hay un 30% de probabilidad. Por otra parte, al ser la distribución normal simétrica, entre -Y y la media hay otro 30% de probabilidad. En definitiva, el segmento (-Y, Y) engloba al 60% de población con renta media. El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y. Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 millones de ptas. e inferiores a 5,03 millones de ptas. constituyen el 60% de la población con un nivel medio de renta.

Ejercicio 2: La vida media de los habitantes de un país es de 68 años, con una varianza de 25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes: a) ¿Cuántas personas superarán previsiblemente los 75 años? b) ¿Cuántos vivirán menos de 60 años? a) Personas que vivirán (previsiblemente) más de 75 años Calculamos el valor de la normal tipificada equivalente a 75 años

Por lo tanto P (X > 75) = (Y > 1,4) = 1 - P (Y < 1,4) = 1 - 0,9192 = 0,0808 Luego, el 8,08% de la población (808 habitantes) vivirán más de 75 años. b) Personas que vivirán (previsiblemente) menos de 60 años Calculamos el valor de la normal tipificada equivalente a 60 años

Por lo tanto 33

P (X < 60) = (Y < -1,6) = P (Y > 1,6) = 1 - P (Y < 1,6) = 0,0548 Luego, el 5,48% de la población (548 habitantes) no llegarán probablemente a esta edad. Ejercicio 3: El consumo medio anual de cerveza de los habitantes de un país es de 59 litros, con una varianza de 36. Se supone que se distribuye según una distribución normal. a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año para pertenecer al 5% de la población que más bebe? b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría argumentar en su defensa? a) 5% de la población que más bebe. Vemos en la tabla el valor de la variable estándar cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estaría el 5% restante. Ese valor corresponde a Y = 1,645 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal estándar:

Despejando X, su valor es 67,87. Por lo tanto, tendría usted que beber más de 67,87 litros al año para pertenecer a ese "selecto" club de grandes bebedores de cerveza. b) Usted bebe 45 litros de cerveza al año. ¿Es usted un borracho? Vamos a ver en que nivel de la población se situaría usted en función de los litros de cerveza consumidos. Calculamos el valor de la normal estándar correspondiente a 45 litros:

Por lo tanto P (X < 45) = (Y < -2,2) = P (Y > 2,2) = 1 - P (Y < 2,2) = 0,0139 Luego, tan sólo un 1,39% de la población bebe menos que usted. Parece un argumento de suficiente peso para que dejen de catalogarle de "enamorado de la bebida"

Ejercicio 4: A un examen de oposición se han presentado 2.000 aspirantes. La nota media ha sido un 5,5, con una varianza de 1,5. 34

a) Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir organizando una fiesta para celebrar su éxito? b) Va a haber una 2ª oportunidad para el 20% de notas más altas que no se hayan clasificados. ¿A partir de que nota se podrá participar en esta "repesca"? a) Ha obtenido usted un 7,7 Vamos a ver con ese 7,7 en que nivel porcentual se ha situado usted, para ello vamos a comenzar por calcular el valor de la normal estándar equivalente.

A este valor de Y le corresponde una probabilidad acumulada (ver tablas) de 0,98214 (98,214%), lo que quiere decir que por encima de usted tan sólo se encuentra un 1,786%. Si se han presentado 2.000 aspirante, ese 1,786% equivale a unos 36 aspirantes. Por lo que si hay 100 plazas disponibles, tiene usted suficientes probabilidades como para ir organizando la "mejor de las fiestas". b) "Repesca" para el 20% de los candidatos Vemos en la tabla el valor de la normal estándar que acumula el 80% de la probabilidad, ya que por arriba sólo quedaría el 20% restante. Este valor de Y corresponde a 0,842 (aprox.). Ahora calculamos el valor de la normal X equivalente:

Despejamos la X y su valor es 6,38. Por lo tanto, esta es la nota a partir de la cual se podrá acudir a la "repesca".

2.5. Teorema Central del Límite El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal. Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye según una distribución normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas. Los parámetros de la distribución normal son: 35

Media: n *  (media de la variable individual multiplicada por el número de variables independientes) Varianza: n *  (varianza de la variable individual multiplicada por el número de variables individuales) 

Veamos un ejemplo: Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable independiente que se distribuye según el modelo de Bernouilli, con media 0,5 y varianza 0,25. Calcular la probabilidad de que en estos 100 lanzamientos salga más de 60 caras. La variable suma de estas 100 variables independientes se distribuye, por tanto, según una distribución normal. Media = 100 * 0,5 = 50 Varianza = 100 * 0,25 = 25 Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal estándar equivalente:

(*) 5 es la raíz cuadrada de 25, o sea la desviación típica de esta distribución Por lo tanto: P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228 Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es tan sólo del 2,28%

EJERCICIOS Ejercicio 1. La renta media de los habitantes de un país se distribuye uniformemente entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas. Cada renta personal es una variable independiente que se distribuye según una función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Límite. La media y varianza de cada variable individual es: 36

 = (4 + 10 ) / 2 = 7  2 = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son: Media: n *  = 100 * 7 = 700 Varianza: n *  = 100 * 3 = 300 Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones ptas, comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego: P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49% Ejercicio 2. En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces? Se vuelve a aplicar el Teorema Central del Límite. Salir a la pizarra es una variable independiente que sigue el modelo de distribución de Bernouilli: "Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10 "No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9 La media y la varianza de cada variable independientes es:  = 0,10  2 = 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son: Media: n *  = 100 * 0,10 = 10 Varianza: n *  = 100 * 0,09 = 9

37

Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el valor equivalente de la variable normal estándar:

Luego: P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del curso es tan sólo del 4,75% Ejercicio 3. Un día visitamos el Casino y decidimos jugar en la ruleta. Nuestra apuesta va a ser siempre al negro y cada apuesta de 500 ptas. Llevamos 10.000 ptas. y queremos calcular que probabilidad tenemos de que tras jugar 80 veces consigamos doblar nuestro dinero. Cada jugada es una variable independiente que sigue el modelo de distribución de Bernouilli. "Salir negro", le damos el valor 1 y tiene una probabilidad del 0,485 "No salir negro", le damos el valor 0 y tiene una probabilidad del 0,515 (*) La probabilidad de "no salir negro" es mayor ya que puede salir rojo o el cero La media y varianza de cada variable individual es:  = 0,485  2 = 0,485 * 0,515 = 0,25

A la suma de las 80 apuestas se le aplica el Teorema Central del Límite, por lo que se distribuye según una normal cuya media y varianza son: Media: n *  = 80 * 0,485 = 38,8 Varianza: n *  = 80 * 0,25 = 20 Para doblar nuestro dinero el negro tiene que salir al menos 20 veces más que el rojo (20 * 500 = 10.000), por lo que tendrá que salir como mínimo 50 veces (implica que el rojo o el cero salgan como máximo 30 veces). Comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego: P (X > 50) = P (Y > 2,50) = 1 - P (Y < 2,50) = 1 - 0,9938 = 0,0062

38

Es decir, la probabilidad de doblar el dinero es tan sólo del 0,62% (así, que más vale que nos pongamos a trabajar).

Ejercicio 4. El precio de una acción en bolsa se mueve aleatoriamente entre 10 ptas. y 20 ptas., con la misma probabilidad en todo el tramo. Hemos dado la orden a nuestro broker de que nos compre paquetes de 1.000 acciones cada día durante las próximas 40 sesiones. Una vez ejecutada la orden, tenemos un total de 40.000 acciones. A final de año vendemos todas las acciones al precio de 13 ptas./acción, recibiendo 520.000 ptas. Calcular la probabilidad de que ganemos dinero en esta operación. El precio de cada paquete comprado es una variable aleatoria independiente que se distribuye uniformemente entre 10.000 ptas y 20.000 ptas. Su media y varianza son:  = (10.000 + 20.000 ) / 2 = 15.000  2 = (20.000 - 10.000)^2 / 12 = 833,3

El precio total de los 40 paquetes comprados se distribuye según una distribución normal cuya media y varianza son: Media: n *  = 40 * 15.000 = 600.000 Varianza: n *  = 40 * 833,3 = 33.333,3 Para estimar la probabilidad de que ganemos dinero, calculamos el valor equivalente de la variable normal tipificada:

Luego: P (X > 520.000) = P (Y > 2,40) = 1 - P (Y < 2,40) = 1 - 0,9918 = 0,0082

Por tanto, la probabilidad de que ganemos dinero con la "dichosa" operación es tan sólo del 0,82% 2.6. Aproximación de la Poisson a la normal. Sean X1, X2…m Xn, n, variables aleatorias independientes e idénticamente distribuidas como Poisson cada una con promedio  en un intervalo dado. Es decir en el mismo intervalo cada X i, ocurre con media y varianza iguales a  . Entonces, para n suficientemente grande la variable: X 

n



i 1

Xi

tiene distribución de Poisson con media y varianzas iguales a n  . 39

en consecuencia, por el teorema del límite central, la variable aleatoria: Z 

X  n n

Tiene aproximadamente distribución N(0,1), cuando n es suficientemente grande. La aproximación es buena si n  5 . EJEMPLO: El promedio del número de accidentes de trabajo en una fábrica es 2 cada semana. Calcular la probabilidad de que se produzcan más de 30 accidentes durante 50 semanas. SOLUCIÓN. Sea Xi; # de accidentes por semana con un promedio de   1, Entonces, X 

50



i 1

X i es el número de accidentes en 25 semanas.

tiene distribución de Poisson con media y varianzas iguales a n  50 x 2  100

Por el teorema del límite central, la variable aleatoria: Z 

X  n n



X  100 10

Tiene aproximadamente distribución N(01,1). P  X  115  P X   114.5  P Z  1.45  0.0735

Laboratorio Nº 02 BinomiaI 1. Si X-B(n,p) tal que E(X)=3 y V(X)=2.4 ,calcular: P[X=3]. 2. Un estudiante contesta al azar (o sea sin saber nada) a 9 preguntas, siendo cada una de 4 respuestas de las cuales sólo una es la correcta. a) Determinar la distribución de probabilidades del número de preguntas contestadas correctamente. b) Si para aprobar tal examen debe contestar correctamente al menos 6 preguntas, ¿cuál es la probabilidad de aprobar el examen? 40

. 3. En una producción, la probabilidad de que un objeto sea defectuoso es 0.2. Si en una muestra de n de tales objetos escogidos al azar uno por uno, se espera que haya un defectuoso, a) calcular la probabilidad de que haya un objeto defectuoso. b) ¿cuántos objetos defectuosos es más probable' que ocurra? 4. El 75% de la mercadería que recibe un comerciante del fabricante A es de calidad excepcional, mientras que el 80'% de la mercadería que recibe del fabricante B es de calidad excepcional. El 60% del total de la mercadería lo adquiere de A y el resto de B. Si se seleccionan 4 unidades de la mercadería, ¿qué probabilidad hay de que se encuentren 2 unidades que sean de calidad excepcional? 5. En una empresa donde los empleados son 80% hombres y 20% mujeres están aptos para jubilarse el 10% de las mujeres y el 10% de los hombres. De cinco solicitudes para jubilarse, ¿cuál es la probabilidad de que al menos dos estén aptos para jubilarse? 6. Un vendedor a domicilio compra diariamente 10 unidades de un producto a $2 cada una. Por cada uno, gana 13$ si vende o pierde 1$ si no vende en el día. Si la probabilidad de venta de cada unidad es 0.2 y si las ventas son independientes a) hallar la distribución de probabilidad de las unidades vendidas. b) calcular la utilidad esperada del vendedor. 7. Una computadora utilizada por un sistema bancario de 24 horas asigna cada transacción