cap1

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C. 1 1. TRATAMIENTO DE DA

Views 318 Downloads 2 File size 611KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

1

1. TRATAMIENTO DE DATOS 1.1.

RESUMEN NUMÉRICO

1.1.1. MEDIDAS DE CENTRALIZACIÓN 1.1.1.1. LA MEDIA Una de las medidas de posición central que cualquiera tiene en mente es el promedio suele dársele el nombre de media.

Definición:

La media de un conjunto de observaciones numéricas es la suma de los valores del conjunto dividida por el número de observaciones.

TABLA 1: Salarios anuales de la plantilla de supervisores de ventas US$ 34.500

US$ 30.700

US$ 32.900

US$ 36.000

US$ 34.100

US$ 33.800

US$ 32.500

Por ejemplo, el salario medio anual para los supervisores de ventas de la Tabla 1 es Media =

34 .500 + 30 .700 + 32 .900 + 36 .000 + 34.100 + 33.800 + 32.500 = 33 .500 dólares 7

El salario medio para los miembros de esta plantilla es de 33.500 dólares.

FIGURA 1 Salarios anuales de la plantilla de supervisores de ventas:

30.000

32.000

34.000

36.000

Salario (en dólares)

1

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

2

Expresiones algebraicas para la media: (i)

Sean x1 , x 2 ,....., x N los N datos correspondientes a una población. Entonces, la media poblacional es N

µ= (ii)

∑x i =1

i

N

Sean x1, x2 ,....., xn los n datos correspondientes a una muestra. Entonces la media muestral es n

X =

∑x i =1

i

n

EJEMPLO 1: En una muestra de ocho compañías norteamericanas se observaron los siguientes cambios porcentuales en las ganancias por acción en un año con respecto al anterior: 13,6%

25,5% 12,0%

43,6% 36,3%

-19,8% 14,3%

-13,8%

Hallar la media muestral del cambio porcentual de las ganancias por acción. La muestra contiene n = 8 observaciones, por tanto, su media es n

x=

∑x i =1

n

i

=

13,6 + 25,5 + 43,6 + (− 19,8) + (− 13,8) + 12,0 + 36,3 + 14,3 = 13,9625% 8

Así pues, el cambio porcentual medio de las ganancias por acción para esta muestra es del 13,9625%, es decir, aproximadamente del 14%.

EJEMPLO 2: En un período de siete años, los rendimientos anuales en tanto por ciento de una acción bursátil fueron. 4,0%

14,3%

19,0%

-14,7%

-26,5%

37,2%

28,8%

Hallar, para este período, la media poblacional del rendimiento en tanto por ciento.

2

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

3

Si tomamos las siete observaciones como población de interés, tenemos N = 7, y su media será N

µ=

∑x i =1

N

i

=

4,0 + 14,3 + 19,0 + (− 14,7) + (26,5) + 37,2 + 23,8 = 8,1571% 7

El porcentaje medio de rentabilidad en estos 7 años fue del 8,1571%. De cara a la presentación de resultados, es preferible redondear el resultado, en este caso al 8,2%

1.1.1.2. LA MEDIANA

Definición: La mediana de un conjunto de observaciones es la observación que ocupa el lugar central cuando éstas están ordenadas en sentido creciente si el número de observaciones es impar, y el promedio de las dos observaciones centrales si la cantidad es par. Es decir, si se tienen N observaciones ordenadas Cuando N es impar, la mediana es la observación que ocupa la posición [(N + 1) / 2] , y la Cuando N es par, la mediana es la media entre las observaciones que ocupan las posiciones ( N / 2) y [(N + 2) / 2] Consideremos de nuevo los siete salarios de la Tabla 1. Ordenando los datos de mayor a menor, tenemos US$ 30.700 US$ 32.500 US$ 32.900 US$ 33.800 US$ 34.100 US$34.500 US$36.00. Con los datos ordenados de este modo, el valor central es 33.800 dólares.

FIGURA 2: Salarios anuales de la plantilla de supervisores de ventas, con la media y la mediana indicadas. Media

30.000

32.000

Mediana

34.000

36.000

Salario (en dólares)

3

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

4

FIGURA 3: Cuatro registros de la temperatura, con la media y la mediana señaladas Mediana

19

Media

22

25

28

31

Temperatura (en °C)

Así pues, hasta ese momento, el conjunto de datos del que disponía consistía en cuatro observaciones: 19

20

20

21

1.1.1.3. LA MODA

Definición: La moda de un conjunto de observaciones es el valor que aparece con mayor frecuencia. El concepto de moda es relevante en los casos de conjuntos de datos en los que hay observaciones que aparecen varias veces, como ocurre en el siguiente ejemplo.

EJEMPLO 3: Un fabricante de radios portátiles escogió como muestra las 50 radios fabricadas durante una semana. Se analizaron las radios minuciosamente, y se anotó el número de defectos encontrado en cada una de ellas. El resumen de esta información aparece a continuación: TABLA 2: NÚMERO DE DEFECTOS NÚMERO DE RADIOS

0 12

1 15

2 17

3 6

Encontrar la moda del número de defectos de esta muestra. Como el número de radios con dos defectos es mayor que cualquier otro, la moda de esta muestra es 2.

4

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

5

La moda es una medida menos usada que la media o la mediana en las aplicaciones económicas. Tal vez, en el contexto en el que más se use, sea en el caso de fábricas que elaboran productos con diferentes tamaños, como la ropa. La talla modal de las unidades vendidas será aquella con mayor demanda.

1.1.2. MEDIDAS DE DISPERSIÓN 1.1.2.1 LA VARIANZA Y LA DESVIACIÓN TÍPICA POBLACIONAL

Definición:

Sean x1 , x 2 ,..., x n los N miembros de una población con media µ . La varianza poblacional, σ 2 , es el promedio de los cuadrados de las diferencias entre estos valores y su media. Es decir, N

σ2 =

∑ (x i =1

i

− µ)

N

N

2

=

∑x i =1

N

2 i

− µ2

La desviación típica poblacional, σ , es la raíz cuadrada (positiva) de la varianza. Salarios anuales de los supervisores de ventas

FIGURA 4:

27.000

31.000

35.000

39.000

Salario (en dólares) Datos de la tabla 1 .

5

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

6

TABLA 3: Cálculos para hallar la varianza de los datos de la Tabla 1.

( xi − µ )2

xi − µ = x i − 33.500 1.000 -2.800 -600 2.500 600 300 -1.000 Sumas 0

xi 34.500 30.700 32.900 36.000 34.100 33.800 32.500

N

σ2 =

∑ (x i =1

− µ)

1.000.000 7.840.000 360.000 6.250.000 360.000 90.000 1.000.000 16.900.000

2

i

=

N

16.900.000 = 2.414.286 7

FIGURA 5:

27.000

31.000

35.000

39.000

Salario (en dólares) Datos de la tabla 2

TABLA 4: Cálculos para hallar la varianza de los datos de la Ta bla 2. xi

xi − µ = x i − 33.500

( xi − µ )2

34.900 27.500 31.600 39.700 35.300 33.800 37.700

1.400 -6.000 -1.900 6.200 1.800 300 -1.800 0

1.960.000 36.000.000 3.610.000 38.440.000 3.240.000 90.000 3.240.000 86.580.000

Sumas N

σ2 =

∑ (x i =1

− µ)

2

i

N

=

86.580.000 = 12.368.571 7

6

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

7

EJEMPLO 4: En el ejemplo 2, analizábamos el porcentaje de rentabilidad anual de las acciones de una empresa en un período de siete años. Durante este mismo período, los porcentajes de rentabilidad anual de los Bonos del Tesoro fueron 6,5% 4,4% 3,8% 6,9% 8,0% 5,8% 5,1% Comparar estas dos distribuciones poblacionales a partir de sus medias y desviaciones típicas. Para las acciones, ya vimos en el Ejemplo 2, que la media del porcentaje de rentabilidad durante estos siete años era µ = 8,1571% La suma de los cuadrados de esta rentabilidad es 2

7

∑ xi2 = (4,0) + (14,3) + (19,0) + (− 14,7) + (− 26,5) + (37,2) + (23,8) = 3.450 ,11 2

2

2

2

2

2

i =1

Por tanto, la varianza es N

σ = 2

∑x i =1

i

N

=

6,5 + 4,4 + 3,8 + 6,9 + 8,0 + 5,8 + 5,1 = 5,7857% 7

Para computar la varianza de estos porcentajes de rentabilidad calcularemos primero la suma de cuadrados 7

∑x i =1

2 i

= (6,5) + (4, 4) + (3,8) + (6,9) + (8,0) + (5,8) + (5,1) = 247,31 2

2

2

2

2

2

2

La varianza es, entonces, N

σ2 =

∑x i =1

N

2 i

− µ2 =

247.31 2 − (5,7857) = 1,8557 7

Por tanto, la desviación típica es σ = σ 2 = 1,8557 = 1,3622 %

En la tabla que aparece a continuación, se recogen las medidas que resumen los datos de porcentajes de rentabilidad de estos dos tipos de inversión durante el período considerado; todos los números han sido redondeados a una sola cifra decimal. 7

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

8

TABLA 5:

Media Desviación típica

ACCIONES 8,2% 20,6%

BONOS DEL TESORO 5,8% 1,4%

Puede observarse que las acciones tienen una mayor tasa media de rentabilidad, pero las rentabilidades de los Bonos del Tesoro tuvieron una variabilidad sensiblemente menor. En el contexto de este ejemplo, puede pensarse en la desviación típica como en una medida de la incertidumbre (o riesgo) de la rentabilidad de una inversión. Es decir, la rentabilidad media fue mayor para las acciones, pero su riesgo, que viene medido por la desviación típica de la rentabilidad, fue también mayor.

INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA POBLACIONAL Regla de Tchebychev Para cualquier población con media µ y desviación típica σ , al menos el 100 (1 − 1 / m 2 )% de los valores de la población se encuentran a una distancia de la media menor que m veces la desviación típica, para cualquier número m > 1.

Regla empírica Para la mayoría de poblaciones grandes, aproximadamente el 68% de los valores de la población se encuentran una distancia de la media menor que una desviación típica, y aproximadamente el 95% están a una distancia de la media menor que dos veces la desviación típica.

8

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

9

1.1.2.2. LA VARIANZA Y LA DESVIACIÓN TÍPICA MUESTRAL

Definición: Sean x1 , x 2 ,...., x n los n valores de una muestra cuya media es x . La varianza muestral, s 2 , se define como

∑ (x n

s2 =

i =1

− x)

2

i

n −1 Una fórmula equivalente, más fácil de calcular es n

s2 =

∑x i =1

2 i

− nx

2

n −1

EJEMPLO 5. Hallar la desviación típica muestral de los porcentajes de incremento de ingresos para las ocho corporaciones del Ejemplo 1 Habíamos visto que para el ejemplo 1

n=8

x = 13,9625%

La suma de los cuadrados de los valores muestrales es n

∑x i =1

2 i

= (13,6) + (25,2 ) + (43,6 ) + (− 19,8) + (− 13,8) + (12,0 ) + (36,3) + (14,3) = 4.984,83 2

2

2

2

2

2

2

2

Por tanto, la varianza muestral es n

s = 2

∑x i =1

2 i

− nx

n −1

2

4.984,83 − (8)(13,9625) = = 489,3170 7 2

En consecuencia, la desviación típica muestral es s = s 2 = 489 ,3170 = 22 ,1%

La varianza y la desviación típica son las medidas numéricas más usadas para medir la dispersión de un conjunto de datos. Esta popularidad se debe al hecho de que, cuando se quieren hacer inferencias sobre una población a partir de una muestra, es más conveniente usar estas medidas. Sin embargo, en algunas ocasiones, serán preferibles 9

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

10

otras medidas de dispersión. En el resto de esta sección discutiremos brevemente tres alternativas.

1.1.2.3. LA MEDIA DE LAS DESVIACIONES ABSOLUTAS Definición: Sean x1 , x2 ,....., x N los N valores de una población cuya media es µ . La media de las desviaciones absolutas es el promedio del valor absoluto de las desviaciones de estos valores respecto a su media, es decir, N

MDA =

∑x i =1

i

−µ

N

La media muestral de las desviaciones absolutas se define de manera análoga como el promedio de las desviaciones absolutas de las observaciones muestrales respecto a su media. EJEMPLO 6: Hallar la media de las desviaciones absolutas de los salarios anuales de los supervisores de ventas de la Tabla 1. El salario medio para los individuos de esta plantilla era µ = 33 .5000 dólares Las operaciones necesarias para calcular la media de las desviaciones absolutas aparecen en la tabla. TABLA 6: xi

xi − µ = x i − 33.500

34.700 30.700 32.900 36.000 34.100 33.800 32.500

1.000 -2.800 -600 2.500 600 300 -1.000 0

Sumas

xi − µ 1.000 2.800 600 2.500 600 300 1.000 8.800

En esta tabla, vemos que N

∑x

i

− µ = 8.800

i =1

10

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

11

Por tanto, la media de las desviaciones absolutas es n

MDA =

∑x i =1

i

−µ

N

=

8.800 = 1.257 dólares 7

Así pues, el promedio de la desviación absoluta de estos salarios respecto a la media es de 1.257 dólares.

1.1.2.4. EL RANGO O RECORRIDO Definición: El rango o recorrido de un conjunto de datos es la diferencia entre la mayor y la menor de sus observaciones EJEMPLO 7: Hallar el rango o recorrido de los salarios anuales de los supervisores de ventas de la Tabla 1. En la tabla 1 vemos que el salario mayor es de 36.000 dólares y el menor de 30.700 dólares. Por tanto, el recorrido es Recorrido = 36.000 – 30.700 = 5.300 dólares

1.1.2.5. EL RANGO INTERCUARTÍLICO Cuartiles y rango intercuartilico Supongamos que se tienen N observaciones ordenadas de menor a mayor, entonces: El primer cuartil es la observación que ocupa la posición [(N + 1) / 4] El segundo cuartil (la mediana) es la observación que ocupa la posición [(N + 1) / 2]. El tercer cuartil es la observación que ocupa la posición [3(N + 1) / 4]. Cuando ( N + 1) no es un múltiplo entero de 4, los cuartiles se calculan por interpolación. Por ejemplo, si el número de observaciones es N = 12 , entonces ( N + 1) = 13 . Por tanto, ( N + 1) / 4 = 3,25 , por lo que se toma como primer cuartil el número que está a un cuarto del camino entre la tercera y la cuarta observación. Análogamente, puesto que 3( N + 1) / 4 = 9,75 , tomamos como tercer cuartil el número que está a tres cuartos del camino entre la novena observación y la décima. 11

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

12

La diferencia entre el tercer y el primer cuartil nos da una medida de la dispersión que se conoce con el nombre de rango intercuartílico.

EJEMPLO 8: Hallar el rango intercuartílico de los cambios porcentuales de ganancias por acción para las ocho corporaciones del Ejemplo 1 Ordenadas de mayor a menor, las observaciones son -19,8 -13,8 12,0 13,6 14,3 25,5 36,3 43,6 Para estos datos, la mediana es el promedio de la cuarta y la quinta observación, esto es, 13,95%. Puesto que tenemos n = 8 observaciones, tenemos (n+1)/4 =2,25. Por tanto, el primer cuartil estará a un cuarto del camino que ,va desde la segunda observación (-13,8) a la tercera (12,0). Es decir, Primer cuartil = −13,8 +

1 [12,0 − (− 13,8)] = − 7,35 % 4

De forma análoga, puesto que 3(n+1)/4 = 6,75, el tercer cuartil será el número que se encuentre a tres cuartos del camino que va desde al sexta observación (- 25,5) a la séptima (36,3). Por tanto, Tercer cuartil = 25,5 +

3 (36,3 − 25,5) = 33,60 % 4

Por último, el rango intercuartílico es la diferencia entre el tercer y el primer cuartil, Rango intercuartílico = 33,60 − (− 7,35) = 40,95%

FIGURA 6:

-7.35 13.95

33.60

12

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

13

1.2. OTROS MÉTODOS GRÁFICOS 1.2.1. DIAGRAMAS DE BARRAS TABLA 7: Número de personas que visitaron los Estados Unidos en 1992 PAÍS DE ORIGEN Japón Reino Unido Alemania

NÚMERO (EN MILLONES) 3,7 2,8 1,7

FIGURA 7:

TABLA 8: Porcentaje de mujeres casadas y con hijos menores de seis años que trabajan fuera de casa AÑO PORCENTAJE

1960 19

1965 23

1970 30

1975 37

1980 45

1985 53

1990 59

FIGURA 8:

13

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

14

TABLA 9: Número de hectáreas de selva tropical (millones) 1980 2.279 1.606 767

América Latina África Asia

1990 2.074 1.482 679

FIGURA 9:

.

1.2.2. GRÁFICOS TEMPORALES TABLA 10: Puntuaciones en el examen de matemáticas de acceso a la Universidad AÑO 1973 1974 1975 1976 1977 1978 1979

PUNTUACIONES 481 480 472 472 470 468 467

AÑO 1980 1981 1982 1983 1984 1985 1986

PUNTUACIONES 466 466 467 468 471 475 475

AÑO 1987 1988 1989 1990 1991 1992 1993

PUNTUACIONES 476 476 476 476 474 476 478

FIGURA 10:

14

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

15

1.2.3. PICTOGRAMAS FIGURA 11: Pictograma de los delitos informáticos en los Estados Unidos

1.2.4. DIAGRAMAS DE DISPERSIÓN TABLA 11: Tasas de inflación y tipos de interés a largo plazo PAÍS Francia Alemania Italia Reino Unido Bélgica Dinamarca

INFLACIÓN (%) 2,8 4,5 5,5 3,7 2,4 2,0

TIPOS DE INTERÉS (%) 8,6 7,9 13,1 9,1 8,6 9,8

PAÍS

INFLAMACIÓN

Grecia Irlanda Luxemburgo Holanda Portugal España

15,9 3,0 3,2 3,7 8,9 5,9

TIPOS DE INTERÉS (%) 22,5 9,4 7,9 8,1 16,1 12,6

FIGURA 12: Diagrama de dispersión de la tasa de inflación y de los tipos de interés a largo plazo.

15

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

16

1.2.5. DIAGRAMAS DE CAJA FIGURA 13: Diagrama de caja de las tasas de inflación de doce países de la Unión Europea.

TABLA 12: Puntuaciones en el examen final. PRIMER CICLO 47 52 52 57 63 64 69 71

72 72 78 81 81 86 91

SEGUNDO CICLO 56 59 59 61 67 69 73 76

TERCER CICLO 76 80 83 83 84 90 94

43 48 50 55 61 67 72 78

80 80 83 85 86 91 97

FIGURA 14: Diagramas de caja de las puntuaciones en el examen

16

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

17

TABLA: Cuartiles de las puntuaciones en el examen.

Primer cuartil Mediana Tercer cuartil

PRIMER CICLO 57 71 81

SEGUNDO CICLO 61 76 83

TERCER CICLO 55 78 85

1.3. MAL USO DE LA ESTADÍSTICA 1.3.1. 1.3.2. 1.3.3.

AFIRMACIONES SUBJETIVAS DESCRIPCIONES NUMÉRICAS INADECUADAS ELECCIÓN DE LA ESCALA EN GRÁFICOS DE TIEMPO

FIGURA 14: Gráfico temporal de las puntuaciones medias en el examen de matemáticas de acceso a la Universidad en EE.UU.

17

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

1.3.4.

18

COMPARACIONES CON GRÁFICAS INADECUADAS

FIGURA 15: Número de personas procedentes de dos países que visitaron los Estados Unidos

.

1.3.5 1.3.6.

COINCIDENCIAS QUE NO SON MÁS QUE ESO GENERALIZACIONES A PARTIR DE MUESTRAS MUY PEQUEÑAS

18

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

19

ELEMENTOS DE TEORÍA DE LA PROBABILIDAD Definición: Un experimento aleatorio es un proceso que puede concretarse en al menos dos resultados posibles, con incertidumbre a cuál de ellos tendrá lugar. Definición: Los resultados posibles de un experimento aleatorio se denominan resultados básicos, y el conjunto de todos resultados básicos se llama espacio muestral. EJEMPLO 1: Se lanza un dado. Los resultados básicos son los números 1, 2, 3, 4, 5, 6. De este modo, el espacio muestral es

S = [1,2,3,4,5,6] Aquí vemos que hay resultados básicos. No pueden ocurrir dos al mismo tiempo y uno de ellos debe ocurrir. Definición: Un suceso es un conjunto de resultados básicos de un espacio muestral, y se dice que ocurre si el experimento aleatorio da lugar a uno de los resultados básicos que lo constituyen. Definición: Sean A y B dos suceso pertenecientes a un espacio muestral S. Su intersección, se denomina A ∩ B , es el conjunto de todos los resultados básicos en S que pertenecen a A y B. Por tanto, la intersección, A ∩ B ocurre si y sólo si tanto A como B ocurren. De manera más general, dados k sucesos E1 , E 2 , E k , su intersección, E1 ∩ E 2 ... ∩ E k , es el conjunto de todos los resultados básicos que pertenecen a todo E i (i = 1,2,......, k ) . Definición: Si los sucesos A y B no tienen en común resultados básicos, se denominan mutuamente excluyentes y su intersección A∩ B es el conjunto vacío. De esto se deduce, entonces, que A ∩ B no puede ocurrir. De manera más general, los k sucesos E1 , E2 ,...., Ek se dice que son mutuamente excluyentes si todo para de estos sucesos es mutuamente excluyente, es decir, si E i ∩ E j es el conjunto vacío para todo i ≠ j . 19

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

20

Definición: Sean A y B los dos sucesos en el espacio muestral S. Su unión, denomina A ∪ B , es el conjunto de todos los resultados básicos en S que pertenecen al menos a uno de estos dos sucesos. Por tanto, la unión A ∪ B tiene lugar si y sólo A y/o B ocurren. De manera más general, dados k sucesos E1 , E 2 ,...., E k , su unión, E1 ∪ E 2 ∪ L ∩ E k , es el conjunto de todos los resultados básicos pertenecientes al menos a uno de estos k sucesos.

Definición: Sean E1 , E2 ,...., Ek k sucesos en el espacio muestral S. Si E1 ∪ E2 ∪ L ∩ Ek = S , estos k sucesos se denominan colectivamente exhaustivos. Definición: Sean A un suceso en el espacio muestral S. El conjunto de resultados básicos de un experimento aleatorio perteneciente a S pero no a A se denomina complementario de A, y se representa por A . EJEMPLO 2: Consideremos ahora el índice industrial Dow–Jones correspondiente a dos días consecutivos. Designaremos los cuatro resultados básicos como sigue:

o1 : el índice sube los dos días o2 : el índice sube el primer día pero no el segundo o3 : el índice no sube el primer día pero sube el segundo o4 : el índice no sube ninguno de los dos días Claramente, uno de estos resultados tiene que ocurrir, pero no más de uno puede tener lugar al mismo tiempo. Por tanto, podemos representar el espacio muestral como S = [o1 , o2 , o3 , o4 ] . Consideremos ahora los dos sucesos A: el índice sube el primer día B: el índice sube el segundo día Observamos que el suceso A ocurre si o1 o o 2 ocurren, por lo que podemos escribir A = [o1 , o2 ] . De manera similar, tenemos que B = [o1 , o3 ] .

20

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

21

La intersección de A y B es el suceso “el índice sube el primero y el segundo día”. Éste es el conjunto de todos los resultados básicos pertenecientes a A y B, por lo que A ∩ B = [o1 ] . La unión de A y B es el suceso “el índice no sube el primer día”. Éste es el conjunto de todos los resultados básicos pertenecientes a A y/o B. Tenemos que A ∪ B = [o1 , o2 , o3 ] . Finalmente, el complementario de A es el suceso “el índice no sube el primer día”. Éste es el conjunto de todos los resultados básicos en el espacio muestral S que no pertenecen a A. Por tanto, A = [o3 , o4 ] .

NOCIÓN DE PROBABILIDAD Definición: Sea N A el número de ocurrencias de un suceso A en N repeticiones. Entonces, siguiendo el concepto de probabilidad de frecuencia relativa, la probabilidad de que A ocurra es el límite del cociente N A / N a medida que el número de intentos N se hace infinitamente grande.

LA PROBABILIDAD Y SUS POSTULADOS

1. Si A es un suceso cualquiera en el espacio muestral S 0 ≤ P( A ) ≤ 1 2. Sea A un suceso en S, y sean O i los resultados básico. Entonces,

P ( A ) = ∑ P (Oi ) A

donde la notación indica que la sumatoria corresponde a todos los resultados básicos pertenecientes a A

3.

P (S ) = 1 .

21

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

22

CONSECUENCIAS DE LOS POSTULADOS (i)

Si el espacio muestral S está por n resultados básicos igualmente probables, O1 , O2 ,...., On , entonces cada una de ellos tiene una probabilidad 1/n, es decir 1 P (Oi ) = (i = 1,2,..., n) n (ii) Si el espacio muestral S está por n resultados básicos igualmente probables y el suceso A está formado por n A de estos resultados, entonces, n P( A) = A n (iii) Sean A y B dos sucesos mutuamente excluyentes. Entonces la probabilidad de la unión es la suma de las probabilidades individuales, es decir, P( A ∪ B) = P( A) + P(B ) De manera más general, si E1 , E 2 ,..., E k son sucesos mutuamente excluyentes P (E1 ∪ E 2 ∪ L ∪ E k ) = P (E1 ) + P ( E 2 ) + L + P (E k ) (iv) Si E1 , E 2 ,..., E k son sucesos mutuamente excluyentes, la probabilidad de la unión es P (E1 ∪ E 2 ∪ L ∪ E k ) = 1

EJEMPLO 3: En el Ejemplo 2, el comportamiento del índice Dow-Jones durante dos días y definimos cuatro resultados básicos:

O1 : el índice sube los dos día s O2 : el índice sube el primer día pero no el segundo O3 : el índice no sube el primer día pero sube el segundo O4 : el índice no sube ninguno de los dos días En razonable sostener que estos cuatro resultados son igualmente probables. En ese caso, ¿cuál es la probabilidad de que el índice suba al menos uno de los dos días?. El suceso de interés “el índice sube al menos uno de los dos días” contiene tres de los cuatro resultados básicos − O1 , O 2 , O3 . Dado que los resultados básicos son igualmente probables, se duduce que la probabilidad de este suceso es ¾. EJEMPLO 4: En la primera época del desarrollo del yacimiento de petróleo de Hibernia, en el Océano Atlántico, la Secretaría del Petróleo de Newfoundland estimó en 0,1 la probabilidad de que las reservas económicamente recuperables excedieran los 2.000 millones de barriles. La probabilidad de que las reservas excediesen los 1.000 millones de barriles se estimó en 0,5. Dada esta info rmación, ¿cuál es la probabilidad estimada de que las reservas se encuentren entre 1.000 y 2.000 millones de barriles?. 22

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

23

Sea A el suceso “las reservas exceden los 2.000 millones de barriles” y sea B el suceso “las reservas se encuentran entre 1.000 y 2.000 millones de barriles”. Estos sucesos son mutuamente excluyente y su unión, A ∪ B , es el suceso “las reservas exceden los 1.000 millones de barriles”. Por tanto, tenemos que

P ( A) = 0,1

P ( A ∪ B ) = 0,5

Entonces, dado que A y B son mutuamente excluyentes

P(B ) = P( A ∪ B) − P( A) = 0,5 − 0,1 = 0,4

REGLAS DE LA PROBABILIDAD

Sea A un suceso y A su complementario. Entonces, P(A) = 1 − P( A) Regla de la suma de probabilidades Sean A y B dos sucesos. La probabilidad de la unión es P ( A ∪ B ) = P( A) + P (B ) − P ( A ∩ B ) EJEMPLO 5: Una cadena de hamburgueserías que el 75% de sus clientes utiliza mostaza, el 80% utiliza ketchup y el 65% utiliza ambos. ¿Cuál es la probabilidad de que un determinado cliente utilice al menos uno de los dos?. Sea A el suceso “el cliente utiliza mostaza” y sea B el suceso “el cliente utiliza ketchup”. Del enunciado del ejemplo, tenemos que

P ( A) = 0,75

P (B ) = 0,80

P ( A ∩ B ) = 0,65

La probabilidad que buscamos es

P( A ∪ B) = P( A) + P(B ) − P( A ∩ B) = 0,75 + 0,80 − 0,65 = 0,90 Definición: Sean A y B dos sucesos. La probabilidad condicional del suceso A, dado el suceso B, denominada P( A / B) , se define como P( A ∩ B ) P( A / B) = P( B) siempre que P(B) > 0 .

23

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

24

De igual modo, la probabilidad condicional de B dado A se define como P (B / A ) =

siempre que P( A) > 0.

P( A ∩ B ) P( A)

EJEMPLO 6: Volvamos al Ejemplo 5. Si el 75% de los consumidores de la cadena utilizan mostaza, el 80% utilizan ketchup y el 65% utilizan ambos, ¿cuáles son las probabilidades de que un consumidor de ketchup utilice motaza y de que un consumidor de mostaza utilice ketchup?. Sea A el suceso “el cliente utiliza mostaza” y sea B el suceso “el cliente utiliza ketchup” de manera que P ( A) = 0,75, P (B ) = 0,80 y P ( A ∩ B ) = 0,65 . La probabilidad de que el consumidor de ketchup utilice mostaza es la probabilidad condicional del suceso A, dado el suceso B, es decir, P( A / B) =

P ( A ∩ B ) 0,65 = = 0,8125 P (B ) 0,80

Del mismo modo, la probabilidad de que el consumidor de mostaza utilice ketchup es P (B / A ) =

P ( A ∩ B ) 0,65 = = 0,8667 P( A) 0,75

Regla del producto de probabilidades Sean A y B dos sucesos. La probabilidad de la intersección es P( A ∩ B) = P( A / B )P( B) También P ( A ∩ B ) = P ( B / A )P ( A ) EJEMPLO 7: En el Ejemplo 6, vimos brevemente el método de la respuesta aleatorizada para la obtención de respuestas verdaderas a preguntas delicadas en encuestas. En una encuesta de este tipo, cada encuestado fue sometido a las siguientes dos preguntas: a) ¿Es impar el último dígito de su número de Cédula Nacional de Identidad? b) ¿Alguna vez, Ud. ha consumido algún tipo de droga?.

24

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

25

Se le pidió a los encuestados que lanzasen una moneda al aire y luego respondiesen a la pregunta (a) si salía “cara” y a (b) en caso contrario. El 37% de los encuestados respondieron “sí”. ¿Cuál es la probabilidad de que un encuestado que contestó a la pregunta (b) respondiese “sí”?. Definamos los siguientes sucesos y sus probabilidades A : el encuestado responde “sí” E1 : el encuestado responde a la pregunta (a) E 2 : el encuestado responde a la pregunta (b)

P(A) = 0.37 P(E 1) = 0.5 P(E 2) = 0.5

Dado que la mitad de los números de la Cédula Nacional de Identidad tienen un último dígito impar, se verifica que la probabilidad de una respuesta afirmativa, dado que se ha respondido a la pregunta (a) , es 0.5, es decir P(A|E 1 ) = 0.5 Entonces tenemos P ( A) = P (E1 ∩ A ) + P (E 2 ∩ A ) = = P (E1 )P ( A | E1 ) + P ( E2 )P ( A | E2 ) 0.37 = (0.5)(0.5) + (0.5)P( A | E 2 )

Despejando, obtenemos P(A|E 2 ) = 0.24, es decir, concluimos que el 24% de la población sometida a estudio ha consumido droga en alguna ocasión.

Definición: Sean A y B dos sucesos. estadísticamente si y sólo si

Se dice que estos sucesos son independientes

P( A ∩ B) = P( A)P( B)

Se deduce de la regla del producto que son condiciones equivalentes (i) P( A / B) = P( A) (si P(B ) > 0) (ii) P (B / A) = P (B ) (si P( A) > 0) De manera más general, los sucesos E1 , E 2 ,..., E k son independientes estadísticamente si y sólo si P (E1 ∩ E 2 ∩ L E k ) = P (E1 )P (E 2 )L P (E k )

EJEMPLO 8: Se estima que le 48% de las licenciaturas son obtenidas por mujeres y que el 17,5% de todas las licenciaturas son en empresariales. El 4,7% de todas las licenciaturas corresponden a mujeres que se gradúan en empresariales. ¿Son los sucesos “el licenciado es una mujer” y “el licenciado lo es en empresariales” independientes estadísticamente?. 25

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

26

Sean A y B dichos sucesos, respectivamente. Entonces

P( A) = 0,48 Dado que

P(B ) = 0,175

P( A ∩ B ) = 0,047

P ( A )P ( B ) = (0, 48)(0,175) = 0,084 ≠ P ( A ∩ B )

estos sucesos no son independientes. La dependencia puede comprobarse por medio de la probabilidad condicional P( A ∩ B ) 0,047 P( A / B) = = = 0,269 P(B ) 0,175 De este modo, sólo el 26,9% de las licenciaturas en empresariales corresponden a mujeres, mientras que las mujeres constituyen el 48% de todos los licenciados.

PROBABILIDADES BIVARIANTES Resultados correspondientes a sucesos bivariantes

A1 A2 M Ak

B1

B2

K

Bk

A1 ∩ B1 A2 ∩ B1

A1 ∩ B2 A1 ∩ B2

K K

A1 ∩ B k

A2 ∩ Bk

K

Ah ∩ B k

Ak ∩ B1

Definición: En el contexto de las probabilidades bivariantes, las probabilidades de la intersección P (A1 ∩ B j ) se denominan probabilidades conjuntas. Las probabilidades de los sucesos elementales, P ( A i ) o P(B j ), se denominan probabilidades marginales.

TABLA 1: Probabilidades correspondientes al ejemplo FRECUENCIA Regular Ocasional Nunca Totales

Altos 0,04 0,10 0,13 0,27

INGRESOS Medios 0,13 0,17 0,17 0,41

TOTALES Bajos 0,04 0,06 0,22 0,32

0,21 0,27 0,52 1,00

26

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

27

FIGURA 1: Diagrama de árbol de los sucesos correspondientes al ejemplo

FIGURA 2: Diagrama de árbol de nuestro ejemplo en el que se muestran las probabilidades conjuntas y marginales.

A1 : Lo ve regularmente A2 : Lo ve ocasionalmente A3 : No lo ve nunca B1 : Ingresos altos B2 : Ingresos medios B3 : Ingresos bajos S : Espacio muestral

TABLA 2: Probabilidades condicionales correspondientes a las frecuencias dados los niveles de ingreso FRECUENCIA Regular Ocasional Nunca

Altos 0,15 0,37 0,48

INGRESOS Medios 0,32 0,27 0,41

Bajos 0,32 0,27 0,41

TABLA 3: Probabilidades condicionales correspondientes a los niveles de ingreso dadas las frecuencias

27

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

FRECUENCIA

INGRESOS Medios 0,62 0,41 0,33

Altos 0,19 0,37 0,25

Regular Ocasional Nunca

28

Bajos 0,19 0,22 0,42

Definición: Sean A y B dos atributos, cada uno de los cuales dividimos en categorías que dan lugar a sucesos mutuamente excluyentes y colectivamente exhaustivos que denominamos, respectivamente, A1 , A2 ,..., Ah y B1 , B 2 ,..., B k . Si todo suceso Ai es independiente de todo suceso B j , se dice que los atributos A y B son independientes. EL TEOREMA DE BAYES El Teorema de Bayes Sean A y B dos sucesos. Entonces,

P( A / B) =

P( A / B )P(B) P( A)

EJEMPLO 9: Al examinar los registros anteriores de los balances de una compañía, un auditor descubre que el 15% contienen errores. Además, el 60% de estos balances incorrectos fueron considerados valores inusuales basándose en los datos anteriores. El 20% de todos los balances se consideraron también valores inusuales. Si los datos de un determinado balance parecen ser inusuales, ¿cuál es la probabilidad de que sea incorrecto?. Si denominamos los sucesos de interés como “error” y “valor inusual”, tenemos que

P (error ) = 0,15 y

y

P (valor inusual) = 0, 20

P (valor inusual / error ) = 0,60

Haciendo uso del teorema de Bayes, se obtiene

P (Error / Valor inusual) =

P (valor inusual / error )P (error ) (0,60)(0,15) = = 0,45 P(valor inusual) 0,20

De este modo, dada la información de que el balance se considera inusual, la probabilidad de que sea un error se ve modificada, pasando de 0,15 (a priori) a 0,45 (a posteriori).

28

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

29

Sean E1 , E 2 ,..., E k K sucesos mutuamente excluyentes y colectivamente exhaustivos, y sea A otro suceso cualquiera. P ( A) = P ( E1 ∩ A ) + P ( E 2 ∩ A ) + L + P (E k ∩ A )

Además, la regla del producto de probabilidades nos dice que:

P (E j ∩ A ) = P ( A E j )P(E j )

( j = 1,2,..., K )

así que sustituyendo

P ( A) = P ( A E1 )P (E 1 ) + P ( A E 2 )P (E 2 ) + L + P ( A E k )P (E k ) Teorema de Bayes (Expresión alternativa) Sean E1 , E2 ,..., Ek K sucesos mutuamente excluyentes y colectivamente exhaustivos, y sea A otro suceso cualquiera. La probabilidad condicional de E i dado A puede ser expresada como P (E i A ) =

P (A E i )P (E i ) P ( A E1 )P (E1 ) + P ( A E 2 )P (E 2 ) + L + P (A E K )P (E K )

La ventaja de esta reexpresión del teorema reside en el hecho de que las probabilidades que incluye son en muchas ocasiones aquellas de las que se dispone directamente.

29

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

30

2. VARIABLES ALEATORIAS 2.1. Introducción. Definición: Una variable aleatoria es una variable que toma valores numéricos determinados por el resultado de un experimento aleatorio. Definición: Una variable aleatoria es discreta si sólo puede tomar una cantidad numerable de valores. Éstos son algunos ejemplos de variables aleatorias discretas: 1. El número de artículos defectuosos en una muestra de veinte artículos de un gran cargamento. 2. El número de clientes que llega a un mostrador en una hora. 3. El número de errores detectados en las cuentas de una compañía 4. El número de reclamaciones en un póliza de seguro médico durante un año. Definición: Una variable aleatoria es continua si puede tomar todos los valores de un intervalo. Otros ejemplos de variables aleatorias continuas son: 1. La renta anual de una familia. 2. La cantidad del petróleo importado por Estados Unidos en un mes concreto. 3. La variación en el precio de las acciones de IBM en un mes. 4. El tiempo transcurrido desde la instalación de un nuevo componente hasta que falla. 5. El porcentaje de impurezas en un lote de productos químicos.

2.2. Distribuciones de Probabilidad para Variables Aleatorias Discretas 2.2.1. La Función de Probabilidad

La función de probabilidad, PX (x), de una variable aleatoria discreta X representa la probabilidad de que X tome el valor x, como función de x. Es decir, PX (x) = P(X = x) donde la función se evalúa en todos los posibles valores de x.

30

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

31

EJEMPLO 1: Se lanza un dado. Sea X la variable aleatoria que representa el número resultante. Puesto que P( X = 1) = P( X = 2) = L = P( X = 6) = 1/ 6 la función de probabilidad es 1 para x = 1,2 ,3,..., 6 Px (x ) = P ( X = x) = 6 La función toma el valor 0 en todos los demás valores de x, que corresponden a sucesos imposibles. La función de probabilidad se ha representado en la Figura 1, donde las barras de altura 1/6 representan masas de probabilidad en los puntos x = 1, x = 2,..., x = 6 . FIGURA 1: Función de probabilidad del Ejemplo 1

PX (x) 1

/6

0

1

2

3

4

5

6

x

Propiedades de las funciones de probabilidad de variables aleatorias discretas Sea X una variable a leatoria discreta con función de probabilidad PX (x ) . Entonces, (i) PX (x ) ≥ 0 para cada valor x (ii) Las probabilidades individuales suman 1, es decir, ∑ PX ( x) = 1 x

donde la notación indica la suma sobre todos los posibles valores de x.

31

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

32

2.2.2. La Función de Probabilidad Acumulada La función de probabilidad acumulada, FX ( x0 ) , de una variable aleatoria X representa la probabilidad de que X no tome un valor superior a x0 , como función de x 0 . Es decir,

FX (x0 ) = P( X ≤ x0 ) donde la función se evalúa en todos los valores x0 .

Relación entre función de probabilidad y función de probabilidad acumulada Sea X una variable aleatoria con función de probabilidad PX (x ) y función de probabilid ad acumulada FX (x ) . Entonces,

FX (x 0 ) =

∑ P (x)

x≤ x0

X

donde la notación indica que la suma es sobre todos los posibles valores de x que son menores o iguales que x0 . EJEMPLO 2: En el experimento del lanzamiento de un dado del Ejemplo 1, donde la variable aleatoria X representa el número observado, tenemos la función de probabilidad. PX =

1 para x = 1,2,...,6 6

Ahora bien, si x0 es un número menor que 1, X no puede ser menor que x 0 , luego

FX (x 0 ) = P( X ≤ x 0 ) = 0 para x0 < 1 Si x0 es mayor o igual que 1 pero estrictamente menor que 2, la única manera de que X sea menor o igual que x 0 es que X = 1 . Por tanto, 1 para 1 ≤ x 0 < 2 FX (x 0 ) = P ( X ≤ x0 ) = PX (1) = 6 Si x 0 es mayor o igual que 2 pero estrictamente menor que 3, X es menor o igual que x0 si y sólo si X = 1 o X = 2 , luego

FX (x0 ) = P( X ≤ x 0 ) = PX (1) + PX (2) =

1 3

para 2 ≤ x0 < 3

32

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

33

siguiendo con este razonamiento, comprobamos que si x 0 es un número mayor o igual que 6, entonces, sin duda, X es menor o igual que x0 , luego 6

F X (x 0 ) = P ( X ≤ x0 ) = ∑ PX (x ) = 1

para x0 ≥ 6

x =1

La función de probabilidad acumulada puede entonces escribirse como 0 si x0 < 1  j F X (x 0 ) =  si j ≤ x 0 < j + 1 6 1 si x0 ≥ 6

( j = 1,2,...,5)

FIGURA 2: Función de probabilidad acumulada del Ejemplo 1

0

1

2

3

4

5

6

Propiedades de las funciones de probabilidad acumulada para variables aleatorias discretas. Sea X una variable aleatoria discreta con función de probabilidad acumulada F X (x 0 ) . Entonces, (i) 0 ≤ FX ( x0 ) ≤ 1

para cada número x0

(ii) Si x0 y x1 son dos números tales que x0 < x1 , entonces, F X (x 0 ) ≤ FX (x1 )

33

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

34

2.2.3. Esperanzas de Variables Aleatorias Discretas El valor esperado , E(X), de una variable aleatoria X se define como E ( X ) = ∑ xPX (x ) x

donde la notación indica que la suma es sobre todos los posibles valores de x. El valor esperado de una variable aleatoria se conoce como su media y se representa µ X . Definición: Sea X una variable aleatoria discreta con función de probabilidad PX (x ), y sea g ( X ) una función de X. Entonces, el valor esperado , E ( g ( X )), de esta función se define como E [g ( X )] = ∑ g (x )PX ( x) x

EJEMPLO 3: La función de probabilidad del número de errores, X, en las páginas de los libros de economía es PX (0)0,81 PX (1) = 0,17 PX (2) = 0,02 Hallemos la media del número de errores por página. Tenemos µ X = E ( X ) = ∑ xPX (x ) = (0)(0,81) + (1)(0,17 ) + (2)(0,02) = 0,21 x

De donde concluimos que sobre un número grande de páginas, esperaríamos encontrar un promedio de 0,21 errores por página. PX(x) 0.8

0.4

1

0

2

x

µx FIGURA 3: Función de probabilidad del número de errores por página en libros de texto de economía y localización de la media poblacional, µ X , del Ejemplo 3

34

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

35

Definición: Sea X una variable aleatoria discreta. La esperanza de la diferencia con la media al cuadrado ( X − µ X )2 se denomina varianza, se representa σ X , y se obtiene como

[

]

σ X = E ( X − µ X ) = ∑ (x − µ X ) PX ( x ) 2

2

2

x

La desviación típica, σ X , es la raíz cuadrada positiva de la varianza. Varianza de una variable aleatoria discreta (fórmula alternativa) La varianza de una variable aleatoria discreta X puede expresarse como

( )

σ X = E X 2 − µ X = ∑ X 2 Px ( x ) − µ 2 X 2

2

x

EJEMPLO 4: Supongamos que la función de probabilidad del número de errores, X, en las páginas de un libro de economía es

PX (0)0,81

PX (1) = 0,17

PX (2) = 0,02

En el Ejemplo 3, vimos que la media del número de errores por página era µ X = 0,21. Para obtener la varianza, primero buscamos la esperanza de los cuadrados, esto es

( )

E X 2 = ∑ x 2 PX ( x ) = (0) (0,81) + (1) (0,17) + (2 ) (0,02) = 0,25 2

2

2

x

La varianza es, entonces 2 σ x2 = E X 2 − µ 2x = 0,25 − (0,21) = 0,2059 Por último, la desviación típica del número de errores por página es

( )

σ X = σ x2 = 0,2059 = 0,45

Sea X una variable aleatoria con media µ X y varianza σ 2X , y sean a y b dos constantes. Definamos la variable aleatoria Z = a + bX . Entonces, la media y la varianza de Z son µ z = E (a + bX ) = a + bµ x

y

σ Z2 = Var (a + bX ) = b 2σ 2X

y, por tanto, la desviación típica de Z es

σ Z = bσ X

35

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

36

EJEMPLO 4: Un contratista norteamericano está interesado en conocer el coste total de un proyecto sobre el que intenta hacer una oferta. Estima que los materiales costarán 25.000 dólares y su trabajo 900 dólares diarios. Si se necesitan X días para terminar el proyecto, el coste total del trabajo será 900X dólares, y el coste total del proyecto (en dólares) será

C = 25.000 + 900 X El contratista construye unas probabilidades subjetivas sobre la duración del proyecto, como se indica en la tabla. 10 0,1

DURACIÓN X (DÍAS) PROBABILIDAD

11 0,3

12 0,3

13 0,2

14 0,1

La media y la varianza de la duración X se pueden calcular directamente como

µ X = E ( X ) = ∑ xPX (x ) = (10)(0,1) + (11)(0,3) + (12)(0,3) + (13)(0,2 ) + (14)(0,1) = 11,9 días x

y

[

]

σ 2X = E ( X − µ x ) = ∑ ( x − µ X ) PX (x ) 2

2

x

= (10 − 11,9) (0,1) + (11 − 11,9) (0,3) + L + (14 − 11,9) (0,1) = 1,29 2

2

2

La media y la varianza del coste total C se pueden obtener ahora usando las especificaciones. El coste esperado es µ C = E (25.000 + 900 X ) = 25.000 + 900 µ X = 25 .000 + (900 )(11,9) = 35 .710 dólares y la varianza es

σ C2 = Var(25.000 + 900X ) = (900) σ 2X = (810.000)(1,29) = 1.044.900 luego la desviación típica es σ C = σ C2 = 1.022 ,20 dólares 2

Función generatriz de momentos Si X es una variable aleatoria discreta y existe un número h>0, tal que para –h < t < h la esperanza matemática E(etX) existe. Esta esperanza es llamada función generatriz de momentos de X ,es denotada por M(t). Esto es, M(t) = E(etX)

36

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

37

EJEMPLO 5: Consideremos los datos del Ejemplo 4 10 0,1

DURACIÓN X (DÍAS) PROBABILIDAD

11 0,3

12 0,3

13 0,2

14 0,1

La función generatriz de momentos está dada por M(t) = 0,1 e10t + 0,3 e11t + 0,3 e12t + 0,2 e13t + 0,1 e14t Una distribución que tiene función generatriz de momentos está completamente determinada por M(t), luego no debería sorprendernos que podamos obtener algunas propiedades de la distribución directamente a partir de M(t). Notemos que la existencia de M(t) para – h < t < h, implica que las derivadas de cualquier orden existen en t = 0, por lo tanto

dM (t ) = M ' (t ) = dt haciendo h = 0

∑ xe

tx

f ( x)

X

M ' (0) = E ( X ) = µ

d 2 M (t ) = M ' ' (t ) = dt 2 La segunda derivada

∑x

2 tx

e f ( x)

X

( )

M ' ' (0) = E X 2

Entonces

( )

σ 2 = E X 2 − µ 2 = M ' ' (0) − [M ' (0)]

2

37

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

38

2.3. VARIABLES ALEATORIAS CONTINUAS Si el rango de una variable aleatoria X contiene un intervalo (ya sea finito o infinito) de números reales, entonces X es una variable aleatoria continua 2.3.1. Funciones de Densidad de Probabilidad Una función f X ( x ) es una función de densidad de probabilidad de la variable aleatoria continua X si para cualquier intervalo de número reales [X 1 , X 2 ] 1) f X (x ) ≥ 0 2)





−∞

f X (x )dx = 1

3) P (x1 ≤ X ≤ x 2 ) =



x2

x1

f X (x )dx

FIGURA 4: Probabilidad obtenida a partir del área bajo f X (x ) P(x 1 ≤ X ≤x2 )

f X(x)

x2

x1 EJEMPLO 5:

Sea la variable aleatoria continua X el diámetro de un agujero taladrado en una placa de metal. El diámetro requerido es 12.5 milímetros, pero muchas perturbaciones aleatorias en el proceso dan como resultado diámetros más grandes. La recopilación de datos indica que la distribución de X puede modelarse con la función de densidad de probabilidad f X ( x) = 20e −20 ( x−12.5 ) , x ≥ 12 .5 . Si se desechan las piezas que tienen un diámetro mayor que 12.60 milímetros, ¿qué proporción de piezas se espera desechar? La función de densidad y la probabilidad pedida aparecen en la figura 5. Una pieza se desecha si X > 12.60. Entonces,

P ( X > 12.60) =

x



12.6

f X ( x)dx =

x

∫ 20e

12. 6

x −20 ( x−12.5 )

dx = − e

− 20( x−12.5 )

= 0.135 12. 6

38

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

39

¿Qué proporción de piezas tienen un diámetro entre 12.5 y 12.6 milímetros? Ahora P (12.5 < X < 12.6 ) =

12.6



f X (x )dx = − e

12.6 −20 (x −12.5 )

12.5

= 0.865 12.5

FIGURA 5: Función de densidad de probabilidad del ejemplo 5. f X (x)

12.5

12.6

Como otro ejemplo, 15

P (5 < X < 15 ) = ∫ f X (x )dx = 0.5 5

2.3.2. Funciones de Distribución Acumulada La función de distribución acumulada de una variable aleatoria continua X es

FX (x ) = P( X ≤ x ) = ∫ f X ( x )dx x

−∞

para

−∞ < x < ∞

39

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

40

EJEMPLO 6: Para la operación de taladrado del ejemplo, FX ( x ) está dada por las siguientes expresiones. F X (x ) = 0 para x < 12.5

F X (x ) =

x

∫ 20e

− 20(u −12.5 )

du

para

12.5 ≤ x.

12.5

= 1 − e −20 ( x−12.5 ) En consecuencia,

x < 12.5

0 F X (x ) =  −20( x −12. 5) 1 − e

12.5 ≤ x

FIGURA 6: Función de distribución acumulada del ejemplo 6

Si X es una variable aleatoria continua, entonces, para cualquier x1 y x2 ,

P(x1 ≤ X ≤ x 2 ) = P(x1 < X ≤ x 2 ) = P( x1 ≤ X < x2 ) = P( x1 X < x2 )

2.3.3 Valor Esperado de una Variable Aleatoria Continua Supóngase que X es una variable aleatoria continua con función de densidad de probabilidad f X ( x), − ∞ < x < ∞ La Media de X denotada por E ( X ) o µ X , es

E( X ) = µ X



=

∫ xf ( x )dx X

−∞

La Varianza de X por V ( X ) o σ 2X , es



V ( X ) = σ X2 =

∫ (x − µ )

2

f X ( x )dx

−∞

Asimismo, la desviación estándar de X es σ X = [V ( X )]

1/ 2

40

Apuntes para Clases Curso : Probabilidades MA – 442 Ingeniería Civil Profesor : Raúl Zhigley C.

41

EJEMPLO 7: Para la operación de taladrado del ejemplo 5, la media de X es E( X ) =

x

∫ xf (x )dx = −xe

− 20( x−12.5 )

X

12. 5

e −20( x−12.5 ) − 20

x

= 12.55 12. 5

La varianza de X es V (X ) =

x

∫ (x − 12 .55)

2

f X ( x)dx = 0.0025

12.5

Función generatriz de momentos Si X es una variable aleatoria continua y existe un número h>0, tal que para –h < t < h la esperanza matemática E(etX) existe. Esta esperanza es llamada función generatriz de momentos de X ,es denotada por M(t). Esto es, M(t) = E(etX) EJEMPLO 5: Consideremos una distribución con función de densidad de probabilidad

f ( x ) = xe− x ,

0< x