UNIDAD I ESTADISTICA DESCRIPTIVA La estadística estudia los métodos científicos para recoger, organizar, resumir y anali
Views 528 Downloads 115 File size 2MB
UNIDAD I ESTADISTICA DESCRIPTIVA La estadística estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis; Se divide la estadística en: Estadística descriptiva o deductiva Estadística inferencial o inductiva. ESTADISTICA DESCRIPTIVA O DEDUCTIVA: La parte de la estadística que solo se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor, se llama estadística descriptiva o deductiva.
ESTADISTICA INFERENCIAL O INDUCTIVA: Es aquella que a partir de una muestra representativa de la población se dan conclusiones sobre la población a partir del análisis de la muestra. Con ayuda de la estadística en general se puede organizar y procesar la información utilizando tablas gráficas, el cálculo de medidas de tendencia (media, mediana, moda), medidas de dispersión como percentiles deciles y cuartiles; Y el cálculo de medidas de dispersión (rango, varianza, desviación estándar, coeficiente de variación, coeficiente de simetría y coeficiente de curtosis). Antes de entrar de lleno al estudio de la estadística definamos algunos conceptos para su interpretación a lo largo de la unidad. Variables: discretas y continuas Discretas: variable que puede tomar valores que no estén entre valores ya dados. Continuas: variable que puede tomar cualquier valor entre dos valores dados. Población: grupo entero a examinar puede ser finito o infinito Muestra: parte de la población a examinar.
1
Organización y representación de información estadística mediante tablas y gráficos para datos no agrupados y agrupados. Datos agrupados: 1. Su fin es resumir la información 2. Generalmente los elementos son de mayor tamaño, por lo cual requieren ser agrupados esto implica: ordenar, clasificar y expresarlos en una tabla de frecuencias. 3. Se agrupan datos si se cuentan con muchos elementos y también si son repetitivos, se debe verificar que los datos sean clasificables y que dicha clasificación tenga coherencia y lógica, al final se representa por medio de una “tabla de frecuencias” 4. La agrupación de los datos puede ser simple o mediante intervalos de clase. Datos no agrupados 1. 2. 3. 4.
Los datos son brutos, es decir no se presentan clasificados. Tiene pocos elementos No es repetitiva Se ordenan no se agrupan.
Tabla de frecuencias o distribución de frecuencias Al resumir grandes colecciones de datos, es útil distribuirlos en clases o categorías, y determinar el número de individuos que pertenecen a cada clase, llamado frecuencia de clase. Una tabla que contiene los datos por clase junto con sus respectivas frecuencias de clase se le denomina “tabla de frecuencias” Para formar la tabla de frecuencias se deben seguir los siguientes pasos: 1º. PASO Calculo de rango denotado por “R”. Formula R= Dato mayor – Dato menor Donde dato mayor es el elemento más grande de la muestra. Donde dato menor es el elemento más pequeño de la muestra. 2º. PASO Determinar el número de grupos denotada por “K”. Formula K= Donde n= Número total de datos. El valor de K se redondea al valor más cercano según la naturaleza de los datos. K K K K
= 5.2275 ≈ = 9.873 ≈ = 7.5 ≈ = 6.45 ≈
5 10 8 6
2
3º. PASO Se calcula la amplitud denotada por “C” Formula C= R/K El valor de la amplitud se pasa al valor siguiente y debe estar de acuerdo a la naturaleza de los datos C = 5.0082 ≈ C = 1.3120 ≈ C = 0.8203 ≈
6 ENTEROS 1.313 MILESIMAS 0.83 CENTESIMAS
4º. PASO Se forman los intervalos de clase en forma de columna empezando por escribir el dato menor; Debajo se escribirá el resultado R1 donde R1 = dato menor + C (la amplitud) y después se repite el proceso pero ahora con R1 sumándole la amplitud; así sucesivamente hasta formar el mismo número de grupos que ya se calculó en el 2° paso. Los intervalos de clase se clasifican en LCI Y LCS escritos en dos columnas. Donde LCI es “Limite de Clase Inferior” y Donde LCS es “Limite de Clase Superior” 5º. PASO Una vez se tengan los I.C. (intervalos de clase) se debe calcular sus respectivas frecuencias para cada I.C. formada, para ello se debe hacer un conteo y acomodar cada elemento de la muestra en un único I.C. NOTA: No se puede tener un mismo elemento en dos distintos I.C. EJEMPLO 1 Las 40 cantidades siguientes son las tarifas que se cobraran en dólares por entregar bultos el jueves pasado: 4.03 3.56 2.10 6.04 5.62 3.16 2.93 3.82 a) b) c) d)
4.30 3.86 4.57 3.59 4.57 5.16 2.88 5.02
5.46 3.87 6.84 4.91 3.62 3.62 3.80 3.70
4.15 4.07 3.77 5.77 7.86 4.63 4.81 2.86
Obtener la distribución de frecuencia ( f ) Obtener la distribución de frecuencia acumulada Obtener la distribución de frecuencia relativa ( fr ) Obtener la distribución de frecuencia relativa acumulada
5.02 5.24 4.02 5.44 4.65 3.89 4.00 2.90
(F) ( Fr )
3
SOLUCION R = 7.86 – 2.10 = 5.76 K= = = 6.3245 ≈ 6 C = 5.76 / 6 = 0.96 ≈ 0.97 GRUPOS E INTERVALOS DE CLASE 1) 2.10 -- 3.06 2) 3.07 -- 4-03 3) 4.04 -- 5.00 4) 5.01 -- 5.97 5) 5.98 -- 6.94 6) 6.95 -- 7.91 LCI LCS
CONTEO
f
F
fr
Fr
IIIII IIIII IIIII IIIII IIIII IIII IIIII III
5 15
5 20
5/40=0.125 0.125 15/40=0.375 0.5
9 8
29 37
9/40=0.225 8/40=0.2
0.725 0.925
II I
2 1 40
39 40
2/40=0.05 1/40=0.025 1
0.975 1
LCI = Limite de Clase Inferior LCS = Limite de Clase Superior
f: frecuencia (número de elementos que están dentro de ese intervalo) F: frecuencia acumulada (sumas sucesivas descendentes de la frecuencia) fr: frecuencia relativa (la división de cada frecuencia entre N; donde N es el total de datos) Fr: frecuencia relativa acumulada (sumas sucesivas descendentes de la frecuencia relativa) EJEMPLO 2 Los siguientes datos representan las tazas de octanaje de combustible de motor de varias mezclas de gasolina: 88.5 94.2 93.2 96.1 88.9
90.4 90.6 87.7 87.8 91.0
93.3 91.2 89.3 90.7 83.4
89.9 90.3 91.8 89.3 89.7
GRUPOS DE INTERVALOS DE CLASE 1) 83.4 -- 85.9 2) 86.0 -- 88.5 3) 88.6 -- 91.1 4) 91.2 -- 93.7 5) 93.8 -- 96.3
86.7 88.3 93.4 92.3 94.4
90.3 87.5 87.6 88.5 90.4
CONTEO
I IIIII III IIIII IIIII II IIIII I III
R = 96.1 – 83.4 = 12.7 K= = = 5.47 ≈ 5 C = R/K = 12.7 / 5 = 2.54 ≈ 2.6
f
F
1 8 12
1 9 21
6 3 30
27 30
fr
Fr
0.033 0.333 0.266 0.3 0.4 0.7 0.2 0.1 1
0.9 1
4
Las tablas de frecuencias se usan para elaborar gráficos lineales como el histograma, el polígono y la ojiva. Histograma: consiste en un conjunto de rectángulos con (a) bases en el eje x horizontal, centros en las marcas de clase y longitudes iguales a los tamaños de los intervalos de clase y (b) áreas proporcionales a las frecuencias de clase. Donde X= marca de clase (punto medio del intervalo de clase; Se obtiene promediando el LCI y LCS)
Polígono: es una gráfica de línea de las frecuencias de clase, dibujada con respecto a la marca de clase, puede obtenerse uniendo los puntos medios de las partes superiores de los rectángulos del histograma.
Ojiva: Es la distribución de frecuencias acumuladas, es decir, que en ella se permite ver cuántas observaciones se encuentran por encima o debajo de ciertos valores, en lugar de solo exhibir los números asignados a cada intervalo. Existen dos tipos de ojivas; mayor que y menor que
5
Para construir la ojiva se necesita de frecuencia acumulada en el eje “Y” e IRC en el eje “X” Donde IRC= intervalos reales de clase; se calculan al restar a cada elemento en la columna de LCI el grado de aproximación y se le suma a cada elemento en la columna de LCS el grado de aproximación. El grado de aproximación (α) se obtiene de la resta del LCS de un Intervalo de Confianza y LCI del siguiente Intervalo de Clases por último el resultado de la resta se divide entre dos; α= LCS-LCI siguiente/2 En el caso de la ojiva “mayor que” se utiliza IRC en el eje “X” y se utiliza la frecuencia acumulada mayor (F) en el eje “Y”; la frecuencia acumulada mayor se obtiene al restar a N la frecuencia en cada IC, cabe mencionar que el resultado es acumulativo. Donde N= total de elementos.
EJEMPLO 3 Sea X el tiempo en minutos que debe esperar un vehículo para cruzar una intercepción transitada que cuenta con semáforos. Los datos siguientes se obtienen de una muestra aleatoria de 36 vehículos. 0.2 1.5 2.3 4.0 0.5
1.5 2.5 4.1 0.7 1.6
2.6 4.5 1.1 1.6 2.9
5.1 1.2 1.7 2.8 5.8
1.2 1.9 3.0 1.4 1.3
2.0 3.1 1.4 2.1 3.0
1.4 2.1 3.7 1.4 2.2
3.7 R = 5.8 – 0.2 = 5.6 K= =6 C = 5.6/ 6 = 0.93 ≈ 1
6
a) Determinar la distribución de frecuencia b) Construir histograma y polígono de frecuencia c) Construir ojiva GRUPOS DE INTERVALOS DE CLASE 1) O.2 -- 1.1 2) 1.2 -- 2.1 3) 4) 5) 6)
2.2 3.2 4.2 5.2 (-)
-----
3.1 4.1 5.1 6.1 (+)
CONTEO
f
F
INTERVALOS REALES
IIII IIIII IIIII IIIII I IIIII IIII IIII II I
4 16
4 20
0.15 -- 1.15 1.15 -- 2.15
9 4 2 1 36
29 33 35 36
2.15 3.15 4.15 5.15 LRI
-----
3.15 4.15 5.15 6.15 LRS
LRI = limite real Inferior LRS = limite real superior
0.1/2 = 0.05
7
MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA, MODA. Un promedio es un valor típico o representativo de un conjunto de datos; Como tales valores suelen situarse hacia el centro del conjunto de datos ordenados por magnitud, los promedios se conocen como medidas de tendencia central. Se definen varios tipos siendo los más comunes la media, mediana y moda. Ahora se explicara cada medida de tendencia central en los dos casos posibles que son para: Datos no agrupados y Datos agrupados MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS MEDIA
Es el promedio aritmético de un conjunto de datos y se calcula como la sumatoria de los datos entre el número de datos. Símbolo
Formula n = total de datos x= datos de la muestra MEDIANA
Es el valor que se encuentra en el centro de un conjunto de números acomodados si tenemos datos impares o el promedio de los dos valores centrales si tenemos datos pares.
8
Símbolo MODA
Es el dato que más se repite, si dos valores se repiten con la misma frecuencia se dice que la distribución es bimodal si tres valores se repiten con la misma frecuencia es trimodal, etc. Símbolo
EJEMPLO 4 Seis temperaturas máximas en una ciudad de florida fueron 22, 20, 24, 21, 26 y 22 en grados Celsius A) Calcular media B) Calcular mediana C) Calcular moda SOLUCION A) Media
B) Mediana Primero se ordenan y después se busca el elemento que está en el centro de los elementos, en este caso se tienen dos elementos en el centro, por lo tanto se realiza un promedio de los dos números como a continuación se puede apreciar: 20, 21, 22, 22, 24, 26 22+22/2=22 Por lo tanto la mediana es 22 C) Moda El número 22 se repite 2 veces por lo tanto tiene moda bimodal
9
MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
MEDIA
Se calcula como la sumatoria de los datos por la frecuencia, entre el total de datos. Símbolo
Formula n = total de datos x= datos de la muestra f= frecuencia MEDIANA Símbolo Formula LQ= n/2 n= total de datos LRI= limite real inferior con respecto a LQ F anterior= frecuencia acumulada anterior, con respecto a LQ f= frecuencia con respecto a LQ C= amplitud
MODA Símbolo Formula
LRI= limite real inferior con respecto a f C= amplitud d1= f -f anterior d2= f -f posterior f = frecuencia de la moda (frecuencia del que más se repite)
10
EJEMPLO 5 El primer día de clases del semestre pasado se preguntó a 50 estudiantes de ingeniería acerca del tiempo requerido para desplazarse de su casa a la división de ciencias básicas (redondeando a 5 minutos). Los datos restantes fueron los siguientes: 20 35 25 15 5
20 25 30 20 20
30 15 15 20 20
25 25 20 20 10
20 25 45 20 5
25 40 25 25 20
30 25 35 20 30
15 30 25 20 10
10 5 10 15 25
40 25 10 20 15
A) Hacer tabla de frecuencias B) Calcular media C) Calcular mediana D) Calcular moda a) R= 45-5=40 K= = C= R/K = 40/7=5,71 6 I.C. 5-10 11-16 17-22 23-28 29-34 35-40 41-46
f 8 6 14 12 5 4 1 50
x 7.5 13.5 19.5 25.5 31.5 37.5 43.5
fx 60 81 273 306 157.5 150 43.5 1071
F 8 14 28 40 45 49 50
b)
c)
11
d)
d1= f d2= f
-f anterior= 14 - 6= 8 -f posterior= 14 - 12= 2
MEDIDAS DE POSICION: PERCENTILES, DECILES Y CUARTILES. Si un conjunto de datos esta ordenado por magnitud, el valor central (o la media de los dos centrales) que divide al conjunto en dos mitades iguales, es la mediana. Extendiendo esa idea podemos pensar en aquellos valores que dividen al conjunto en cuatro partes iguales. Esos valores denotados Q1, Q2 Y Q3, se llaman primer, segundo y tercer cuartiles, respectivamente. El Q2 coincide con la mediana. Análogamente los valores que dividen a los datos en 10 partes iguales se llaman deciles, y se denotan D1, D2, …., D9, mientras que ls valores que los dividen en 100 partes iguales se llaman percentiles, denotados por P1, P2, P3, ..., P99. El 5° decil y el 50° percentil coinciden con la mediana. Los 25° y 75° percentiles coinciden con el primer y tercer cuartiles. Se pueden calcular las medidas de posición para datos agrupados y no agrupados como se muestra a continuación:
12
MEDIDAS DE POSICION: PERCENTILES, DECILES Y CUARTILES PARA DATOS AGRUPADOS. Se tienen las siguientes fórmulas para cada caso: CUARTILES Qx
Símbolo
Formula LQx= (localización del cuartil) N= total de datos LRI= limite real inferior con respecto a LQ F anterior= frecuencia acumulada anterior, con respecto a LQ f= frecuencia con respecto a LQx C= amplitud DECILES Dx
Símbolo
Formula LDx= (localización del decil) N= total de datos LRI= limite real inferior con respecto a LQ F anterior= frecuencia acumulada anterior, con respecto a LQ f= frecuencia con respecto a LQx C= amplitud PERCENTILES Px
Símbolo
Formula LPx= (localización del percentil) N= total de datos LRI= limite real inferior con respecto a LQ F anterior= frecuencia acumulada anterior, con respecto a LQ f= frecuencia con respecto a LQx C= amplitud
13
EJEMPLO 6 Tomando los valores del enunciado del ejemplo 5 calcular: A) El tercer cuartil. B) El tercer decil. C) El sexagésimo quinto percentil.
SOLUCION: A)
B)
C)
14
MEDIDAS DE POSICION: PERCENTILES, DECILES Y CUARTILES PARA DATOS NO AGRUPADOS.
QUARTILES Qx
Símbolo
Si se tienen una serie de valores X1, X2, X3, ..., Xn, se localiza mediante las siguientes fórmulas:
- El primer cuartil:
donde n= total de datos
Cuando n es par:
Cuando n es impar:
Para el tercer cuartil
Cuando n es par:
Cuando n es impar:
15
DECILES Dx
Símbolo
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:
Cuando n es par:
Cuando n es impar: Donde A el número del decil y n= total de datos. PERCENTILES Px
Símbolo
Si se tienen una serie de valores X1, X2, X3, ..., Xn, se localiza mediante las siguientes fórmulas: Para los percentiles, cuando n es par:
Cuando n es impar:
Donde A, el número del percentil y n= total de datos.
16
EJEMPLO 7 El diámetro intermedio de las lavadoras producidas por una empresa se mide con exactitud de milésimas de pulgada
0
0.321 1
0.324 2
0.327 3
0.330 4
0.333 5
0.336 6
Quartil-1
= 1.5 1.5 + 0.5 = 2 1.5 - 0.5 = 1
Quartil-3
4.5 + 0.5 = 5 4.5 - 0.5 = 4
Decil-1
Percentil-15
0.9 + 0.5 = 1.4 0.9 - 0.5 = 0.4
Percentil-63
3.78 + 0.5 = 4.28 3.78 - 0.5 = 3.28
0.6 + 0.5 = 1.1 0.6 - 0.5 = 0.1
Decil-9
5.4 + 0.5 = 5.9 5.4 - 0.5 = 4.9
17
MEDIDAS DE DISPERSION La dispersión o variación de los datos intenta dar una idea de cuan esparcidos se encuentran estos; Hay varias medidas de tal dispersión, siendo las más comunes el rango, la desviación media, el rango cuartilico, rango percentilico, varianza, desviación estándar, coeficiente de variación. Se pueden calcular las medidas de dispersión para datos agrupados y no agrupados como se muestra a continuación: MEDIDAS DE DISPERSION PARA DATOS AGRUPADOS 1) Rango = Dato mayor – Dato menor. El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos. EJEMPLO 8 I.C. 5-10 11-16 17-22 23-28 29-34 35-40 41-46
El dato mayor es 46 y el dato menor es 5, por lo tanto tiene un rango R= 46 – 5 = 41
2) Rango Cuartilico =
EJEMPLO 9 Partiendo de los datos del ejemplo 5, Calculamos entonces
:
Calculamos entonces
18
Calculamos entonces
Por lo tanto el
3) Rango Percentilico =
=
-
EJEMPLO 10 Partiendo de los datos del ejemplo 5, Calculamos entonces
:
Calculamos entonces
Calculamos entonces
Por lo tanto
=
-
= 34.5 – 8.25 = 26.25
4) Desviación media ⟹ La desviación media o desviación promedio, de un conjunto de N números, es abreviada por DM. Donde el resultado de la operación ⟹
nos da un valor absoluto.
19
5) Varianza ⟹
=
La varianza de un conjunto de datos se define como el resultado de la desviación estándar y viene dada en consecuencia por .
6) Desviación estándar ⟹ S = La desviación estándar de un conjunto de N números, se denota por S; si N números ocurren con frecuencia, la desviación estándar se expresa como en la ecuación dada.
7) Coeficiente de Variación ⟹ CV = La fórmula del C.V. viene de la fórmula de la dispersión relativa dada por Dispersión relativa= La dispersión relativa se llama el coeficiente de variación, la desviación estándar es S y el promedio es por lo tanto surge la nueva ecuación:
EJEMPLO 11 El primer día de clases del semestre pasado se preguntó a 50 estudiantes de ingeniería acerca del tiempo requerido para desplazarse de su casa a la división de ciencias básicas (redondeando a 5 minutos). Los datos restantes fueron los siguientes: 20 35 25 15 5
20 25 30 20 20
30 15 15 20 20
25 25 20 20 10
20 25 45 20 5
25 40 25 25 20
30 25 35 20 30
15 30 25 20 10
10 5 10 15 25
40 25 10 20 15
A) Calcular desviación media. B) Calcular desviación estándar. C) Calcular varianza. D) Calcular coeficiente de variación.
20
I.C. 5-10 11-16 17-22 23-28 29-34 35-40 41-46
f 8 6 14 12 5 4 1 50
x 7.5 13.5 19.5 25.5 31.5 37.5 43.5
fx 60 81 273 306 157.5 150 43.5 1071
F 8 14 28 40 45 49 50
I.R.C. 4.5 - 10.5 10.5 - 16.5 16.5 - 22.5 22.5 - 28.5 28.5 - 34.5 34.5 - 40.5 40.5 - 46.5
13.92 7.92 1.92 4.08 10.08 16.08 22.08
111.36 47.52 26.88 48.96 50.40 64.32 22.08 371.52
1550.1312 376.3584 51.6096 199.7568 508.0320 1034.2656 487.5264 4207.68
a)
b)
c)
d)
21
MEDIDAS DE DISPERSION PARA DATOS NO AGRUPADOS 1) Rango = Dato mayor – Dato menor. El rango de un conjunto de números es la diferencia entre el mayor y el menor de todos ellos. EJEMPLO 12 El rango del conjunto 2, 3, 3, 4, 4, 4, 8, 10,12 es 12 – 2 = 10. A veces el rango se indica dando el par de valores extremos, así, en este ejemplo, seria 2 – 12. 2) Media Donde “x” son los datos y “n” es total de datos
3) Rango Cuartilico =
4) Rango Percentilico =
=
-
5) Desviación media ⟹ La desviación media o desviación promedio, de un conjunto de N números, es abreviada por DM. Donde el resultado de la operación ⟹ Y “x” son los datos 6) Varianza ⟹
nos da un valor absoluto.
=
La varianza de un conjunto de datos se define como el resultado de la desviación estándar y viene dada en consecuencia por .
7) Desviación estándar ⟹ S = La desviación estándar de un conjunto de N números, se denota por S.
22
8) Coeficiente de Variación ⟹ CV = La fórmula del C.V. Viene de la fórmula de la dispersión relativa dada por Dispersión relativa= La dispersión relativa se llama el coeficiente de variación, la desviación estándar es S y el promedio es por lo tanto surge la nueva ecuación:
EJEMPLO 13
Cinco temperaturas máximas en una ciudad de florida fueron 22, 20, 24, 21 y 26 en grados Celsius. A) B) C) D) E)
Calcular media Desviación media Varianza Desviación estándar Coeficiente de variación
a) Media
b) Desviación media x 22 20 24 21 26
0.6 2.6 1.4 1.6 3.4 9.6
23
c) Varianza x 22 20 24 21 26
0.6 2.6 1.4 1.6 3.4 9.6
0.36 6.76 1.96 2.56 11.56 23.20
d) Desviación estándar
e) Coeficiente de variación
MOMENTOS SESGOS Y CURTOSIS MOMENTOS Los momentos son una forma de generalizar toda la teoría relativa a los parámetros estadísticos y guardan relación con una buena parte de ellos. Dada una distribución de datos estadísticos x1, x2,..., xn, se define el momento central o momento centrado de orden k como
24
Sesgos o coeficiente de asimetría. Se conoce como sesgo al grado de asimetría de una distribución, es decir, cuando se aparta de la simetría. Si la curva de frecuencias (polígono de frecuencia suavizado) de una distribución tiene a la derecha una cola mas larga que a la izquierda, se dice sesgada a la derecha o de sesgo positivo. En caso contrario, sesgada a la izquierda, o de sesgo negativo. Si es igual se dice que es simétrica.
Donde Para datos no agrupados.
Para datos agrupados.
25
CURTOSIS Mide cuan puntiaguda es una distribucion, en general por rederencia a la a normal. Si tiene un pico alto , como en la figura “A.1” Se dice leptocurtica, mientras si es aplastada, como la de la figura “A.2” se dice platocurtica. La distribucion normal, mostrada en la figura “A.3” que nop es muy puntiatguda ni muy aplastada, se llama mesocurtica
Donde
se calcula mediante
Para datos no agrupados.
Para datos agrupados.
26
EJERCICIOS COMPLEMENTARIOS DE LA UNIDAD 1 EJEMPLO 14 La siguiente información representa la duración (en miles de ciclos) de perfiles rectangulares a) b) c) d)
750 950
Construir histograma, polígono de frecuencias Construir ojiva Calcular los 4 cuartiles en forma gráfica y en forma analítica Calcular el decil-3, decil-9, percentil-10 y percentil-90
I de C -- 949 -- 1149
F 8 1 7 1 9 1 9 1 1 1 7 3
1150 -- 1349 1350 -- 1549 1550 -- 1749 1750 -- 1949 1950 -- 2149
F 8 2 5 4 4 6 3 7 4 9 1 9 4
Intervalos Reales 749.5 -- 949.5 949.5 -- 1149.5 1149.5 -- 1349.5 1349.5 -- 1549.5 1549.5 -- 1749.5 1749.5 -- 1949.5 1949.5 -- 2149.5
C= 950-750= 200 Grado de aproximación=1
/ 2 = 0.5
OJIVA 100 80 60 40 20
0
27
= Localización de cuartil-x
⟹ ⟹
Quartil-2
Quartil-3
Quartil-4
Decil-3
Decil-9
Percentil-10 INTERPOLACIÓN
949.5 -- 8 -- 23.5 1149.5 -- 25
Percentil-90
28
EJEMPLO 15 La siguiente tabla muestra los salarios de 70 empleados
I de C 250.00 -- 259.99 260.00 -- 269.99 270.00 -- 279.99 280.00 -- 289.99 290.00 -- 299.99 300.00 -- 309.99 310.00 -- 319.99 320.00 -- 329.99
f 8 10 16 15 10 5 3 3
F 8 18 34 Calcular 49 59 64 67 70
Grado de aproximación=.01 / 2 = 0.005 Quartil-1
Quartil-3
Decil-2
Decil-7
Percentil-2
Percentil-98
29
EJEMPLO 16 En el torneo internacional de ajedrez de grandes maestros, participaron 10 reconocidos maestros. La siguiente es una lista de la duración (de numero de movimientos) de los 9 participantes que se disputaron 41 42 47 30 32 66 46 18 32. Calcular 18 0
30 1
32 2
32 3
41 4
42 5
46 6
47 7
77 8
9
Quartil-1 = 2.25
Decil-9
2.25 + 0.5 = 2.75 2.25 - 0.5 = 1.75 8.1 + 0.5 = 8.6 8.1 - 0.5 = 7.6 Quartil-3 Percentil-16 6.75 + 0.5 = 7.25 6.75 - 0.5 = 6.25 1.44 + 0.5 = 1.94 1.44 - 0.5 = 0.94 Decil-2 Percentil-92 1.8 + 0.5 = 2.3 1.8 - 0.5 = 1.3 8.28 + 0.5 = 8.78 8.28 - 0.5 = 7.78
30
EJEMPLO 17 Los datos siguientes representan las calificaciones finales que obtuvieron en matemáticas 8 alumnos de una universidad. 84 62
79 65
65 67
78 78
78 78
62 79
80 80
67 89
EJEMPLO 18 Los siguientes datos representan las distancias en millas que recorren 9 estudiantes de su casa a la universidad 15.7 6.2 4.8 3.2 4.4 3.9 1.1 4.4 4.8 Calcular media, mediana, moda y determinar qué tipo de sesgo hay. 1.1
3.2
3.9
4.4
4.4
4.8
4.8
6.2
15.7
31
EJEMPLO 19 En los siguientes datos representa los pesos dados a la libra más cercana de 5 estudiantes. 138
146
1668
146
161
138
146
146
161
168
R = dato mayor – dato menor = 168 – 138 = 30 =
4.5 + 0.5 = 5 4.5 - 0.5 = 4
= 162.75 – 144 = 18.5
-
Quartil-1
X 138 146 168 146 161 759
= 1.25 1.25 + 0.5 = 1.75 1.25 - 0.5 = 0.75
190.44 33.64 262.44 33.64 84.64 604.8
Quartil-3
3.75 + 0.5 = 4.75 3.75 - 0.5 = 3.25
=
-
= 168 – 138 = 30
Percentil-10
0.5 + 0.5 = 1 0.5 - 0.5 = 0
S=
= 12.2963
CV =
-2628.072 -195.112 4251.28 -195.112 778.688 2011.672
36267.3436 1131.6496 68874.7535 1131.6469 7163.9296 114569.376
Percentil-90
32
DISTRIBUCION ASIMETRICA CON SESGO POSITIVO
DISTRIBUCION PLATOCURTICA
EJEMPLO 20
El número de accidentes que ocurren durante un periodo de 7 días es 0 2 2 6 7 8 9 Calcular todas las medidas de dispersión. Rango = 8 – 0 = 8 Rango Cuartilico = - = 7.75 – 2 = 5.75
Rango Percentilico = = 8.8 – 0.4 = 8.4 Percentil-10
Quartil-1 = 1.75
0.7 + 0.5 = 1.2 0.7 - 0.5 = 0.2
1.75 + 0.5 = 2.25 1.75 - 0.5 = 1.25 Percentil-90 Quartil-3 6.3 + 0.5 = 6.8 6.3 - 0.5 = 5.8 5.25 + 0.5 = 5.75 5.25 - 0.5 = 4.75
33
Varianza
Coeficiente de Curtosis X 0 2 2 6 7 8 9 34
S=
23.5914 8.1630 8.1630 1.3062 4.5920 9.8778 17.1636 72.8570
DISTRIBUCION PLATOCURTICA
= 3.4847
Coeficiente de variación CV = Coeficiente de simetría -114.5859 -23.3226 -23.3226 1.4929 9.8402 31.0.450 71.1072 -47.7458
556.5551 66.6349 66.6349 1.7062 21.0867 97.5713 294.5898 1,104.779
DISTRIBUCION ASIMETRICA SESGO NEGATIVO
CON
34
EJEMPLO 21 Ingenieros civiles ayudan a que las plantas municipales de tratamientos de aguas residuales funcionen de manera más eficiente, al recolectar datos acerca de la calidad de las aguas residuales. En 7 ocasiones las cantidades de salidas suspendidas (partes por millón) en una planta fueron X 14 12 21 28 30 65 26 196
S=
196 256 48 0 4 1369 4 1878
-2744 -4096 -343 0 8 50653 -8 43470
38416 65536 2401 0 16 1874161 16 1980546
= 17.6918
Coeficiente de variación CV = Coeficiente de simetría
DISTRIBUCION ASIMETRICA CON SESGO POSITIVO
35
DISTRIBUCION LEPTOCURTICA EJEMPLO 22 La siguiente información representa la duración en miles de ciclos de perfiles rectangulares. a) Construir Histograma y Polígono de Frecuencia b) Construir Ojiva c) Partir cuatro cuartiles en forma gráfica y analítica d) Calcular el decil-3, decil-9, percentil-16
C=200 Grado de aprox.=1 n= 94
Int. de Clase
f
750 - 949 950 - 1149 1150 - 1349 1350 - 1549 1550 - 1749 1750 - 1949 1950 - 2149
8 17 23 15 11 17 3
Intervalos Reales 749.5 - 949.5 949.5 - 1149.5 1149.5 - 1349.5 1349.5 - 1549.5 1549.5 - 1749.5 1749.5 - 1949.5 1949.5 - 2149.5
F 8 25 48 63 74 91 94
36
Ojiva 100
100%
90 80
75%
70
F
60 50
50%
40
Ojiva
30 25%
20 10 0 749.5
949.5 1149.5 1349.5 1549.5 1749.5 1949.5 2149.5 2349.5 I.R
1. Cuartiles forma analítica LQx = Localización Cuartil x
1131.8529
2. Calcular decil-3 y 9 así como percentil-16 LDx = Localización Decil x
= 28.2
37
= =
1974.2059
= 84.6 LPx = Localización Percentil x
= 15.04 =1032.3235
38
EJEMPLO 23
Una agencia publicitaria está evaluando diferentes medios de promoción para cada uno de sus clientes, para uno de sus clientes que es fabricante de productos de aseo destinado a los ancianos. Realiza una carrera de automóviles, en seguida se da la distribución de edades del público que asistió a la carrera. Calcular Q 1, Q3, D5, D9, P1, y P9. c=6 n=390 Grado de aprox.
Edades
f
15 - 20 21 - 26 27 - 32 33 - 38 39 - 44 45 - 50 51 - 56 57 - 62 63 - 68
5 20 24 30 46 88 103 44 30 390
Intervalos Reales 14.5 - 20.5 20.5 - 26.5 26.5 - 32.5 32.5 - 38.5 38.5 - 44.5 44.5 - 50.5 50.5 - 56.5 56.5 - 62.5 62.5 - 68.5
F 8 25 49 79 125 213 316 360 390
=1
= 351 = 61.27 = 97.5 = 40.91
= 3.9 = 19.18
= 292.5 = 55.13
= 261.3 =
= 195
53.3136 = 49.27
39
EJEMPLO 24 1. El peso en kg de los campeones intramuros es: 56.6, 137.4, 73.9, 82, 86.1, 97.5 y 79.3. Calcular Q1, Q3, D2, D8, P15 y P83 = 1.75
75.25
2.25 1.125 = 5.25
94.65
5.75 4.75 = 1.4
72.17
1.9 0.9 = 5.6
101.49
6.1 5.1 = 1.05
66.115
1.55 0.55 = 5.81
109.869
6.31 5.31
40
EJEMPLO 25 El número de aviones extranjeros al nuevo aeropuerto de cd. De Guanajuato. En 7 días seleccionados al azar fueron 8, 3, 9, 5, 6, 8, 5, calcular madia, moda, mediana 3, 5, 5, 6, 8, 8, 9
EJEMPLO 26 La siguiente tabla muestra la distribución de la edad de 100 ancianos, calcular las medidas de tendencia central años 60 – 62 63 – 65 66- 68 69 – 71 72 – 74 ½ = 0.5
f 5 18 42 27 8 100
Frecuencia de la moda
F 5 23 65 92 100
x 61 64 67 70 73
d1 = 42-18 = 24
fx 305 1152 2814 1890 584 6745
d2 = 42- 27 =15
16, 16, 16, 16, 9, 9, 9, 9, 9, 9, 37, 37,
41
EJEMPLO 27 Un psicólogo deportivo reunió datos de un grupo de corredores formando la siguiente distribución, calcular la media, mediana y moda. C=0.40
MILLAS POR DÍA
INTERVALOS 1.60-1.39 1.40-1.79 1.80-2.19 2.20-2.59 2.60-2.99 3.00-3.39 3.40-3.79 3.80-4.19 4.20-4.59 4.60-4.99 5.00-5.39
f 32 43 81 122 131 130 111 95 82 47 53 927
x 1.195 1.595 1.995 2.345 2.795 3.195 3.595 3.995 4.395 4.795 5.195
fx 38.24 68.585 161.595 292.19 366.145 415.35 399.045 379.525 366.39 225.365 275.335 2987.765
F 32 75 156 278 409 539 650 745 827 874 927
d1= diferencia uno d1= f – f ant
d2= = f
f = frecuencia de moda f ant= frecuencia anterior f post= frecuencia posterior
42
EJEMPLO 28 Es una oficina de un diario se registró el tiempo en que tardaron en imprimir la primera plana durante 50 días. Obteniéndose la siguiente distribución. Int. de clase 1.90-20.1 20.2-21.3 21.4-22.3 22.6-23.7 23.8-24.9 25.0-26.1 26.2-27.3
f 7 11 7 10 11 3 1 50
d1=11-7=4
d1=11-10
d2=11-7=4
d2=11-3=8
LRI= 20.2-0.05=20.15
x 19.55 20.75 21.95 23.15 24.35 25.55 26.75
fx 136.86 228.25 153.65 231.5 267.85 76.65 26.75 1121.51
F 7 18 25 35 46 49 50
23.8-0.05-23.75
43
EJEMPLO 29 La sig. Distribución representa la edad de 100 ancianos que varía entre 60 y 74 años. I.C. 60-62 63-65 66-68 69-71 72-74 n
No. Ancianos 5 18 42 27 8 100
Int. clase 60-62 63-65 66-68 69-71 72-74
f 5 18 42 27 8 100
F 5 23 65 92 100
X 61 64 67 70 73
fx 305 1152 2814 1890 584 6745
f 32.25 62.10 18.9 68.85 44.4 226.5
f 208.0125 214.245 8.505 175.5675 246.42
-1341.6866 -739.1453 -3.8273 447.6971 1367.631 -269.3311
8653.8400 2550.0511 1.7223 1141.6277 7596.3521 19943.5932
(-) 1. 2. RQ= Q3 – Q1)= 69.6111-65.6428=3.9683 LQ3=
18
75
69.6111
3. Rp=P90-P10 LP90=
44
LP10=
RP=71.2778-63.3333=7.9445 4. D.M. =
5. S2= 6. S=
7. C.V. =
8.
=
45
EJEMPLO 30 La siguiente distribución representa los diámetros en pulgadas Int. clase 5.97-6.18 6.19-6.24 6.41-6.62 6.63-6.84 6.85-7.06 7.07-7.28
f 2 5 7 13 7 6 40
F 2 7 14 27 34 40
x 6.075 6.295 6.515 6.735 6.955 7.175
fx 12.15 31.475 45.605 87.555 48.685 43.05 268.52
n=40
f 0.8141 0.8736 0.2749 6.292x10-3 0.4099 1.2507 3.6289
f 0.3314 0.1326 0.0107 3.0453x10-6 0.0246 0.2733 0.7920
n=40 Rp=P90-P10 40≥36 C=0.22
Rp=7.1383-6.273= 0.8653
46
EXAMENES (PRIMER EXAMEN PARCIAL UNIDAD-1) EJEMPLO 31
TIPO A
1.- En la siguiente tabla, se muestra las observaciones del nivel de agua en metros en una presa. a) Calcular media, moda, percentil-18. b) Determinar el coeficiente de simetría. INTERVALOS REALES 40.05-43.05 43.05-46.05 46.05-49.05 49.05-52.05 52.05-55.05
f 7 9 14 18 20
SOLUCIÓN. a) x
f
xf
F
41.55 7 290.85 7 -3005.5461 44.55 9 400.95 16 -844.4836 47.55 14 665.7 30 -51.5429 50.55 18 909.9 48 55.5458 53.55 20 1071 68 1769.4209 3338.4 -2076.6059
Media=3338.4/68=49.0941
= 52.05+
47
b)
Distribución asimétrica sesgo negativo. EJEMPLO 32 2.- Los contenidos de alquitrán el 6 marcas de cigarrillos son: 9.3, 7.3, 8.6, 16.1, 10.4, 12.2. Determinar el coeficiente de variación y desviación media.
x 9.3 7.3 8.6 16.1 10.4 12.2
1.35 3.35 2.05 5.45 0.25 1.55 14
1.8225 11.2225 4.2025 29.7025 0.0625 2.4025 49.415
EJEMPLO 33 3.- Los siguientes datos representan el tiempo que tardaron en imprimir la primera plana en 40 días, construir polígono de frecuencia. 19.0 19.8 20.7 20.9 21.8 22.5 23.1 27.3 19.0 19.9 20.8 20.9 21.9 22.7 23.3 27.8 19.0 20.1 20.8 20.9 22.0 22.8 23.5 27.9 19.0 20.7 20.8 21.1 22.0 22.8 27.3 27.9 19.7 20.7 20.9 21.1 22.2 22.8 27.3 28.2
48
SOLUCIÓN.
Intervalos de clase
f
Intervalos reales
1)
19.0-20.5
8
18.95 – 20.55
2)
20.6-22.1
16
20.55 -22.15
3)
22.2-23.7
9
22.15 – 23.75
4)
23.8-25.3
0
23.75 – 25.35
5)
25.4-26.9
0
25.35 – 26.95
6)
27-28.5
7
26.95 – 28.55
49
EXAMEN EJEMPLO 34
TIPO B
1.-Las cantidades siguientes son las tarifas de cobro por entrega de bultos pequeños. 4.13 3.56 3.10
6.04 5.62 2.93 3.16
4.30 3.86 4.57
3.59 4.57 2.88 5.16
5.46 3.87 6.81
4.91 3.62 3.80 3.62
4.15 4.07 3.77
5.77 7.86 4.81 4.63
5.02 5.24 4.02
5.44 4.65 4.00 3.89
Determinar la distribución de frecuencia y construir histograma.
SOLUCIÓN.
Intervalos Reales 2.875 - 3.715 3.715 - 4.555 4.555 - 5.395 5.395 - 6.235 6.235 - 7.075 7.075 - 7.915
50
EJEMPLO 35 2.-El porcentaje de algodón en una tela utilizada para elaborar camisas es: 34.2. 33.6, 37.8, 32.6, 35.4 y 35.9. Calcular el rango cuartílico y el coeficiente de simetría. SOLUCIÓN. X 34.2
-0.3681
33.6
-2.2826
37.8
23.9707
32.6
-12.4334
35.4
0.1129
35.9
0.9508 9.9505
51
. Distribución asimétrica positiva
EJEMPLO 36 3.- Calcular el cuartil-3, percentil-5 y la moda. Limites
f
F
2.86-3.57
7
7
3.58-4.29
15
22
4.30-5.01
7
29
5.02-5.73
7
36
5.74-6.45
5
41
6.46-7.17
2
43
SOLUCIÓN.
52
EXAMEN EJEMPLO 37
TIPO C
1. Calcular mediana, moda y coeficiente de variación Int. de Clase 170-189 190-209 210-229 230-249 250-269 270-289
f
F
2 10 17 23 32 45
2 12 29 52 84 129
EJEMPLO 38 2. El tiempo que tardaron en imprimir la primera plana, fue registrada durante 5 días fue: 20.8, 19.0, 23.9, 25.1, 20.7 ¿Calcular el coeficiente de Kurtosis y el rango cuartilico? 19.0 0 5
20.7 1
20.8 2
23.9 3
25.1 4
53
x 20.8 19.0 23.9 25.1 20.71
(x-21.9)^4 1.4641 70.7281 16 104.8576 2.0736 ∑=195.1234
EJEMPLO 39 3. El porcentaje de algodón en una tela utilizada para elaborar camisas Construir ojiva 34.2 33.1 34.5 35.6
33.6 38.7 45.0 35.4
33.8 34.2 33.4 34.7
37.8 33.6 32.5 34.1
37.8 36.6 35.4 34.6
32.6 33.1 34.6 35.9
54
34.3 36.2 34.6 35.1 33.8 34.7
Int. de clase 32.5 – 35.0 35.1 – 37.6 37.7 – 40.2 40.3 – 42.8 42.9 – 45.4
f 19 7 3 0 1
F 19 26 29 29 30
I.R.C. 32.45 – 35.05 35.05 – 37.65 37.65 – 40.25 40.25– 42.85 42.85 – 45.45
OJIVA
55
Examen EJEMPLO 40
Tipo D
1. Los salarios obtenidos por 50 estudiantes X 55 60 65 70 75 80 f 6 3 4 11 16 10 a) Construir Ojiva b) Calcular mediana, decil-7, percentil-16. a) Ojiva Int. Reales 52.5 – 57.5 57.5 – 62.5 62.5 – 67.5 67.5 – 72.5 72.5 – 77.5 77.5 – 82.5
f 6 3 4 11 16 10
F 6 9 13 24 40 50
56
EJEMPLO 41 2. El porcentaje de algodón en una tela utilizada para elaborar camisas fue: 34.2, 33.1, 34.5, 35.6, 34.3, 45.0, calcular coeficiente de variación y coeficiente de simetría.
X 34.2 33.1 34.5 35.6 34.3 45.0
(x-36.1167)^3 -7.0411 -27.4525 -4.2253 -0.1379 -5.9955 701.0159 ∑=656.1636
57
EJEMPLO 42 3. Los siguientes datos históricos de los sueldos por alumnos en dólares. 3.79 2.45 3.36 3.14 2.99
2.14 2.05 3.54 2.77 2.67
2.89 2.37 2.91 2.52 2.83
2.68 3.10 2.71 3.13 3.51
1.84 2.75 2.44 3.37 2.52
3.57 2.10 3.22 3.85 3.71
Obtener la distribución de frecuencia relativa
Int de Clase 1.84 – 2.24 2.25 – 2.65 2.66 – 3.06 3.07 – 3.47 3.48 – 3.88
f 4 5 9 6 6
Fr 0.1333 0.1667 0.3 0.2 0.2
58
UNIDAD 2 FUNDAMENTOS DE LA TEORIA DE PROBABILIDAD La probabilidad se define como evento entre espacio muestral.
Evento: Es el número de casos favorables. Espacio Muestral: Es el número total de casos posibles. Por ejemplo: Se lanza un dardo a una ruleta que esta girando, la cual tiene sectores de colores, 8 de ellos son de color amarillo, 10 de rojo y 12 de blanco, determinar la probabilidad de que el dardo caiga en un sector rojo. Solución: ε = 10 sectores rojos S = 30 (todos los sectores que compone la ruleta) Entonces: P(rojo) = 10/30 = 1/3 = 0.3333 = 33.33% AXIOMAS DE PROBABILIDAD 1) La probabilidad de un evento toma valores entre 0 y 1, cuando es igual a cero tenemos la seguridad de que no va a ocurrir y cuando es igual a 1 tenemos las certeza de que el evento ocurrirá. 0 P( E ) 1
Ejemplo: P(azul) = 0% (el sector azul no existe en al ruleta) Por lo tanto este evento es un 0 ya que no ocurrirá en este caso.
2) La suma de probabilidades de los eventos que forman el espacio muestral es igual a 1.
P( E) 1
59
EJEMPLO 43 Ejemplo 1 (en base al ejemplo de la ruleta):
P(E)=0.2667+0.3333+0.4= 1 EJEMPLO 44
Ejemplo 2:
Dado S {1,2,3,4,5,6} P(1) P(2) P(3) P(4) P(5) P(6) 1
1 1 1 1 1 1 1 6 6 6 6 6 6 3) La probabilidad de que un evento no ocurra es igual a 1- (la probabilidad de que el evento ocurra).
P( A´) 1 P( A)
Nota:
= Probabilidad de A complemento.
4) La probabilidad de la unión de 2 eventos que son mutuamente excluyentes es igual a la suma de sus probabilidades.
60
P( A B) P( A) P( B)
5) La probabilidad de la unión de 2 eventos que son colectivamente exhaustivos es igual a la suma de sus probabilidades menos la probabilidad de que ocurran ambos.
P( A B) P( A) P( B) P( A B) {1,2} {2 ,3} {2 }
De 3 eventos seria de la sig. manera:
P( A B C) P( A) P( B) P(C ) P( A B) P( A C ) P( B C ) P( A B C) {1,2 ,4 ,5 } {2 ,3,5 ,6 } {4,5 ,6,7} {2 ,5 } {4 ,5 } {5 ,6 } {5}
EJEMPLO 45
Ejercicio 1:
Sea S {a1 , a2 , a3 , a4 } y sea P una función de probabilidades de S : a) Hallar P(a1 ) si P(a 2 )
1 1 1 , P ( a3 ) y P ( a 4 ) 3 6 9
61
1 y P(a1 ) 2P(a2 ) 4 2 1 1 c) Hallar P(a1 ) si P(a2 , a3 ) , P(a2 , a4 ) y P(a2 ) 3 2 3 Solución: b) Hallar P(a1 ) y P(a2 ) si P(a3 ) P(a4 )
1 1 1 7 a) P(a1 ) 1 3 6 9 18 b) P(a1 ) P(a3 ) 2P(a2 ) P(a2 ) P(a4 ) P(a3 )
P(a1 ) P(a3 ) 3P(a2 ) P(a4 ) P(a3 ) 1 1 3P ( a 2 ) 2 1 1 3P ( a 2 ) 2 1 P(a 2 ) 6
P(a1 ) 2P(a2 )
1 P(a1 ) 2 6 1 P(a1 ) 3 c) P(a1 ) P(a2 ) P(a3 ) P(a4 ) 1 1 ( P(a1 ) P(a2 ) P(a3 )) P(a4 ) 1 ( P(a1 ) P(a2 ) P(a3 )) P(a4 ) 2 P(a2 ) P(a3 ) 3 2 1 1 P ( a3 ) 3 3 3 1 P( a 2 ) P( a 4 ) 2 1 1 1 P(a4 ) 2 3 6 1 1 1 1 P(a1 ) 1 P(a2 ) P(a3 ) P(a4 ) 1 3 3 6 6 EJEMPLO 46
Ejercicio 2:
Tres estudiantes A, B Y C intervienen en una prueba de natación, A y B tienen la misma probabilidad de ganar y el doble de la de C. Hallar la probabilidad de que gane B o C.
62
Solución:
S {A, B, C} P( A) P( B) P(C ) 1
Si,
P( A) P( B) 2P(C )
Sustituyendo P(B) y P(A): 2P(C ) 2P(C ) P(C ) 1 5P(C ) 1
1 5 Para P(B), si: P(C )
1 P( B) 2 P(C ) 2 5 2 P( B) 5 Por lo tanto:
P( B C ) P( B) P(C )
Sustituyendo: 2 1 3 P( B C ) 0.6 60% 5 5 5 EJEMPLO 47
Ejercicio 3:
De 120 estudiantes 60 estudian francés, 50 español y 20 estudian francés y español. Si se escoge un estudiante al azar hallar la probabilidad de que el estudiante: a) Estudie francés y español. b) No estudie francés ni español. c) Estudian únicamente un idioma. Solución: a) F=60, E=50, P( F E ) 20 S {120}
P( F E )
20 0.1667 16.67% 120
b)
63
c)
EJEMPLO 48
Ejercicio 4:
El departamento de publicidad Dell palacio de bronce efectuó una encuesta a un grupo seleccionado de 1000 clientes de entre todos los que abrieron su cuenta de crédito en el pasado desde diciembre. Los resultados de la encuesta se han tabulado así: Mercancía Artículos para hogar Artículos para vestir Juguetes Artículos para hogar y vestir Artículos para hogar y juguetes Artículos para vestir y juguetes Artículos para vestir, juguetes y del hogar
#De personas 275 400 550 150 110 250 100
Abreviación H V J H∩V H∩J V∩J H∩V∩J
a) Si se selecciona al azar a uno de estos clientes determine la posibilidad de que no usara su crédito en ninguno de estos mencionados b) Que utilizara su crédito solo para comprar juguetes. c) Que utilice su crédito para comprar al menos 2 de los artículos mencionados. Solución:
a) P( H V J ) 1 P( H V J )
64
P( H V J ´) P( H ) P(V ) P( J ) P( H V ) P( H J ) P(V J ) P( H V J ) 275 400 550 150 110 250 100 815 0.815 1000 1000 1000 1000 1000 1000 1000 1000 1 P( H V J ) 1 0.815 18.5%
b)
H V =150=A2+A5 150=A2+100 150-100=A2 A2=50 H=275=A1+A2+A4+A5 =A1+100+50+10 A1=275-160=115 V=A2+A3+A5+A6 400=50+A3+100+150 A3=400-50-250=100 J=A4+A5+A6+A7 550=10+100+150+A7 A7=550-260=290 290 P( SoloJ ) 0.29 29% 1000 c) P(Al menos 2 artic.) = P(artc.≥2) = A2+A4+A5+A6
65
EJEMPLO 49
Ejercicio 5:
Un investigador de mercados efectúa una encuesta sobre los hábitos de lectura de periódicos de la ciudad de Córdoba, con los siguientes datos: 98% 22.9% 12.1% 5.1% 3.7% 6.0% 32.4%
Leen el clarín Leen el mercurio Leen la sensación Leen el clarín y el mercurio Leen el clarín y la sensación Leen el mercurio y la sensación Leen al menos uno de los 3 periódicos mencionados
Calcular el porcentaje de personas que: a) No leen ninguno de los tres periódicos mencionados. b) Leen exactamente 2 de los periódicos.
Solución: a)
b)
P(C M S ) P(C) P(M ) P(S ) P(C M ) P(C S ) P(M S ) P(C M S ) 0.324=0.098+0.229+0.121-0.051-0.037-0.06+ P(C M S ) 0.324=0.3+ P(C M S ) P(C M S ) =0.024 P(C M ) =A2+A5
0.051=A2+0.024 A2=0.027
66
P(C S ) =A4+A5
0.037=A4+0.024 A4=0.013 P( M S ) =A6+A5
0.06=A6+0.024 A6=0.036 P( Exacatment e _ 2 _ periodi cos) =A2+A4+A6=0.027+0.013+0.036=0.076=7.6%
EJEMPLO 50
Ejercicio 6:
El instituto de la juventud del estado huasteco esta organizando los equipos de fútbol, béisbol y natación para las próximas mini olimpiadas. Hay 900 personas del instituto que han manifestado sus deseos de participar en esos eventos deportivos y han cumplido con los exámenes médicos deportivos, Se habían obtenido los siguientes datos preliminares del primer listado de computadora, cuando repentinamente se interrumpió el servicio eléctrico. 400 en fútbol 390 en béisbol 480 en natación 680 en fútbol o béisbol 210 no pueden participar en ninguno de estos 90 en los primeros 2, pero no en el tercero 190 en solamente natación Si se selecciona al azar una persona determinar la probabilidad de que; a) Pueda participar en los tres deportes. b) Pueda participar en por lo menos 2 de los deportes. Solución: a)
67
680= P( F B) =F+B- P( F B) 680=400+390- P( F B) P( F B) =110 P( F B N ) =A5 P( F B) =A2+A5
110=90+A5 A5=20 P( F B N )
20 0.0222 2.22% 900
b) P( Por _ lo _ menos _ 2)
480 190 90 0.4222 42.22% 900
EJEMPLO 51 Ejercicio 7: En una encuesta realizada por la “Panificadora Real” se entrevistaron a 900 amas de casa sobre su preferencia a 3 productos que fabrican, se obtuvieron los siguientes resultados: 130 personas compran únicamente pan de caja 88 personas compran únicamente pan negro 32 personas compran únicamente mantecadas 144 personas compran pan de caja y pan negro exclusivamente 86 personas compran pan negro y mantecadas exclusivamente 90 personas compran pan de caja y mantecadas exclusivamente 205 personas compran los 3 productos Si se selecciona una persona al azar cual es la posibilidad de que: a) Consuma al menos pan de caja o pan negro b) No consuma los productos que fabrican esta panificadora
68
Solución: a) P (consuma al menos pan de caja o pan negro)
b)
A8 = 900 – (743 + 32) A8 = 125 P = 0.1389 P = 13.89%
69
EJEMPLO 52
Ejercicio 8.
Sea P(A) = X, P(B) = Y, P(A∩B) = Z. Hallar: a) P(AC∩BC) b) P(AC⋃B)
Solución: U={1,2,3,4} A={1,2}, B={2,3} Para obtener el área de A
Para área B
A=A1+A2 X=A1+Z
B=B2+B3 Y=Z+B3
Despejando A1
Despejando B3 B3=Y-Z
X-Z=A1 Otra forma de encontrar el A4 Para obtener A4 U=A1+A2+A3+A4 Sustituyendo 1=(X-Z)+(Z)+(Y-Z)+A4 1=X+Y+Z+A4
A⋃B=A+B-A∩B A⋃B=X+Y-Z U= A⋃B+A4 1=X+Y-Z+A4 1-X-Y+Z=A4
Despejando A4 1-X-Y+Z=A4
70
TECNICAS DE CONTEO Se clasifican en permutaciones y combinaciones. Permutaciones: Es el número arreglos en donde importa el orden de cada uno de los elementos. Combinaciones: Es el número de arreglos donde no importa el orden, generalmente de un grupo “n” se extrae otro grupo “x”. n! = n factorial Ejemplo: 5!=5*4*3*2*1
Dónde: n=el tamaño total del grupo o muestra donde se puede elegir. x=el número de elementos que se puede obtener de n. Hay dos tipos de permutaciones 1. Con reemplazo. 2. Sin reemplazo. EJEMPLO 53
Ejercicio 1:
¿De cuántas maneras se puede seleccionar 2 personas de un grupo de 6 y cuales son? Solución: 6! 6 6! 6 * 5 * 4 ! 30 = = = = = 15 combinaciones 2 2!(6 2)! 2!4! 2 *1 * 4 ! 2
12 13 14 15 16
23 34 45 56 24 35 46 25 36 26
= 15 combinaciones
71
EJEMPLO 54
Ejercicio 2:
Si no se permiten repeticiones: a) b) c) d) e)
¿Cuántos números de 3 dígitos se pueden formar con los 6 dígitos 2, 3, 5, 6,7 y 9? ¿Cuántos de estos son menores que 400? ¿Cuántos son pares? ¿Cuántos son impares? ¿Cuántos son múltiplos de 5?
Solución: a)
6
5
4
=120
b)
2
5
4
=40
c)
5
4
2
=40
d)
5
4
4
=80
e)
5
4
1
=20
EJEMPLO 55
Ejercicio 3:
¿De cuantas maneras puede escogerse un comité compuesto de 3 hombres y 2 mujeres de un grupo de 7 hombres y 5 mujeres?
=(35)(10)=350 EJEMPLO 56
Ejercicio 4:
a) De cuantas maneras 3 niños y 2 niñas pueden sentarse en una fila. b) De cuantas maneras pueden sentarse si los niños se sientan juntos y las niñas también. c) De cuantas maneras pueden sentarse en fila si justamente las niñas se sientan juntas. Solución: a)
5
4
3
2
1
=5!=120 formas
72
b) 3
2
1
2
1
2
1 3 2 1 2* 2!* 2! =
=12 + =12 24 formas
c) 2
1
3
2
1
=12 +
3
2
1
2
1
=12 +
3
2
2
1
1
3
2
1
2
1
=12 + =12 48 formas
Otra forma de contestar el inciso “c” es usando el “método del salto de la rana” que es el siguiente.
EJEMPLO 57
Ejercicio 5:
a) De cuantas maneras 5 niños y 4 niñas pueden sentarse en una fila. b) De cuantas maneras pueden sentarse si los niños se sientan juntos y las niñas también. c) De cuantas maneras pueden sentarse en fila si justamente las niñas se sientan juntas. d) De cuantas maneras puede quedar alternados.
73
Solución: a) 9! = 362880 b) 5
4
3
2
1
4
3
2
1
=2880 +
4
3
2
1
5
4 3 2 1 2* 5!* 4! =
=2880 5760 formas
c)
6*5!*4!=17280 formas.
d) 544332211 5!*4! = 2880 formas EJEMPLO 58
Ejercicio 6:
¿De cuántas maneras se puede seleccionar 2 personas de un grupo de 7 y cuales son los diferentes arreglos? Solución:
7! 7 7! 7 * 6 * 5! 42 = = = = = 21 combinaciones 2 2!(7 2)! 2!5! 2 *1* 5! 21 12 23 34 45 56 67
13 24 35 46 57
14 15 16 17 25 26 27 36 37 47
= 21 combinaciones
74
EJEMPLO 59
Ejercicio 7:
De cuantas maneras se puede acomodar una reunión de 7 personas. a) En una fila de 7 sillas. b) Alrededor de una mesa redonda. Solución: a) 7
6
5
4
3
2
1
=7!=5040
b) (n-1)! (7-1)! = 6! 6! = 720
Nota: En una mesa redonda se toma como inicio y fin una de las casillas o lugares. EJEMPLO 60
Ejercicio 8:
Cuantos arreglos distintos se pueden hacer tomando todas las letras de la palabra: Dado
Solución:
n! r1! r 2! r 3!
=
4! 4 * 3 * 2 ! = =12 2 ! 2!
Y con la palabra probabilidad Probabilidad = 12 Repeticiones: b x 2, i x 2, a x 2, d x 2.
75
EJEMPLO 61
Ejercicio 9:
Cuantos arreglos distintos pueden formarse con todas las letras de cada una de las palabras. a) Tema b) Campana c) Estadística a) 4
3
2
1
=24
b)
7! 5040 = =840 6 3! c)
12! =9979200 3!2!2!2! EJEMPLO 62
Ejercicio 10:
Una delegación de 4 estudiantes se selecciona todos los años para asistir a la asamblea anual de la asociación de estudiantes, a) De cuantas maneras puede escogerse la delegación si hay 12 estudiantes elegibles. b) De cuantas maneras si 2 de los estudiantes elegibles no asisten al mismo tiempo. c) De cuantas maneras si 2 de los estudiantes elegibles son casados y solo asistirán si van juntos. d) Si el grupo esta formado por 5 mujeres y 7 hombres de cuantas maneras se puede escoger la delegación que este formado en por lo menos una mujer. Solución: a) 12! 12 * 11 * 10 * 9 * 8! = =495 4 * 3 * 2 * 1(8!) 4! (8! )
76
b) 10 * 9 * 8 * 7 ! 2 10 = 2 =2*120 =240 3 * 2 *1(7 !) 1 3 + 10 10! 10 * 9 * 8 * 7 * 6 ! = =210 4 4!(6!) 4 * 3 * 2 *1(6 !) 450 c)
10! 10 * 9 * 8! 90 2 10 1 = = 2 2!(8!) 2 *1(8!) 2 2
=45 +
10 10! 10 * 9 * 8 * 7 * 6 ! 5040 = = 210 4 4!(6!) 4 * 3 * 2 *1(6 !)
= 210 255
d) La condición se cumple si: 1m ó 2m ó 3m ó 4m Las delegaciones pueden formarse entonces de las siguientes maneras. 1m y 3h ó 2m y 2h ó 3m y 1h ó 4m
77
PROBABILIDAD CONDICIONAL A la probabilidad de que un evento “B” se de cuando algún otro evento “A” sea presentado se llama “Probabilidad condicional” y se escribe P(B/A), se lee: “La probabilidad de que B ocurra dado que ocurrió A”. La probabilidad de “B” dado “A” EJEMPLO 63
Ejercicio 1:
Se lanza un dado, si el resultado es par, ¿Cual es la probabilidad de que caiga el numero 4? S= {1,2,3,4,5,6}
A={2,4,6} P(4/par)= 1 / 3
EJEMPLO 64
Ejercicio 2:
Suponga que todos los individuos que compran determinada cámara digital, 60% incluyen una tarjeta de memoria opcional en su compra, 40% incluye una batería. Considere elegir al azar un comprador. Dado que el individuo compro una batería extra determinar la probabilidad que también sea comprada una tarjeta opcional y 30% una tarjeta y una batería. Solución:
P(Tarjeta ) 0.6 P( Bateria ) 0.4 P(T B) 0.3 P(T B) 0.3 P(T \ B) 0.75 75% P( B) 0.4
EJEMPLO 64 Ejercicio 3: Una revista publica 3 columnas tituladas “Art. ” (A),”Books”(B) Y “Cinema”(C). Los hábitos de lectura de los lectores son probables de leer con regularidad. A 0.14
B 0.23
C 0.37
A∩B 0.08
A∩C 0.04
B∩C 0.03
A∩B∩C 0.05
Hallar a) P( A \ B) b) P( A \ B C ) c) P( A B \ C )
78
Solución: a) P( A \ B)
P(TA B) 0.08 0.3478 34.78% P( B) 0.23
b)
B = 0.23=A2+A3+A5+A6 0.23=0.03+A3+0.05+0.08 0.23=0.16+A3 A3=0.23-0.16=0.07 C =0.37=A4+A5+A6+A7 0.37=0.04+0.05+0.08+A7 0.37=0.17+A7 A7=0.37-0.17=0.2 P( A \ B C )
0.12 0.2553 25.53% 0.47
c) P( A B \ C ) P
( A B) C 0.04 0.05 0.08 0.17 0.4594 45.94% P(C ) 0.37 0.37
79
EVENTOS INDEPENDIENTES Dos eventos A y B son independientes si y solo si la probabilidad P( A B) P( A) P( B) De otra forma son dependientes. EJEMPLO 65 Ejercicio 1: Un sistema eléctrico consiste en cuatro componentes que funciona independientemente uno de otro como se indica en la figura, donde se indica la probabilidad de que cada componente funcione. Encuentre: a) El sistema completo funcione: b) El componente C no funcione dado que el sistema completo funcione:
Solución: P ( I U II ) = P ( I ) + P ( II ) – P ( I ∩ II ) P (funcione) = 0.9 [0.8 (0.7) + 0.85 - 0.8 (0.7) (0.85)] a) P (funcione) = 0.8406 *ABCD = (0.9) (0.8) (0.7) (0.85) = 0.4284 * ABCD = (0.9) (0.8) (0.7) (0.15) = 0.0756 *ABCD = (0.9) (0.8) (0.3) (0.85) = 0.1836 ABCD * ABCD = (0.9) (0.2) (0.7) (0.85) = 0.1071 ABCD *ABCD = (0.9) (0.2) (0.3) (0.85) = 0.0459 ABCD -----------0.8406 P (no funcione) = 0.1863 + 0.0459 = 0.2295 b) P (3/ Sist. funcione) =
0.27 = 0.3211 0.8406
80
TEOREMA DE BAYES Si los eventos B1, B2,…, Bk constituyen una partición del espacio muestral S, donde P(Bi) 0 para i=1, 2,…, k , entonces, para cualquier evento A en S tal que P(A) 0 , dado que: P( Br / A)
p( Br A) K
P( B i 1
i
A)
P ( Br ) P ( A / Br ) k
P( B ) P( A / B ) i
i 1
i
Para r= 1, 2, 3,…, k. EJEMPLO 66
Ejercicio 1:
Se ha nominado a 3 personas de un club privado nacional para ocupar la presidencia del mismo. La probabilidad de que se elija al Sr. Adams es de 0.3,la que se haga lo propio con el Sra. Brown de 0.5 y la que gane el Sra. Copper es 0.2 En caso de que se elija al Sr. Adams la probabilidad de que la cuota de ingreso se incremente es 0.8; si se elije a la Sra. Brown o a la Sra. Cooper las correspondientes probabilidades de que se incremente la cuota es 0.1 y 0.4 respectivamente. a) Cual es la probabilidad de que halla un incremento en la cuota de membresía. b) Si alguien considera entrar al club pero retrasa su decisión por varias semanas solo para encontrarse de que las cuotas de entrada aun aumentado. Cual es la probabilidad de que se halla elegido a la Sra. Cooper como presidenta? Solución: a)
I= Incremente N= No incremente
P(I) = P(A y I) ó P(B y I) ó P(C y I) P(I) = (0.3)(0.8) + (0.5)(0.1) + (0.2)(0.4) = 0.24 + 0.05 + 0.08=0.37= 37%
81
b) P (C/I)=
P(CyI ) 0.2(0.4) 0.08 0.2162 21.62% P( I ) 0.37 0.37
EJEMPLO 67
Ejercicio 2:
La Policía planea hacer cumplir los límites de velocidad, usando un sistema de radar, en 4 diferentes puntos de la ciudad. Las de radar en cada uno de los sitios es de: L1, L2, L3 y L4. Operan: 40%, 30%, 20% y 30%, del tiempo. Y si una persona viaja a gran velocidad cuando va a su trabajo, tiene la probabilidad de 0. 2, 0. 1, 0. 5 y 0.2, respectivamente de pasar por esos lugares. a) ¿Cuál es la probabilidad de que no reciba una multa por conducir en exceso de velocidad? b) Si la persona es multada por conducir en exceso de velocidad hacia su trabajo. ¿Cuál es la probabilidad de que pase en el radar de L2?
m= Multa n*= No multa
P(+) = P(A y +) ó P(B y +) ó P(C y +)
a) P(m) = P(L1 y m) ó P(L2 y m) ó P(L3 y m) ó P(L4 y m) P(m) =(0.2)(0.4) + (0.1)(0.3) + (0.5)(0.2) + (0.2)(0.3) =0.08 + 0.03 + 0.1 + 0.06 = 0.27 = 27% b) P( L2 \ n)
0.01(0.7) 0.07 0.959 95.9% 1 0.27 0.73
82
UNIDAD 3 VARIABLE ALEATORIA DISCRETA Un variable aleatoria discreta “x” se dice que es discreta si se puede tomar un numero finito o infinito contable de valor; Como puede ser el número de personas que entran diariamente a la cafetería. FORMULAS PRINCIPALES Media ⇒ Desviación estándar ⇒ Coeficiente de variación ⇒ Coeficiente de simetría ⇒ R- esimo momento ⇒
Coeficiente de kurtosis ⇒
A continuación se hará un ejercicio como ejemplo de V.A.D. (variable aleatoria discreta) para ejemplificar el tema; utilizando la teoría aprendida en las unidades anteriores.
EJEMPLO 68 Se lanza una moneda 4 veces y se define “x” como el número de caras, determinar: a) b) c) d) e)
Determinar la distribución de probabilidad para x. Determinar la distribución de probabilidad acumulada. Determinar gráficamente las distribuciones de A y B. Calcular el valor esperado de x. Calcular la desviación estándar, coeficiente de variación.
83
S= (2) (2) (2) (2)= 16 CCCC CCCX CCXC CCXX CXCC CXCx CXXC CXXX
4 3 3 2 3 2 2 1
SCCC SCCX SCXC SCXX SXCC SXCX SXXC SXXX
3 2 2 1 2 1 1 0
a), b) x 0 1 2 3 4
P(x) "1/16"=0.0625 "4/16"=0.25 "6/16"=0.375 "4/16"=0.25 "1/16"=0.0625 1
P. Ac (x) 0.0625 0.3125 0.6875 0.9375 1
x P(x) 0 0.25 0.75 0.75 0.25 2
c)
Grafica de Barras o Histograma para variables aleatorias discretas 0.4 0.35 0.3 0.25 0.2 0.15 0.1 0.05 0 0
1
("2")
3
4
84
d) E(x) = valor esperado de x E(x) = M= 2 M = ∑ fx/ N N= tamaño de la población M = ∑x p(x) e) ℓ = Desviación Estándar de la Población ℓ = √∑fx – M2/N ℓ2= ∑(x-M)2 P(x) ℓ2 = ∑(x2-2xM∑xP(x) + M2(∑P(x) ) ℓ2 = E(x2) – 2M2 + M2 ℓ =E(x2) – M2 E(x) = Valor esperado ℓ= √∑x2 p(x) –M2 ℓ=√ (5-22) = √1 = 1 c. v= ℓ/M = coeficiente de variación = ½ = 0.5 α3= m3/ m23/2 m3=∑ (x-M)3 /N m3=∑(x3-3xM + 3xM2 –M3) P(x) = ∑(x3p(x) -3M∑x2p(x) + 3M∑xp(x) – M ∑p(x)
85
Formula
M3= E(x3)- 3ME(x2) + 2M3 m3= 14 -3(2) (5) + 2(2)3 =14 – 30 + 16 =0 α3= 0/ 13/2=0 Distribución Simétrica α4= Coeficiente de Kurtosis α4=m4/ m22 m4= ∑ fx –M4 / N m4= ∑(x- M)4 p(x) m4= ∑ (x4 – 4x3M + 6x2M2- 4xM3+ M4) p(x) m4= ∑ x4 p(x) – 4M ∑ x3 p(x) + 6M2∑x2 p(x) -4M3∑xp(x) + M4 (∑p(x)) m4= E(x4) – 4ME(x3) + 6M2 E(x2) – 3M4 M4= 42.5 – 4(2)(14) + 6(22)(5) -3(24)=2.5 α4= 2.5/ 1= 2.5 Distribución Platocurtica
EJEMPLO 69 Se lanzan dos dados y se define “x” como la suma de las 2 caras. S= 6*6=36 Combinaciones:
11 21 31 41 51 61
12 22 32 42 52 62
13 23 33 43 53 63
14 24 34 44 54 64
15 25 35 45 55 65
16 26 36 46 56 66
86
Distribución de probabilidad. x 2 3 4 5 6 7 8 9 10 11 12
P(x) "1/36" "2/36" "3/36" "4/36" "5/36" "6/36" "5/36" "4/36" "3/36" "2/36" "1/36"
P. Ac (x) "1/36" "3/36" "6/36" "10/36" "15/36" "21/36" "26/36" "30/36" "33/36" "35/36" 1
x P(x) "2/36 "6/36" "12/36" "20/36" "36/36" "42/36" "40/36" "38/36" "30/36 "22/36" "12/36" 252/36
x´2 p(x) "4/36 "18/36" "48/36" "100/36" "180/36" "294/36" "320/36" "324/36" "342/36" "242/36" "144/36" 1974/36"
Graficas α3 = 0 0.2 0.15 0.1
Serie 1
0.05 0 2
3
4
5
6
7
8
9
10
11
12
87
Valor Esperado E(x) = M= ∑ x p(x) M= 252/36 = 7 ℓ= √ (∑ x2 p(x) –M2) ℓ= √ (54.8335 - 72) =√ ( 5.8335) = 2.4152 C V = ℓ / M CV= 2.4152/7 = 0.3450
EJEMPLO 70
En un problema de una prueba aplicada a niños pequeños se les pide que hagan corresponder cada 1 de los 3 dibujos de animales con la palabra que identifica a ese animal, si un niño asigna aleatoriamente las 3 palabras a los 3 dibujos , encuentre la distribución de probabilidad para x , el número correspondencias correctas , calcule media , mediana y moda.
S = 3*2*1=6
AVP APV VAP VPA PAV PVA
X 3 1 1 0 0 1
88
X 0 1 2
P(X) "2/6" "3"/6" "1/6" 1
X P(X) 0 "3/6" "3/6" 1
P.Ac (X) "2/6 = .3333 "5/6 = .8333" 1
Media= 1 M0= Moda Poblacional M0= 1 Md= Mediana 0
– 0.3333
Md – 0.5 1
Md – 0 / 1 – 0 = 0.5 – 0.3333 / 0.8333 – 0.3333 = 0.3334=Md
-- 0.8333
EJEMPLO 71 Por saturación de vuelos algunas líneas aéreas venden más pasaje que los disponibles en un vuelo. Una compañía ha vendido 205 boletos que corresponden a un avión de 200 asientos. Sea “x” la variable aleatoria que representa en número de pasajeros que tramita su pase de abordar en el aeropuerto. La distribución de probabilidad está dada por x. Calcular media, mediana, moda. Tabla de distribución de probabilidad.
x 198 199 200 201 202 203 204 205
P(x) 0.05 0.09 0.15 0.2 0.23 0.17 0.09 0.02 1
x P(x) 9.9 17.91 30 40.2 46.46 34.51 18.36 4.1 201.44
0.05 0.14 0.29 0.49 0.72 0.89 0.98 1
89
201 – 0.40 Md – 0.50 202 – 0.72 Md – 201 / 1 =0.6435 Md = 0.6435 + 201
M (media)= 201.44 M0= 202= (Moda)
Md (mediana)= 201.0435
P. Ac(x) 0.05 0.14 0.29 0.49 0.72 0.89 0.98 1
90
EJEMPLO 72 Determine el valor de “c” de tal forma que cada una de las siguientes funciones sirva como distribución de la variable aleatoria discreta x: a) d(x) = (2 c x ) * (3 c 3-x ) para x= 0 , 1, 2 £∑x=0 = f(x) = 1 = c (02 + 4) + c (12 + 4) + c(32 + 4) = 4c +5c + 8c +13c = 30c 1= 30c c= 1/30 =0.0333 b) ∑x=02 f(x) =1 1= (2 c 0) * ( 3 c 3-0)+ (2 c 1) * (3 c 3-1) + (2 c 2) * ( 3 c 3-2) 1= c( 1)(1) + c( 2) (3) + c(1)(3) 1= c +6c + 3c 1= 10c C= 1/10=0.1 EJEMPLO 73 Considere que un sistema de agua que fluye a través de válvulas de “A” a “B” .Las válvulas 1, 2 y 3 funcionan independientemente cada 1 y se abre correctamente mediante una señal con probabilidad de 0.8. Encuentre la distribución de probabilidad para “x”, el número de días abiertos de “A” a “B” después de haber enviado la señal, construya la ojiva. A) Encuentre la distribución de probabilidad para X, el número de vías abiertas de A a B después de haber enviado la señal. B) Construya histograma y ojiva C) Calcular coeficiente de variación, coeficiente de simetría y curtosis.
X= # de vías abiertas de A a B X= 0, 1, 2.
91
X 0 1 2 Suma =
P(x) 0.072 0.416 0.512 1
S= (2)(2)(2)= (2)3= 8 123 123 123 123 123 123 123 123
P (acumulada) 0.072 0.488 1
X 2 1 1 1 1 0 0 0
P (abierta)= 0.8 P (cerrada)= 0.2 P (0)= (0.8)(0.2)2 + (0.8)(0.2)2 + (0.2)3 = 0.072 P (1)= (0.8)2(0.2)(0.3) + (0.8)(0.2)2 = 0.416 P (2)= (0.8)3= 0.512 P1Ac(x) = probabilidad acumulada de x
92
C.V = M/ σ M= media de la población σ= desviación estándar de la población M= Ef(x)/ N = Exp(x) N= tamaño de la población xP(x) 0 0.416 1.024 Suma= 1.44 Exp(x) = 1.44 σ= sqrt(Ef(x-M)2 / N) (σ)2 = E(x)2p(x) – M2 X2 P(x) 0 0.416 2.048 Suma= 2.464 (σ)2 =2.464 – (1.44)2 = 0.3904 C.V= 0.6248 / 1.44 = 0.4339 ἀ3 = m3 / m23/2 m3= E(X-M)3 P(x) X3 P(x) 0 0.416 4.096 Suma= 4.512
(σ)2 = E(x-M)2 p(x)
σ=0.6248
m2= σ2= 0.3904
M3=4.512 – 3(1.44)(2.464) + 2(1.44)3 = -0.1605 ἀ3 = -0.1605 / (0.3904)1.5 = -0.6586 distribución asimétrica con sesgo negativo m4 = E(x-M)4 p(x) ἀ4 = m4 / m22 m4= 8.608 – 4(1.44)(4.512) + (1.44)2 (2.464) – 3(1.44)4 = 0.3755 X4 P(x) 0 0.416 8.192 Suma= 8.608
93
TEOREMA DE CHEBISHEV. La desviación estándar de una variable aleatoria “X” mide la dispercion de los valores de “x” alrededor de la media µ de “x”. En consecuencia, para valores mas bajos de se esperaría que “x” estuviera mas cerca de su media µ. Esta esperanza intuitiva se hace mas precisa mediante la desigualdad siguiente: Desigualdad de Chebishev Sea “x” una variable aleatoria de con media µ y desviación estándar . Entonces para cualquier número positivo k, la probabilidad de que un valor de “x” se encuentre en el intervalo es al menos 1-1/k2. Es decir,
Un ejemplo de este importante teorema está dado por el problema siguiente. EJEMPLO 74 Suponga que “x” es una variable aleatoria con media µ= 100 y desviación estándar a) Encuentre la conclusión que se pueda derivar de la desigualdad de Chebishev para k=2
Por tanto se puede concluir que la probabilidad de “X” se encuentra entre 90 y 110 y es por lo menos ¾. MODELOS COMUNES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS.
ESTAS SON: 1.- Distribución de Bernoulli 2.- Distribución Binomial 3.- Distribución Geométrica 4.- Distribución Binomial negativa o Pascal
94
5.- Distribución Hipergeométrica 6.- Distribución de Poisson 1.- DISTRIBUCIÓN DE BERNOULLI Consiste en una sola prueba en la cual se tiene éxito o fracaso, el valor de “x” toma valor de “0” cuando fracasa y valor de “1” cuando es éxito. Como se trata de un experimento aleatorio se tiene que la probabilidad de éxito se representa con la letra “p”, mientras que Q=1-P representa la probabilidad de que no ocurra el suceso, es decir probabilidad de fracaso.
Características: 1.- Se tiene éxito o fracaso. 2.- La probabilidad de éxito “p” permanece constante y la probabilidad de fracaso es q= 1-p. 3.- Se realiza una única vez el experimento. 4.- La variable x es el número de éxitos que se tiene al realizar el experimento y toma valores de 0 y 1. EJEMPLO 75 Se lanza un dado y se considera éxito que caiga el número 2.
a) Determinar la distribución de probabilidades b) Calcular la media y la varianza
a)
x
P(x) xP(x) x2P(x)
0
5/6 0
0
1
1/6 1/6
1/6
1
1/6
1/6
b) ⇒
⇒
∑
95
EJEMPLO 76 Se selecciona al azar un artículo y se define “x” como el número de artículos no defectuosos seleccionados. Si la probabilidad de seleccionar un artículo defectuoso es del 2% encontrar: a) Distribución de la probabilidad b) Calcular la media y la desviación estándar a)
x P(x) 0 0.02 1 0.98 b)
⇒ 2.- DISTRIBUCION BINOMIAL Un experimento binomial es aquel que tiene las siguientes características: 1.- El experimento consta de “n” pruebas idénticas. 2.- Cada prueba tiene 2 resultados posibles. Éxito (E) o fracaso (F). 3.- La probabilidad de éxito, en una sola prueba es igual a “p” y permanece constante en cada evento. La probabilidad de fracaso también no varía de una prueba a otra y la representamos con “q”:
4.- Las pruebas son independientes. 5.- La variable aleatoria bajo estudio es “x”, el número de éxitos observados en la “n” pruebas.
FORMULAS: Valor esperado = E(x) = np ⇒ ⇒
96
EJEMPLO 77 La probabilidad de que cierta clase de componente pase con éxito una determinado prueba de impacto es de 0.7, si se someten 4 componentes a esta prueba. a) Encuentre la distribución de probabilidad para x, número de componentes que pasan con éxito, la prueba de impacto.
x
EEEE
4
FEEE
3
EEEF
3
FEEF
2
EEFE
3
FEFE
2
EEFF
2
FEFF
1
EFEE
3
FFEE
2
EFEF
2
FFEF
1
EFFE
2
FFFE
1
EFFF
1
FFFF
0
P(x)
0 0.0081
0
0
1 0.0756 0.0756 0.0756 2 0.2646 0.5292 1.0584 3 0.416 1.2348 3.744 4 0.241 1
0.964
3.856
2.8
8.734
97
b) Calcule la media y la varianza.
EJEMPLO 78 La probabilidad de que un porcentaje se recupere de una rara enfermedad de la sangre es 0.4, si se sabe que 15 personas han contraído esta enfermedad. Cuál es la probabilidad de que: a) Al menos 10 personas sobrevivan
b) Sobrevivan entre 3 y 8 personas
98
c) Sobrevivan al menos 5 personas exactamente
d) Determinar el valor esperado que pueden recuperarse de la enfermedad =15*.04=6 e) Calcular la desviación estándar
EJEMPLO 79 Un ingeniero de seguridad afirma que un décimo de los accidentes automovilísticos se debe a la fatiga del conductor, calcule la probabilidad de que por lo menos 3 de los 15 accidentes se deba a la fatiga del conductor. b) Calcular la media o número esperado de accidentes de los 15 que se deba a la fatiga del conductor y la desviación estándar.
a) p(cuando menos de 3 de 15)
q=0.9 n=10
b) =15*.01=1.5
99
3.- DISTRIBUCIÓN GEOMÉTRICA Si repetidos intentos independientes pueden resultar en un éxito con una probabilidad “p” y en un fracaso con una probabilidad “q=1-p”, entonces “x”, es el número de intentos en el cual ocurre el primer éxito: x= # del intento en el cual ocurre el primer éxito. X 1
E
p
2
FE
qp
3
FFE
qp
4
FFFE
qp
2 3
⇒ .
⇒ .
⇒ . n
FFF...FE
n-1
q p
EJEMPLO 80 La probabilidad de que un estudiante apruebe el examen escrito para obtener su licencia de piloto privado es de 0.7. Encuentre la probabilidad de que una persona apruebe el examen.
a) En el tercer intento b) Antes del cuarto intento c) Después del tercer intento d) Determinar el número esperado de eventos que tiene que hacer para obtener su licencia de piloto privado e) Determinar la desviación estándar
a) p= 0.7
100
q= 0.3 P (3) = (0.3)2 * (0.7) = 0.063
b)
P(x3)= 1- 0.973= 0.027
d)
µ= 1/0.7= 1.4286 e)
EJEMPLO 81 Un examen de opción múltiple consta de 8 preguntas y 3 respuestas a cada pregunta. Un ingeniero en seguridad de automóviles afirma que uno de los accidentes se debe a la fatiga del conductor, determinar: a) La probabilidad de que el quinto accidente se debe a la fatiga del conductor b) Calcular la probabilidad de que el primer accidente que se deba a la falla del conductor, sea encontrado después del 4to accidente a) P (x=5)
101
P (5) = 0.94*(0.1) P (5) = 0.06561 b) P(x>4) = 0.94= 0.6561 4.- DISTRIBUCION DE PASCAL
CARACTERISTICAS: 1.- El experimento consiste en una serie de ensayos Bernoulli independientes y cada uno de los ensayo con una probabilidad “p” de éxito y “q” de fracaso. 2.- Los ensayos se observan hasta obtener exactamente r-éxitos 3.- La variable aleatoria “x” es el número de ensayos necesarios para lograr r-éxitos.
⇒
⇒
⇒
EJEMPLO 82 Se sabe que el 10% de los empleados de una industria padecen de una enfermedad degenerativa. Para el estudio de la enfermedad se requiere de 3 paciente que tengan la enfermedad por lo que se analiza al azar a los empleados, hasta tener a los 3 pacientes que den positivo en el análisis. Encontrar la probabilidad de que:
a) Se tenga que analizar exactamente 5 empleados para tener a los 3 con la enfermedad p=0.1 q=0.9
b) Se tenga que hacer más de 7 análisis.
102
c) Se tengan que hacer tres análisis exactamente.
d) Calcular la media e interpretar su resultado
Se requiere analizar 30 empleados para encontrar a los empleados que tengan la enfermedad e) Calcular la desviación estándar.
EJEMPLO 83 Las fibras de algodón usadas en los propulsores de cohetes son sometidos a un de nitración el cual permite que las fibras de algodón entren en solución. Este proceso tiene efectividad de 90%. En cuanto a que el material producido pueda conformarse según se requiera en una etapa anterior del proceso con probabilidad de 0.9 ¿Cuál es la probabilidad de que se produzca exactamente 20 lotes para obtener el tercer lote defectuoso?
q=0.9 p=0.1
103
5.- DISTRIBUCIÓN HIPERGEOMÉTRICA Propiedades 1.-El experimento consiste en extraer una muestra aleatoria de tamaño “n” sin reemplazo de un conjunto de “N” objetos. 2.- De los “N” objetos “k” posee el rasgo de interés mientras que los otros “N-k” objetos restantes no la tienen. 3.- La variable aleatoria “x”; es el número de objetos en la muestra que posee el rasgo de interés. ⇒
⇒
⇒
EJEMPLO 84 Una fundidora embarca bloques de motor en lotes de 20 unidades, ningún proceso de manifactura es perfecto, de modo que los bloques defectuosos son inevitables. Sin embargo, es necesario destruirlos para identificar el defecto. Así pues, sería imposible someter a prueba cada bloque, se selecciona y prueba 3 unidades, antes de aceptar un lote. Suponga que un lote dado, en realidad incluye 5 unidades defectuosas. Sea x el número de unidades defectuosas muestreadas. a) Encuentre la distribución de probabilidad b) Calcule la media y la varianza 20 unidades= N Selecciona 3 unidades= n 5 defectuosas x= # unidades defectuosas
104
DISTRIBUCION DE PROBABILIDAD
x
P(x)
0
0.3991
1
0.4605
2
0.1316
3
0.0087
b)
EJEMPLO 85 Como parte de un estudio de la contaminación del aire, un inspector decide examinar la emisión de gases de 6 de los 24 camiones de carga de una compañía. Si 4 de los camiones de la compañía emite cantidades excesiva de contaminantes. a) Cual es la probabilidad de que ninguno de ellos sea incluido en la muestra del inspector
b) Cual es la probabilidad de que cuando mucho 2 sean incluido en la muestra del inspector
105
c) Por lo menos uno sea incluido en la muestra del inspector
6.- DISTRIBUCIÓN DE POISSON
CARACTERISTICAS 1- “X” se define como el número de resultados que ocurren en un intervalo con región específicamente es independiente del número que ocurre en cualquier otro intervalo o región. 2.- La probabilidad de que ocurra un solo resultado durante un intervalo muy corto o una región pequeña es proporcional a la longitud o al tamaño de la región.
Promedio ⇒
⇒ EJEMPLO 86 En promedio en cierto crucero ocurren 3 accidentes de tráfico por mes, cual es la probabilidad de que en este crucero... a) Sucedan 5 accidentes durante un mes
b) Ocurren menos de 3 accidentes en un mes
106
c) Al menos 2 accidentes en un período de 3 meses
EJEMPLO 87 Si la probabilidad es de 0.005 de que una persona cualquiera que asiste en un desfile en un día muy caluroso de verano sufra insolación. ¿Cuál es la probabilidad de que 18 de las 3000 personas que asisten al desfile sufran insolación? a) Binomial P(x) = px qn-x P(18) =
exacto
b) Poisson aproximado (error de 10 000 ésima) EJEMPLO 88 Según registros, la probabilidad de que un auto falle mientras pasa por cierto túnel es de 0.0094. Obtener la probabilidad de que entre 2000 autor que pasan por el túnel cuando mucho uno falle.
107
EJEMPLOS COMPLEMENTARIOS DE LA UNIDAD 3
EJEMPLO 89 Si la probabilidad es de 0.005 de que una persona cualquiera que asiste en un desfile en un día muy caluroso de verano sufra insolación, cual es la probabilidad de que 18, de las 3000 personas que asisten al desfile sufra insolación. Distribución binomial p=0.005 18 de las 3000... k=18 Valor exacto Se puede utilizar la distribución de poisson
EJEMPLO 90 En una prueba de tortura se enciende y apaga un interruptor eléctrico hasta que este falla. Si la probabilidad es de 0.001 de que el interruptor falle en cualquier momento de que esté encendido o apagado, cual es la probabilidad de que el interruptor no falle durante las primeras 800 veces que se enciende o apague.
Distribución geométrica
108
x= 801 q=0.001 p=0999
P(x)= qx-1p= 0.001800*0.999= 0
EJEMPLO 91 Según registros, la probabilidad de que un automóvil falle mientras pasa por cierto túnel es de 0.0094. a) Obtener la probabilidad de que entre 2000 automóviles que pasan por el túnel cuando mucho 1 falle.
EJEMPLO 92 Un agente de seguros vende pólizas a 5 personas de la misma edad y que disfrutan de buena salud, según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es (2/3). Calcular la probabilidad de que transcurriendo 30 años, vivan: a) Las 5 personas. b) Al menos 3 personas. c) Exactamente 2 personas. a) P=2/3 n=5 personas q=1/3 x=5
b) P(x ≥3)= P(3)+P(4)+P(5)=1- [P(0)+P(1)+P(2)] P(3)= (2/3)3+(1/5)2=0.3292+0.3292+0.1317
109
P(3)= (101)(8/27)(1/9)=0.7901 P(3)=0.3292 P(4)= (2/3)4 (1/3)1 P(4)= 5(16/81) (1/3) P(4)=0.3292 c) P(2)= (2/3)2+(1/3)3 = (10)(4/9) (1/27) = 0.1646
EJEMPLO 93 En un cierto proceso de manufactura se sabe que 4 de cada 100 piezas están defectuosa. a) ¿Cuál es la probabilidad de que la 5 pieza inspeccionada sea la primera defectuosa. b) ¿Cuántas piezas se piensa probar para encontrar la primera defectuosa? c) ¿Cuál es el valor de la varianza? p=(0.04) q=0.96 a) P(5)=(0.96)4(0.04) =0.0340
b) μ = c)
=25
EJEMPLO 94 De un lote de 10 proyectiles, 4 se seleccionaron al azar y se dispararon. Si el lote contiene 3 proyectiles defectuosos que no explotaron. ¿Cuál es la probabilidad de: a) Los 4 exploten. b) Al menos 2 no exploten. N=10 N=4 3 no explotan 7 explotan e n
a)
=
b)
=0.1667 P(2)+P(3)+P(4)
P(2)=
=
=0.3
110
=
=
0.0333
N=24 n=6 K=4 a) =
=0.1379
b) P(0)+P(1)+P(2) =
=
=
=
0.3819 0.3410
EJEMPLO 95 Suponga que la probabilidad de que una persona determinada crea una historia acerca de los atentados a una famosa actriz es de 0.8 ¿Cuál es la probabilidad de: ? a) La sexta persona escucha tal historia, sea la cuarta que la crea. b) La tercer persona que escucha tal historia sea la primera en creerla. c) Calcular la media o el número de personas a los que se les tiene que contar la historia para encontrar a la cuarta que lo crea y encontrar la varianza. p= 0-8 q= 0.2 P(x,r)= pr qx-r
a) b) c) 2
=
=
=
=
= 1.25
EJEMPLO 96 A un niño se le hace que pegue 3 letreros en 3 figuras de animales y se define x como el número de correspondencias correctas. A) Distribución de probabilidad
111
Animales: pato, elefante, mariposa
PEM PME EPM EMP MPE MEP
X 3 1 1 0 0 1
X 0 1 3
P(X) 2/6 3/6 1
EJEMPLO 97 La distribución de probabilidad de x, el número de defectos por cada 10m de una tela sintética en rollos continuas de ancho uniforme, es: x P(x) P1Acf(x) xP(x) 0 0.41 0.41 0 1 0.37 0.78 0.37 2 0.16 0.94 0.32 3 0.05 0.99 0.15 4 0.01 1 0.07 M= 0.88 A) Dibujar histograma y ojiva. B) Calcular media, mediana y moda.
112
b) M=Exp(x) = Ex Ex = valor esperado de x M= 0.88 La mediana se encuentra en el 0.50 o la mitad de la distribucion. 0 – 0.41 Md --- 0.50 1 – 0.78 por lo tanto Md= 0.2432 Mo = 0 TIENE MAYOR PROBABILIDAD EJEMPLO 98 Sea W una variable aleatoria que da el número de caras menos el de cruces en 4 lanzamientos de una moneda. A) Encuentre la distribución de probabilidad B) Calcule media, mediana y moda. W= # caras - # cruces S= 24= 16
113
CCCC CCCX CCXC CCXX CXCC CXCX CXXC CXXX XCCC XCCX XCXC XCXX XXCC XXCX XXXC XXXX
4-0 3-1 3-1 2-2 3-1 2-2 2-2 1-3 3-1 2-2 2-2 1-3 2-2 1-3 1-3 -4
4 2 2 0 2 0 0 -2 2 0 0 -2 0 -2 -2 -4
W -4 -2 0 2 4
P(W) 1/16 4/16 6/16 4/16 1/16
Wp(W) -0.25 -0.5 0 0.5 0.25
M= EwP(w) = 0 -2 ----- 0.3125 Md ---- 0.5 0 ----- 0.6875 (Md + 2) / 2 = (0.5 – 0.3125) / 0.6875 – 0.3125 Md= -1 Mo= 0 VALOR ESPERADO O ESPERANZA MATEMATICA E(x)=
variable aleatoria discreta
E(x)=
variable aleatoria continua
EJEMPLO 99 Se tiene que asignar 2 contratos aleatoriamente a una o más empresas (I, II, III) cualquier empresa puede recibir más de un contrato, si cada contrato produce una ganancia de $90,000 para cada empresa calcule: a) ganancia para la empresa I b) si las empresas I y II pertenecen al mismo propietario ¿Cuál sería la ganancia esperada total del dueño?
114
x 0 90,000 180,000
p(x) 4/9 4/9 1/9 1
y 0 90,000 180,000
X p(x) 0 40,000 20,000 60,000
p(y) 1/9 4/9 4/9 1
y p(y) 0 40,000 80,000 1200,000
EJEMPLO 100 Un tazón contiene 5 fichas que no puede distinguirse una de otra. 3 de las fichas están marcadas con $2 y las restantes con $6. Se sacan del tazón 2 fichas al azar sin remplazo y se paga el valor de la suma indicado en las 2 fichas si el costo por su valor es de $5.60 ¿es justo el juego? S= (5) (4)=20
=10
3 fichas-$2 2 fichas- $6 Por lo tanto si conviene
x -1.6 2.4 6.4
P(x) 3/10 6/10 1/10 1
X p(x) -.48 1.44 0.64 1.6
EJEMPLO 101
115
Un piloto privado desea asegurar su avión por 50,000 dólares, la compañía aseguradora estima una pérdida total que puede ocurrir con una probabilidad total de 0.002 un 50% de pérdida con una probabilidad de 0.01 y 25% de pérdida con una probabilidad de 0.1, ignorando todas las otras perdidas ¿Qué prima debería cobrar la compañía aseguradora para tener una utilidad promedio de 500 dólares? C = prima por pagar Perdida total 50% 25%
0.002
X -50000 + c
P(x) 0.002
-25000 +c -12500 + c c
0.01 0.1 1-0.1-0.010.002=0.888
0.01 0.1 E=cC-
C=500+1600 C=2100
X p(x) 100+0.002c -250+0.01c -1250+0.1c 0.888c
1600 1600=500
E=c-1600
Exámenes 2° EXAMEN PARCIAL UNIDAD 3 PROBABILIDAD Y ESTADISTICA EJEMPLO 102 1.- Cinco pelotas numeradas 1, 2, 3, 4 y 5 se encuentran en una urna. Se sacan 2 pelotas al azar de las cinco y se anotan sus números. Encuentre la distribución de probabilidad para la suma de los dos números seleccionados: 1
2
3
4 5
116
12 13 14 15 23 24 25 34 35 45
X 3
P(x)
4 5 6 7 8 9
EJEMPLO 103 2.- Un vendedor de equipo pesado puede entrevistar a uno o dos clientes diariamente con una probabilidad de 1/3 y 2/3 respectiva mente. Cada entrevista tendrá como resultado una no venta o una venta de $50,000 con probabilidades de 0.9 y 0.1 respectivamente. Obtenga la distribución de probabilidad para las ventas diarias. Encuentre la media y la desviación estándar de las ventas diarias.
0 0.84 0 50000 0.1533 7665 100000 0.0067 670
0 383250000 67000000
117
EJEMPLO 104 3.- Sea x una variable aleatoria con una función de densidad dada por:
F(x)=
o.2
-1