UNIVERSIDAD DEL VALLE ESCUELA DE ESTADÍSTICA ASIGNATURA: FUNDAMENTOS DE ESTADÍSTICA PERIODO: FEBRERO - JUNIO DE 2013 TAL
Views 155 Downloads 5 File size 323KB
UNIVERSIDAD DEL VALLE ESCUELA DE ESTADÍSTICA ASIGNATURA: FUNDAMENTOS DE ESTADÍSTICA PERIODO: FEBRERO - JUNIO DE 2013 TALLER DE REPASO Situación 1: Se desea observar un proceso para producir cierto tipo de metal. Los fabricantes están interesados en describir el comportamiento de la tensión de ruptura de los metales producidos. Para ello toman 60 especímenes del metal producido y se someten a una tensión hasta que se rompen. A continuación se presentan los resultados de las tensiones de ruptura en kilogramos por centímetro cuadrado: 453
464
440
459
476
435
443
453
448
429
473
439
437
451
442
434
436
452
461
421
450
488
472
441
464
452
471
480
447
453
443
435
435
461
444
453
443
463
429
442
424
457
463
449
429
450
436
440
452
464
464
451
435
449
492
455
472
423
458
453
a) Defina la variable de interés, así como su tipo y escala de medición. b) ¿Construya la tabla completa de frecuencias?, c) Interprete los valores n3, f5, N2 y F4, d) Si se considera que los metales deben tener una tensión superior a 455 kilogramos, ¿Qué porcentaje de elementos presentaron una tensión superior a 455 kilogramos? e) Calcule e intérprete los indicadores de tendencia central (Media, Mediana y Moda), f) Calcule e intérprete los indicadores de dispersión (Desviación estándar, Desviación media y Coeficiente de Variación), g) Calcule e intérprete los cuartiles, h) que tipo de asimetría presenta la distribución de los datos, i) Está de acuerdo en que los datos presentan un curva mesocurtica. Situación 2: El estudio de las emisiones de gases provenientes especialmente de la industria y los medios de transporte, es de vital importancia para que las autoridades ambientales competentes tengan conocimiento del comportamiento de estos contaminantes y promuevan la disminución de sus niveles. Para realizar un estudio, se utilizan los registros de la concentración en el aire de Monóxido de Carbono (CO) del año 2004 en la ciudad de Cali, proveniente de la estación fija de la Red de Monitoreo de Calidad del Aire llamada Calle 15. Se dispone de 4690 datos disponible para este contaminante, cada uno correspondiente al valor promedio de monóxido de carbono durante una hora medido en partículas por millón (ppm), los resultados obtenidos se muestran en la siguiente tabla de frecuencias.
Clase 1 2 3 4 5 6 7
Partículas de CO Intervalos de clase 0 1,1
Marca de Clase
ni
Ni
fi
Fi
1510 2,75
0,1812 4036
0,1484
342 6,6 7,7
0,0580
0,9915
a) Defina la variable de interés, así como su tipo y escala de medición. b) Complete la tabla de frecuencias. c) Intérprete: n2, f4, N3 y F5. d) Calcule e interprete la media, mediana y desviación estándar. Según normas ambientales las emisiones de CO no deben exceder en promedio 2 ppm por hora ¿Se cumple la norma en esta estación? e) ¿Qué proporción de mediciones presentaron más de 2 ppm? f) ¿A partir de qué valor se encuentra el 20% de las mediciones más altas de CO? g) Para continuar el estudio en el año 2005, se consideraron 3 estaciones más, las cuales son: ERA, BA y PDD los resultados obtenidos se muestran por medio del siguiente diagrama de cajas y alambres de la concentración de CO por estación.
Concentración de CO (ppm)
10
8
6
4
2
0 PDD
ERA
CALLE 15
BA
Estación
¿Cuáles estaciones presentan las emisiones de CO más altas y más bajas? h) Si la norma establece que no se puede exceder en más de 2 ppm la concentración de CO, para cada estación ¿En qué porcentaje aproximadamente de observaciones se está excediendo la norma? i) ¿Las emisiones de CO presentan un comportamiento simétrico para cada estación?, ¿Cuál estación presenta mayor dispersión en los datos? j) ¿Cuál es el promedio de concentración de CO por hora para toda la ciudad de Cali? Si se tiene la información sobre el promedio de las estaciones de la ciudad: Estación Promedio (ppm) Número de datos
ERA 1,23 8211
BA 0,74 5828
Calle 15 2,61 4975
PDD 0,86 1550
Situación 3: Los siguientes contextos son falsos o verdaderos, argumente su respuesta. a) Para cualquier lista de números, la mitad de ellos estará debajo de la media. b) ¿Es la media de la muestra siempre el valor que ocurre con más frecuencia? c) ¿Es la media de la muestra siempre igual a uno de los valores que está en la muestra? d) ¿La mediana de la muestra siempre es igual a uno de los valores de la muestra? e) Es posible encontrar un tamaño de la muestra para el cual la mediana siempre sea igual a uno de los valores en la muestra. f) En cierta compañía, cada trabajador recibió un aumento de $50.000 por semana. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos? g) En otra compañía, cada trabajador recibió un aumento del 5%. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos? h) El rango intercuartilico es igual al valor mayor menos el valor menor en los datos. i) La cuenta del número de observaciones que pertenecen a cada clase es llamada Frecuencia Absoluta (ni). j) Las frecuencias relativas (fi) indican la proporción del total de observaciones perteneciente a cada clase y se obtienen al dividir la frecuencia absoluta de la clase entre el total de observaciones. k) La frecuencia absoluta acumulada (Ni) se obtiene al sumar las frecuencias absolutas de las clases precedentes hasta esa clase, incluyendo la clase i. l) La frecuencia relativa acumulada (Fi) se calcula al adicionar las frecuencias absolutas de las clases anteriores e incluyendo la clase i. m) En estadística una población es el conjunto de cosas, personas, animales o situaciones que tiene una o varias características o atributos comunes. n) La muestra es una parte, generalmente grande igual al conjunto total de datos y sirve para analizar e inferir las características de una población. o) La media de n observaciones de la variable X se denotará por el símbolo x y se define como la suma de ellas dividida por n. p) La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre con mayor frecuencia. q) La mediana (Me) de un conjunto de n números es el número central que se ubica en el conjunto de números. r) La desviación estándar es el cuadrado de la varianza. s) El Coeficiente de variación (C.V.) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la media entre la desviación estándar del conjunto. t) Los coeficientes de asimetría y apuntamiento son indicadores de dispersión. u) El cuartil dos Q2 siempre coincide con la media. v) La interpretación del tercer cuartil Q3, es que el 30% de los datos son menores o iguales al valor obtenido en ese cuartil. w) La media es un estimador robusto que no se afectado por valores extremos. x) Las variables cuantitativas tienen escalas de medición de intervalo y razón. y) Si todos los valores en los datos son negativos la desviación estándar puede ser negativa. z) Las variables cualitativas se dividen en continuas y discretas y tienen escalas de medición nominal y ordinal.
Situación 4: 1. Un profesor va a revisar el nivel de ortografía de uno de sus estudiantes. Para ello, le solicita el maletín y escoge al azar dos de los cinco cuadernos que tiene. Si los cuadernos que hay son de Cálculo 1, Lectura de textos académicos en ingles 1, Ecología y medio ambiente, Introducción a la tecnología informática y Fundamentos de estadística, ¿De cuántas formas puede el profesor hacer la elección? 2. Encuentre el espacio muestral de los siguientes experimentos aleatorios: a. Contestar tres preguntas cuyas opciones de respuesta son falso y verdadero. b. Elegir un estudiante ganador de un 5, entre los alumnos Jorge, Diana y Andrés. c. Se pregunta a cuatro estudiantes del curso si aprobaron o no el examen. 3. Karime, Jorge, Miguel y Claudia quieren ir al próximo simposio de estadística. Si solamente se puede enviar a dos de ellos: a. ¿Cuál es la probabilidad de que Jorge no asista? b. ¿Cuál es la probabilidad de que Claudia y Miguel asistan? 4. Se lanza un dado y una moneda al aire. a. ¿Cuál es la probabilidad de que el dado caiga en 2 y la moneda caiga en cara? b. ¿Cuál es la probabilidad de que el dado no caiga en 2? 5. Se pregunto a cuatro personas sobre el uso de un nuevo medicamento. Calcular la probabilidad de los eventos: a. Tres personas usan el nuevo medicamento. b. Al menos dos de las cuatro personas usan el nuevo medicamento. c. A lo sumo una de las cuatro personas usan el nuevo medicamento. 6. En una encuesta realizada a los 120 habitantes de un barrio de la ciudad se obtuvo que 35 trabajan en el sector financiero, 60 trabajan más de 8 horas diarias y 15 trabajan en sector financiero y más de ocho horas diarias. a. Hacer la representación gráfica de esta situación mediante un diagrama de Venn. b. De acuerdo con el diagrama, si se selecciona una persona al azar del barrio, ¿Cuál es la probabilidad de que trabaje ocho horas o menos? c. ¿Cuál es la probabilidad de que una persona seleccionada al azar en el barrio, no trabaje en el sector financiero o trabaje ocho horas o menos? 7. Sea S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, A = {0, 2, 4, 6, 8}, B = {1, 3, 5, 7, 9}, C = {2, 3, 4, 5} y D = {1, 6, 7} enumere los elementos de los conjuntos que correspondan a los siguientes eventos: a. A C b. A B c. C d. C D B e. A B f. A C D 8. Si A y B son mutuamente excluyentes y P( A) 0.3 y P( B) 0.5 , encuentre:
a. P A B b. P A c. P A B 9. Sean A y B eventos independientes tales que P(A) = 0.1 y P(B) = 0.5. Encuentre: a. P(AUB) b. P(AcUB) c. P(AUBc) d. P(A∩B) e. P(Ac∩B) f. P(A∩Bc) 10.Si dos eventos, A y B, tienen las siguientes probabilidades: P( A) 0.5 , P( B) 0.3 y P( A B) 0.1, encuentre las siguientes probabilidades: a.
P( A B) b. P( B A) c. P( A A B) d. P( A A B) e. P( A B A B)
Situación 5: 1. En un estudio se pregunta a 150 clientes de una cadena de supermercados acerca de la forma de pago y el tipo de transporte que utiliza luego de efectuar sus compras. Los resultados se muestran en la siguiente tabla.
Transporte
Forma de pago
2.
3.
4.
5.
6.
Efectivo
Crédito
Débito
Total
Propio
20
35
27
82
Taxi
10
10
18
38
Otro
22
5
3
30
Total
52
50
48
150
Si se selecciona un cliente al azar, ¿Cuál es la probabilidad de los siguientes eventos? a. El cliente realiza su pago en efectivo y utiliza su vehículo. b. El cliente realiza su pago con la tarjeta débito. c. El cliente usa el taxi o paga con tarjeta crédito. d. El cliente utiliza un transporte diferente al propio o al taxi. La probabilidad de seleccionar una persona al azar dentro de un grupo de estudiantes es de 0.8. la probabilidad de que la persona seleccionada sea estudiante de ingeniería es 0.3 y la probabilidad de que la persona seleccionada sea hombre y estudie ingeniería es de 0.15. a. Si se sabe que la persona es hombre, ¿Cuál es la probabilidad de que estudie ingeniería? b. Si se escoge una persona que estudie ingeniería, ¿Cuál es la probabilidad de que sea hombre? Una empresa multinacional desea establecer dos sedes, en Bogotá y en Cali. Un estudio de mercado arroja los siguientes resultados: la probabilidad de que la sede tenga éxito en Bogotá es de 0.75; la probabilidad de que tenga éxito en Cali es de 0.6 y la probabilidad de que tenga éxito en ambas ciudades de de 0.5. Si la empresa ha decidido establecer su sede en Bogotá, ¿Cuál es la probabilidad de que establezca la sede en Cali?, Si la empresa ha decidido establecer su primera sede en Cali, ¿Cuál es la probabilidad de que lo haga en Bogotá? Dos amigos son alumnos de la asignatura Fundamentos de Estadística de forma que cuando uno falte le pasa los apuntes al otro. Se sabe que el primero va a asistir a un 80% de las clases y el segundo a un 40%, de forma independiente. ¿Cuál es la probabilidad de que los amigos tengan todos los apuntes de clase? El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que los no ingenieros y los no economistas solamente el 20% ocupa un puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero? Falcao juega el 90% de los partidos de la Selección Colombia, cuando Falcao juega Colombia solo gana el 90% de los partidos y cuando no juega Falcao Colombia solo gana el 80% de las veces, calcule: ¿Cuál es la probabilidad de que la Selección Colombia gane el próximo partido?, si usted no puede ver el partido y se entera que Colombia no gano, ¿Cuál es la probabilidad de que Falcao haya jugado?