Taller Repaso 1(1)

UNIVERSIDAD DEL VALLE ESCUELA DE ESTADÍSTICA ASIGNATURA: FUNDAMENTOS DE ESTADÍSTICA PERIODO: FEBRERO - JUNIO DE 2013 TAL

Views 155 Downloads 5 File size 323KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD DEL VALLE ESCUELA DE ESTADÍSTICA ASIGNATURA: FUNDAMENTOS DE ESTADÍSTICA PERIODO: FEBRERO - JUNIO DE 2013 TALLER DE REPASO Situación 1: Se desea observar un proceso para producir cierto tipo de metal. Los fabricantes están interesados en describir el comportamiento de la tensión de ruptura de los metales producidos. Para ello toman 60 especímenes del metal producido y se someten a una tensión hasta que se rompen. A continuación se presentan los resultados de las tensiones de ruptura en kilogramos por centímetro cuadrado: 453

464

440

459

476

435

443

453

448

429

473

439

437

451

442

434

436

452

461

421

450

488

472

441

464

452

471

480

447

453

443

435

435

461

444

453

443

463

429

442

424

457

463

449

429

450

436

440

452

464

464

451

435

449

492

455

472

423

458

453

a) Defina la variable de interés, así como su tipo y escala de medición. b) ¿Construya la tabla completa de frecuencias?, c) Interprete los valores n3, f5, N2 y F4, d) Si se considera que los metales deben tener una tensión superior a 455 kilogramos, ¿Qué porcentaje de elementos presentaron una tensión superior a 455 kilogramos? e) Calcule e intérprete los indicadores de tendencia central (Media, Mediana y Moda), f) Calcule e intérprete los indicadores de dispersión (Desviación estándar, Desviación media y Coeficiente de Variación), g) Calcule e intérprete los cuartiles, h) que tipo de asimetría presenta la distribución de los datos, i) Está de acuerdo en que los datos presentan un curva mesocurtica. Situación 2: El estudio de las emisiones de gases provenientes especialmente de la industria y los medios de transporte, es de vital importancia para que las autoridades ambientales competentes tengan conocimiento del comportamiento de estos contaminantes y promuevan la disminución de sus niveles. Para realizar un estudio, se utilizan los registros de la concentración en el aire de Monóxido de Carbono (CO) del año 2004 en la ciudad de Cali, proveniente de la estación fija de la Red de Monitoreo de Calidad del Aire llamada Calle 15. Se dispone de 4690 datos disponible para este contaminante, cada uno correspondiente al valor promedio de monóxido de carbono durante una hora medido en partículas por millón (ppm), los resultados obtenidos se muestran en la siguiente tabla de frecuencias.

Clase 1 2 3 4 5 6 7

Partículas de CO Intervalos de clase 0 1,1

Marca de Clase

ni

Ni

fi

Fi

1510 2,75

0,1812 4036

0,1484

342 6,6 7,7

0,0580

0,9915

a) Defina la variable de interés, así como su tipo y escala de medición. b) Complete la tabla de frecuencias. c) Intérprete: n2, f4, N3 y F5. d) Calcule e interprete la media, mediana y desviación estándar. Según normas ambientales las emisiones de CO no deben exceder en promedio 2 ppm por hora ¿Se cumple la norma en esta estación? e) ¿Qué proporción de mediciones presentaron más de 2 ppm? f) ¿A partir de qué valor se encuentra el 20% de las mediciones más altas de CO? g) Para continuar el estudio en el año 2005, se consideraron 3 estaciones más, las cuales son: ERA, BA y PDD los resultados obtenidos se muestran por medio del siguiente diagrama de cajas y alambres de la concentración de CO por estación.

Concentración de CO (ppm)

10

8

6

4

2

0 PDD

ERA

CALLE 15

BA

Estación

¿Cuáles estaciones presentan las emisiones de CO más altas y más bajas? h) Si la norma establece que no se puede exceder en más de 2 ppm la concentración de CO, para cada estación ¿En qué porcentaje aproximadamente de observaciones se está excediendo la norma? i) ¿Las emisiones de CO presentan un comportamiento simétrico para cada estación?, ¿Cuál estación presenta mayor dispersión en los datos? j) ¿Cuál es el promedio de concentración de CO por hora para toda la ciudad de Cali? Si se tiene la información sobre el promedio de las estaciones de la ciudad: Estación Promedio (ppm) Número de datos

ERA 1,23 8211

BA 0,74 5828

Calle 15 2,61 4975

PDD 0,86 1550

Situación 3: Los siguientes contextos son falsos o verdaderos, argumente su respuesta. a) Para cualquier lista de números, la mitad de ellos estará debajo de la media. b) ¿Es la media de la muestra siempre el valor que ocurre con más frecuencia? c) ¿Es la media de la muestra siempre igual a uno de los valores que está en la muestra? d) ¿La mediana de la muestra siempre es igual a uno de los valores de la muestra? e) Es posible encontrar un tamaño de la muestra para el cual la mediana siempre sea igual a uno de los valores en la muestra. f) En cierta compañía, cada trabajador recibió un aumento de $50.000 por semana. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos? g) En otra compañía, cada trabajador recibió un aumento del 5%. ¿Cómo afecta esto la media de los sueldos? ¿Y la desviación estándar de los sueldos? h) El rango intercuartilico es igual al valor mayor menos el valor menor en los datos. i) La cuenta del número de observaciones que pertenecen a cada clase es llamada Frecuencia Absoluta (ni). j) Las frecuencias relativas (fi) indican la proporción del total de observaciones perteneciente a cada clase y se obtienen al dividir la frecuencia absoluta de la clase entre el total de observaciones. k) La frecuencia absoluta acumulada (Ni) se obtiene al sumar las frecuencias absolutas de las clases precedentes hasta esa clase, incluyendo la clase i. l) La frecuencia relativa acumulada (Fi) se calcula al adicionar las frecuencias absolutas de las clases anteriores e incluyendo la clase i. m) En estadística una población es el conjunto de cosas, personas, animales o situaciones que tiene una o varias características o atributos comunes. n) La muestra es una parte, generalmente grande igual al conjunto total de datos y sirve para analizar e inferir las características de una población. o) La media de n observaciones de la variable X se denotará por el símbolo x y se define como la suma de ellas dividida por n. p) La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre con mayor frecuencia. q) La mediana (Me) de un conjunto de n números es el número central que se ubica en el conjunto de números. r) La desviación estándar es el cuadrado de la varianza. s) El Coeficiente de variación (C.V.) es una medida de la dispersión relativa de un conjunto de datos, que se obtiene dividiendo la media entre la desviación estándar del conjunto. t) Los coeficientes de asimetría y apuntamiento son indicadores de dispersión. u) El cuartil dos Q2 siempre coincide con la media. v) La interpretación del tercer cuartil Q3, es que el 30% de los datos son menores o iguales al valor obtenido en ese cuartil. w) La media es un estimador robusto que no se afectado por valores extremos. x) Las variables cuantitativas tienen escalas de medición de intervalo y razón. y) Si todos los valores en los datos son negativos la desviación estándar puede ser negativa. z) Las variables cualitativas se dividen en continuas y discretas y tienen escalas de medición nominal y ordinal.

Situación 4: 1. Un profesor va a revisar el nivel de ortografía de uno de sus estudiantes. Para ello, le solicita el maletín y escoge al azar dos de los cinco cuadernos que tiene. Si los cuadernos que hay son de Cálculo 1, Lectura de textos académicos en ingles 1, Ecología y medio ambiente, Introducción a la tecnología informática y Fundamentos de estadística, ¿De cuántas formas puede el profesor hacer la elección? 2. Encuentre el espacio muestral de los siguientes experimentos aleatorios: a. Contestar tres preguntas cuyas opciones de respuesta son falso y verdadero. b. Elegir un estudiante ganador de un 5, entre los alumnos Jorge, Diana y Andrés. c. Se pregunta a cuatro estudiantes del curso si aprobaron o no el examen. 3. Karime, Jorge, Miguel y Claudia quieren ir al próximo simposio de estadística. Si solamente se puede enviar a dos de ellos: a. ¿Cuál es la probabilidad de que Jorge no asista? b. ¿Cuál es la probabilidad de que Claudia y Miguel asistan? 4. Se lanza un dado y una moneda al aire. a. ¿Cuál es la probabilidad de que el dado caiga en 2 y la moneda caiga en cara? b. ¿Cuál es la probabilidad de que el dado no caiga en 2? 5. Se pregunto a cuatro personas sobre el uso de un nuevo medicamento. Calcular la probabilidad de los eventos: a. Tres personas usan el nuevo medicamento. b. Al menos dos de las cuatro personas usan el nuevo medicamento. c. A lo sumo una de las cuatro personas usan el nuevo medicamento. 6. En una encuesta realizada a los 120 habitantes de un barrio de la ciudad se obtuvo que 35 trabajan en el sector financiero, 60 trabajan más de 8 horas diarias y 15 trabajan en sector financiero y más de ocho horas diarias. a. Hacer la representación gráfica de esta situación mediante un diagrama de Venn. b. De acuerdo con el diagrama, si se selecciona una persona al azar del barrio, ¿Cuál es la probabilidad de que trabaje ocho horas o menos? c. ¿Cuál es la probabilidad de que una persona seleccionada al azar en el barrio, no trabaje en el sector financiero o trabaje ocho horas o menos? 7. Sea S = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}, A = {0, 2, 4, 6, 8}, B = {1, 3, 5, 7, 9}, C = {2, 3, 4, 5} y D = {1, 6, 7} enumere los elementos de los conjuntos que correspondan a los siguientes eventos: a. A  C b. A  B c. C  d. C   D  B e. A  B f. A  C  D 8. Si A y B son mutuamente excluyentes y P( A)  0.3 y P( B)  0.5 , encuentre:

a. P A  B  b. P A c. P A  B  9. Sean A y B eventos independientes tales que P(A) = 0.1 y P(B) = 0.5. Encuentre: a. P(AUB) b. P(AcUB) c. P(AUBc) d. P(A∩B) e. P(Ac∩B) f. P(A∩Bc) 10.Si dos eventos, A y B, tienen las siguientes probabilidades: P( A)  0.5 , P( B)  0.3 y P( A  B)  0.1, encuentre las siguientes probabilidades: a.

P( A B) b. P( B A) c. P( A A  B) d. P( A A  B) e. P( A  B A  B)

Situación 5: 1. En un estudio se pregunta a 150 clientes de una cadena de supermercados acerca de la forma de pago y el tipo de transporte que utiliza luego de efectuar sus compras. Los resultados se muestran en la siguiente tabla.

Transporte

Forma de pago

2.

3.

4.

5.

6.

Efectivo

Crédito

Débito

Total

Propio

20

35

27

82

Taxi

10

10

18

38

Otro

22

5

3

30

Total

52

50

48

150

Si se selecciona un cliente al azar, ¿Cuál es la probabilidad de los siguientes eventos? a. El cliente realiza su pago en efectivo y utiliza su vehículo. b. El cliente realiza su pago con la tarjeta débito. c. El cliente usa el taxi o paga con tarjeta crédito. d. El cliente utiliza un transporte diferente al propio o al taxi. La probabilidad de seleccionar una persona al azar dentro de un grupo de estudiantes es de 0.8. la probabilidad de que la persona seleccionada sea estudiante de ingeniería es 0.3 y la probabilidad de que la persona seleccionada sea hombre y estudie ingeniería es de 0.15. a. Si se sabe que la persona es hombre, ¿Cuál es la probabilidad de que estudie ingeniería? b. Si se escoge una persona que estudie ingeniería, ¿Cuál es la probabilidad de que sea hombre? Una empresa multinacional desea establecer dos sedes, en Bogotá y en Cali. Un estudio de mercado arroja los siguientes resultados: la probabilidad de que la sede tenga éxito en Bogotá es de 0.75; la probabilidad de que tenga éxito en Cali es de 0.6 y la probabilidad de que tenga éxito en ambas ciudades de de 0.5. Si la empresa ha decidido establecer su sede en Bogotá, ¿Cuál es la probabilidad de que establezca la sede en Cali?, Si la empresa ha decidido establecer su primera sede en Cali, ¿Cuál es la probabilidad de que lo haga en Bogotá? Dos amigos son alumnos de la asignatura Fundamentos de Estadística de forma que cuando uno falte le pasa los apuntes al otro. Se sabe que el primero va a asistir a un 80% de las clases y el segundo a un 40%, de forma independiente. ¿Cuál es la probabilidad de que los amigos tengan todos los apuntes de clase? El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que los no ingenieros y los no economistas solamente el 20% ocupa un puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero? Falcao juega el 90% de los partidos de la Selección Colombia, cuando Falcao juega Colombia solo gana el 90% de los partidos y cuando no juega Falcao Colombia solo gana el 80% de las veces, calcule: ¿Cuál es la probabilidad de que la Selección Colombia gane el próximo partido?, si usted no puede ver el partido y se entera que Colombia no gano, ¿Cuál es la probabilidad de que Falcao haya jugado?