Cap 4 Nombres Completos

"Año de la lucha contra la corrupción e impunidad" UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS ESCUELA DE INGENIERÍA INDUS

Views 74 Downloads 0 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

"Año de la lucha contra la corrupción e impunidad"

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS ESCUELA DE INGENIERÍA INDUSTRIAL

ESTADISTICA APLICADA A LOS NEGOCIOS Y LA ECONOMÍA Curso:

ESTADÍSTICA APLICADA

Docente:

Mg. Esponda Veliz, Jorge José

Sección: Horario:

“2” Martes de 8am a 11:20am

Integrantes:

Garibay Huamani, José Gabriel Jara Dextre, Flavio Jesús Santiago Paredes Sánchez, Gabriel Cipriani Reyes Roman, Jossett Felipe Sánchez Macedo, Luis Eleazar

Lima, 10 de septiembre del

“2019”

CAPITULO IV

2. Explique las diferencias entre un histograma y un diagrama de tallo y hojas. El diagrama de tallo y hojas muestra la frecuencia con la que ocurren los valores dentro de un conjunto de datos lo cual es muy parecido a lo que hace un histograma, pero la diferencia es que en el diagrama de tallo y hojas no se observan barras sólidas, sino que son los mismos números los que dan forma al diagrama. 4. En el siguiente diagrama informa el número de teléfonos celulares que

vendió Radio Shack durante los pasados 26 días.

a)

¿Cuáles son los números máximo y mínimo de teléfonos celulares vendidos en un día? El máximo de celulares vendidos es 19 y el mínimo es 4.

b)

¿Cuál es el numero típico de teléfonos celulares vendidos? El numero típico de teléfonos celulares vendidos es de 5 acumuladas en 11.

6. La tercera fila de un día diagrama de tallo y hojas aparece de la siguiente manera: a)

21 | 0 1 3 5 7 9. Suponga que los valores son números enteros ¿Cuál es el posible rango de los valores de esta fila? El rango es de 210 a 219

b)

¿Cuántos valores de datos hay en esta fila? Existen 6 datos.

c)

Elabore una lista de los valores reales de esta fila de datos. 210

211

213

215

217

219

8. El siguiente diagrama de tallo y hojas presenta la cantidad de películas rentadas por un día en Video Connection, ubicado en la esquina de las calles Forth y Main. 3

12

689

6

13

123

10

14

6889

13

15

589

15

16

35

20

17

24568

23

18

268

(5)

19

13456

22

20

034679

16

21

2239

12

22

789

9

23

00179

4

24

8

3

25

13

1

26

1

27

0

a) ¿Cuántos días se registraron? Se registraron 50 días. b) ¿Cuántas observaciones hay en la última clase? Hay una observación. c) ¿Cuáles son los valores máximo y mínimo de todo el conjunto de datos? El valor mínimo es 126 y el máximo es 270. d) Elabore una lista de valores reales de la cuarta fila. 155

158

159

e) Elabore una lista de valores reales que aparecen en la penúltima fila. No hay valores. f) ¿En cuántos días se rentaron menos de 160 películas? En 13 días. g) ¿En cuántos días se rentaron 220 o más películas? En 12 días. h) ¿Cuál es el valor medio? El valor medio es 193.5. i) ¿En cuántos días se rentaron entre 170 y 210 películas? En 19 días.

10. Aloha Banking Co. Estudia el uso de cajeros automáticos en los suburbios de Honolulu. Una muestra de 30 cajeros mostró que éstos se utilizaron la siguiente cantidad de veces el día de ayer. Elabore un diagrama de tallo y hojas. Resuma la cantidad de veces que se utilizó cada cajero automático. ¿Cuáles son los números mínimo y máximo de veces que se utilizó cada uno de ellos? 83

64

84

76

84

54

75

59

70

61

63

80

84

73

68

52

65

90

52

77

95

36

78

61

59

84

95

47

87

60

Tallo

Hojas

3

6

Se utilizó 36 veces

4

7

Se utilizó 47 veces

5

22499

Se utilizó entre 50 y 59

6

0113458

Se utilizó entre 60 y 69

7

035678

Se utilizó entre 70 y 79

8

0344447

Se utilizó entre 80 y 89

9

055

Se utilizó entre 90 y 99

veces

veces

veces

veces

veces El valor mínimo es 36 y el máximo es 95 que se repite dos veces. 12. Determine la mediana y los valores correspondientes al primer y tercer

cuartiles en los siguientes datos.

En primer lugar, se procedería a ordenar los datos de menor a mayor, sin embargo, estos ya se encuentran ordenados, por lo tanto, se procede a encontrar la mediana: 50

𝐿50 = (20 + 1) (100) = 10.5 Entonces:

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 9.45 + (9.61 − 9.45) ∗ 0.5 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 9.53

Luego, para hallar los valores que corresponden al primer cuartil y al tercer cuartil: 25

𝐿25 = (20 + 1) (100) = 5.25

75

𝐿75 = (20 + 1) (100) = 15.75

Es decir: 𝑄1 = 7.59 + (7.99 − 7.59) ∗ 0.25

𝑄3 = 12.22 + (12.71 − 12.22) ∗ 0.75

𝑄1 = 7.69

𝑄3 = 12.5875

14. Kevin Horn es el gerente nacional de ventas de National Textbooks, Inc. Cuenta con un personal de ventas conformado por 40 personas, las cuales hacen visitas a profesores universitarios en todo Estados Unidos. Cada sábado por la mañana solicita a su personal que le envíe un informe, que debe incluir, entre otras cosas, la cantidad de profesores que visitaron la semana anterior. En la lista de abajo, en orden de menor a mayor, aparece la cantidad de visitas de la semana pasada.

a) Determine la cantidad mediana de visitas. Homólogamente al problema anterior, tenemos los datos ordenados, así que se procede a hallar la mediana, primero encontrando su ubicación:

50

𝐿50 = (40 + 1) (100) = 20.5 Lo cual significa que: 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 57 + (59 − 57) ∗ 0.5 = 58 b) Determine el primer y tercer cuartiles. Mismo procedimiento con los demás cuartiles: 25

𝐿25 = (40 + 1) (100) = 10.25

75

𝐿75 = (40 + 1) (100) = 30.75

Teniendo su ubicación, se hallan sus valores: 𝑄1 = 51 + (52 − 51) ∗ 0.25 = 51.25

𝑄3 = 66 + 0 = 66

c) Determine el primero y el noveno deciles. Ubicamos los deciles: 10

𝐿10 = (40 + 1) (100) = 4.1

90

𝐿90 = (40 + 1) (100) = 36.9

Encontramos sus valores: 𝐷1 = 45 + (48 − 45) ∗ 0.1 = 45.3

𝐷9 = 71 + (77 − 71) ∗ 0.9 = 76.4

d) Determine el 33o.percentil. Ubicación del 33º. Percentil: 33

𝐿33 = (40 + 1) (100) = 13.53 Entonces, el valor del percentil es: 𝑃33 = 53 + (54 − 53) ∗ 0.53 = 53.53 16. El diagrama de caja muestra el cargo interestatal de crédito por hora para carreras de cuatro años de estudiantes graduados en universidades públicas.

a) Calcule la mediana. El valor de la mediana se halla por la semisuma de sus límites: $300 y $600, operación de la cual se obtiene el monto de $450. b) Calcule el primer y tercer cuartiles. El primer cuartil viene dado por: Q1=$300 y el tercer cuartil por: Q3=$700. c) Determine el rango intercuartil. El rango intercuartílico resulta de la diferencia del tercer cuartil y primer cuartil. 𝑅𝑎𝑛𝑔𝑜 𝐼𝑛𝑡𝑒𝑟𝑐𝑢𝑎𝑟𝑡𝑖𝑙 = $700 − $300 = $400 d) ¿Más allá de qué punto se considera dato atípico un valor? Se dice que un valor que vaya más allá de los cuartiles, 1.5 veces la amplitud intercuartilica más pequeño que el primer cuartil, o 1.5 veces la amplitud intercuartilica más grande que Q3. e) Identifique cualesquiera datos atípicos y calcule su valor. Uno de los datos atípicos que se pueden mencionar es el de $1500, el cual es mencionado en la grafica y denotado, además, por un asterisco como valor atípico. f) ¿La distribución es simétrica, o tiene sesgo positivo o negativo?

No es simétrica, se puede apreciar que la mediana no se encuentra en la misma ubicación que la media o la moda. La distribución tiene sesgo positivo puesto que tiene una mayor concentración de datos al lado izquierdo. 18. Una muestra de 28 departamentos de tiempo compartido en el área de Orlando, Florida, reveló las siguientes tarifas diarias de una suite con una recámara. Por comodidad, los datos se encuentran ordenados de menor a mayor. Construya un diagrama de caja para representar los datos. Haga algún comentario sobre la distribución. Identifique el primer y tercer cuartiles, y la mediana.

Se procede a hallar el primer cuartil: 𝐿25 = (28 + 1) ∗ (

25

𝑄1 = 209 + (229 − 209) ∗ 0.25 =

) = 7.25

100

214 Identificando el tercer cuartil: 75

𝐿75 = (28 + 1) ∗ (100) = 21.75

𝑄3 = 296 + (307 − 296) ∗ 0.75 = 304.25

Por último, la mediana: 50

𝐿50 = (28 + 1) ∗ (100) = 14.5

𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 246 + (260 − 246) ∗

0.5 = 253

$116

$353 $214

$253

$304.25

La distribución es asimétrica, se aprecia que la mediana no concuerda con la media y la moda. 20. En la siguiente lista aparecen los salarios, en miles de dólares, de una muestra de 15 directores de finanzas de la industria electrónica.

a) Calcule la media, la mediana y la desviación estándar. 𝑀𝑒𝑑𝑖𝑎: 𝑋̅ =

∑𝑋 8130 = = 542 𝑁 15

Salari 48

51

52

52

52

53

53

54

54

55

55

55

56

57

58

o

6

6

3

3

9

4

8

6

8

1

2

8

6

4

6

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Orde n

𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =

𝑁+1 =8 2

𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = 546 ∑(𝑋 − 𝑋̅)2 8219.3006 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟: 𝑠 = √ =√ = 24.23 𝑁−1 14 b) Calcule el coeficiente de sesgo con el método de Pearson. 𝐶𝑜𝑒𝑓 𝑑𝑒 𝑠𝑒𝑠𝑔𝑜 𝑑𝑒 𝑃𝑒𝑎𝑟𝑠𝑜𝑛: 𝑠𝑘 =

3(𝑋̅ − 𝑀𝑒) 3(−4) = = −0.495 𝑠 24.23

22. La lista que sigue está conformada por los salarios de los 25 jugadores en la nómina del día de la apertura de los Yankees de Nueva York en 2010. La información de los salarios se expresa en miles de dólares.

4

8

9

8

5

0

8

0

0

7

8

9

41

42

43

rio

0.8

2.1

6.7

5.7

1

2

3

4

Sala

90

115

117

131

150

165

206

226

2428

330

rio

00

00

50

00

00

00

25

00

5.7

00

16

17

18

19

20

21

22

23

24

25

Ord en

Orde n

4 7 5

45

4

Sala 41

2.5

6

11

12

40

55

55

68

00

00

00

00

00

50

10

11

12

13

14

15

a) Calcule la media, la mediana y la desviación estándar. 𝑀𝑒𝑑𝑖𝑎: 𝑋̅ =

∑𝑋 206333.5 = = 8253.34 𝑁 25

𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 =

𝑁+1 = 13 2

𝑀𝑒𝑑𝑖𝑎𝑛𝑎: 𝑀𝑒 = 5500 ∑(𝑋 − 𝑋̅)2 √ 𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟: 𝑠 = = 9079.95 𝑁−1 b) Calcule el coeficiente de sesgo con el método de Pearson. 𝐶𝑜𝑒𝑓 𝑑𝑒 𝑠𝑒𝑠𝑔𝑜 𝑑𝑒 𝑃𝑒𝑎𝑟𝑠𝑜𝑛: 𝑠𝑘 =

3(𝑋̅ − 𝑀𝑒) 3(2753.34) = = 0.91 𝑠 9079.95

24. Silver Springs Moving and Storage, Inc., estudia la relación que existe entre el número de habitaciones en una mudanza y el número de horas que se requieren de trabajo para completarla. Como parte del análisis, el director de finanzas de Silver Springs creó el siguiente diagrama de dispersión.

a) ¿Cuántas mudanzas se incluyen en la muestra? Se incluyen 15 mudanzas en la muestra. b) ¿Parece que se requieren más horas de trabajo si la cantidad de habitaciones se incrementa, o las horas de trabajo disminuyen si aumenta la cantidad de habitaciones? Según el diagrama de dispersión se requieren más horas de trabajo si la cantidad de habitaciones se incrementa.

26. Sky Resorts Inc., de Vermont, considera su fusión con Gulf Shores, Inc., de Alabama. El consejo directivo encuestó a 50 accionistas acerca de su posición sobre la fusión. Los resultados aparecen en seguida.

a) ¿Cuál es el nivel de medición que se empleó en la tabla? El nivel de medición que se empleó en la tabla es de Variables nominales. b) ¿Qué nombre recibe esta tabla? Tabla de contingencia sobre la relación entre accionistas a favor, en contra o indeciso sobre la fusión. c) ¿Qué grupo parece oponerse con más fuerza a la fusión? El grupo con más de 1000 acciones como número de participación. 28.

Doctor’s Care es una clínica ambulatoria que tiene sucursales en

Georgetown, Monks Corners y Aynor, y en la cual los pacientes reciben tratamiento por lesiones menores, resfriados, gripes y se les practican exámenes físicos. Los siguientes diagramas muestran la cantidad de pacientes que se trataron en las tres sucursales el mes pasado.

Describa el número de pacientes atendidos en las tres sucursales cada día. ¿Cuáles son los números máximo y mínimo de pacientes que se atendieron en cada una de las sucursales? En aynor se observa una mayor cantidad de pacientes atendidos, por otro lado, en Monk Corners se observa menos cantidad de pacientes. En Aynor el número máximo de pacientes es 51 y el mínimo es 11 mientras que Monk Corners en el número maximo es 37 y el mínimo es 8, en Georgetown el máximo de pacientes es 35 y el mínimo 8. 30. La siguiente tabla muestra las 25 compañías (ordenadas por capitalización del mercado) que operan en el área de Washington, DC, junto al año en que fueron fundadas y el número de empleados. Elabore un diagrama de tallo y hojas de estas variables y escriba una breve descripción de sus hallazgos.

TALLO

HOJAS (EMPLEADOS)

(FUNDACION) 1810

9736

1820 1830 1840 1850 1860 1870

17100

1880 1890

3800 5057 64000

1900

17500 49675

1910 1920

229 151000

1930

4605 6450

1940 1950

81000

1960 1970

1767 5533

1980

484 2516 10250 11246 30000 30594 45000

1990

7748 31800 140000

2000

7200



El minimo de empleados por una compañía desde su fundación es de 229 y el máximo es de 140000



La década en donde se fundaron más compañías con un número considerable de empleados es la de los 80



La década con en donde el número de empleados es mayor es en los 90

32. La industria disquera de Estados Unidos lleva a cabo un estudio sobre el número de discos compactos de música que poseen las personas de la tercera edad y los adultos jóvenes. La información aparece en seguida.

a) Calcule la mediana y el primer y tercer cuartiles del número de compactos que poseen los ciudadanos de la tercera edad. Diseñe un diagrama de caja de la información. Mediana = (25+1) *0.5 = 13 Primer Cuartil = (25+1) *0.25 = 6.5 Tercer Cuartil = (25+1) *0.75 = 19.5

b) Calcule la mediana, el primer y tercer cuartiles del número de compactos que poseen los adultos jóvenes. Diseñe un diagrama de caja de la información. Mediana = (30+1)*0.5 = 15.5 Primer Cuartil = (30+1)*0.25 = 7.75 Tercer Cuartil = (30+1)*0.75 = 23.25

34. El siguiente diagrama de caja muestra la cantidad de diarios que se publican en cada estado y en el Distrito de Columbia. Redacte un breve informe para resumir la cantidad que se publicó. Cerciórese de incluir información relativa a los valores del primer y tercer cuartiles, la mediana y si existe algún sesgo. Si hay datos atípicos, calcule su valor.

Para el diagrama de caja se necesita el valor mínimo y máximo, entonces. Primer cuartil = 10 Mediana = 20 Tercer cuartil = 40 La cantidad de diarios publicados en el distrito de Columbia es de 39, teniendo así como primer cuartil 10, mediana 20 y tercer cuartil 40. También se observa una asimetría positiva el cual significa que hay una dispersión al lado derecho. 36. La American Society of PeriAnesthesia Nurses (ASPAN: www.aspan.org) es una organización estadounidense que agrupa a enfermeras que se desempeñan en el cuidado preanestesia y posanestesia en cirugías ambulatorias. La organización comprende 40 componentes, que se enlistan a continuación.

Utilice un software estadístico para responder las siguientes preguntas.

a) Encuentre la media, la mediana y la desviación estándar del número de miembros por componente. Mediante el uso del software de estadística Minitab se obtuvo: La media:348.5 Medina:276 Desviación estándar:277.430 b) Ubique el coeficiente de sesgo mediante el software. ¿Cuál es su conclusión con respecto a la forma de la distribución del tamaño del componente? El sesgo obtenido fue: 0.7839 es decir tiene un sesgo positivo hacia la derecha y su media es mayor a su media y tendría una mayor cantidad de datos a la derecha y el pico de la gráfica a la izquierda. c) Determine el primer y tercer cuartiles. No utilice el método descrito por Excel. Primer cuartil: posición: 𝑳𝟐𝟓 =

(𝒏 + 𝟏) ∗ 𝟐𝟓 𝟒𝟏 ∗ 𝟐𝟓 = = 𝟏𝟎. 𝟐𝟓 𝟏𝟎𝟎 𝟏𝟎𝟎

𝑸𝟏 = 𝟏𝟏𝟓 + (𝟏𝟏𝟕 − 𝟏𝟏𝟓) ∗ 𝟎. 𝟐𝟓 = 𝟏𝟏𝟓. 𝟓

Tercer cuartil: Posición:

𝑳𝟕𝟓 =

(𝒏 + 𝟏) ∗ 𝟕𝟓 𝟒𝟏 ∗ 𝟐𝟓 = = 𝟑𝟎. 𝟕𝟓 𝟏𝟎𝟎 𝟏𝟎𝟎

𝑸𝟑 = 𝟓𝟏𝟕 + (𝟓𝟑𝟏 − 𝟓𝟏𝟕) ∗ 𝟎. 𝟕𝟓 = 𝟓𝟐𝟕. 𝟓

d) Desarrolle un diagrama de caja. ¿Hay datos atípicos? ¿Cuáles componentes

son

atípicos?

¿Cuáles

son

los

límites

de

los

componentes atípicos?

Valor

Q1

Mediana

Q3

mínimo 62

Valor máximo

115.5

348.5

527.5

1165

Lo que se pudo observar del diagrama de caja es que se obtuvo una asimetría positiva porque la línea que va desde el tercer cuartil al valor máximo es más grande que la que va del primer cuartil al valor mínimo, también la mediana no se encuentra en el centro de la caja es decir la línea de la mediana está más cercana al primer cuartil. 38. En la siguiente lista aparece la cantidad de comisiones que ganaron el mes pasado los ocho miembros del personal de ventas de Best Electronics. Calcule el coeficiente de sesgo utilizando ambos métodos. Sugerencia: El uso de una hoja de cálculo agilizará los cálculos.

Cálculo del coeficiente de sesgo de Pearson:

1. Mediana: ̅= 𝒙

𝟏𝟏𝟓𝟑. 𝟗 + 𝟏𝟒𝟎𝟗. 𝟎 = 𝟏𝟐𝟖𝟏. 𝟒𝟓 𝟐

2. Media: ̅= 𝒙

∑𝒙 = 𝟏𝟑𝟐𝟏. 𝟗𝟕𝟓 𝒏

3. Desviación estándar: ∑(𝒙 − 𝒙 ̅) 𝟐 𝒔=√ = 𝟐𝟗𝟕. 𝟎𝟕𝟐 𝒏−𝟏 4. Coeficiente de pearson: 𝑺𝑲 =

̅ − 𝒎𝒆𝒅𝒊𝒂𝒏𝒂) 𝟑 ∗ (𝒙 = 𝟎. 𝟒𝟎𝟗 𝒔

40. El gerente de Servicios de Información de Wilkin Investigations, una empresa privada, estudia la relación entre el tiempo de uso (en meses) de una máquina compuesta de impresora, copiadora y fax, y el costo de mantenimiento mensual de ella. El gerente elaboró el siguiente diagrama sobre una muestra de 15 máquinas. ¿Qué puede concluir el gerente sobre la relación entre las variables?

La grafica muestra una mayor relación entre el tiempo de uso y el costo de mantenimiento de las maquinas. Se observa que entre los meses 34 y 39 hubo un aumento en el costo de mantenimiento; pero, el aumento se vuelve más significativo entre los meses 44 y 49 por lo tanto se puede llegar a la conclusión de que a medida que se incrementa el tiempo de uso en meses también aumenta el costo mensual de mantenimiento de las maquina es decir son directamente proporcionales las variables.

42. Wendy ofrece ocho diferentes condimentos (mostaza, cátsup, cebolla, mayonesa, pepinillos, lechuga, tomate y guarnición) para hamburguesas. El administrador de una de las tiendas recogió la siguiente información relativa al número de condimentos que se pidieron y el grupo de edad de los clientes. ¿Qué puede concluir respecto de la información? ¿Quién tiende a ordenar la mayor o la menor cantidad de condimentos?

La tabla de contingencia nos permite observar dos variables de interés de manera más resumida, también se observa una tendencia en la preferencia por la cantidad de condimentos de 3 a más entre personas de edades de 60 a menos; en cambio, la diferencia tiene una tendencia a consumir menor cantidad de condimentos.

El grupo de personas entre edades de 18 a 40 tienden a consumir condimentos en mayor cantidad y las personas de edades de 60 a más son los menores consumidores de condimentos