Respuesta Taller

Politécnico de la Costa Atlántica Análisis de Datos Variables estadísticas Organización de datos Medidas de tendencia

Views 92 Downloads 5 File size 801KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Politécnico de la Costa Atlántica

Análisis de Datos

Variables estadísticas Organización de datos Medidas de tendencia central

Presentado por:

Presentado a:

Barranquilla, Febrero 25 de 2019

Página 1 de 7

Clasifica las siguientes variables estadísticas en categóricas(nominales; ordinales) y numéricas (continuas o discretas). a) Número de droguerías en la zona centro de barranquilla b) Intención de voto. c) nombre de las pizzerías en l noroccidente de la ciudad d) Talla de pantalones de los alumnos hombres de tu centro. e) notas del primer parcial de estadística de los estudiantes del politécnico. f) Temperatura mínima en tu ciudad cada día del año. g) rango militar h) peso perdido de personas sometidas a una dieta. i) Deporte practicado por los chicos y chicas de tu centro. j) La duración de cada pila eléctrica producida por una empresa durante un semestre.

130.0 ; 113.7 ; 122.0 ; 108.3 ; 131.5 ; 133.2 ; 118.6 ; 127.4 ; 138.4 E1

E2

E3

E4

E5

E6

E7

E8

E9

Cuál es la mediana de los valores reportados de acciones. Interpretarla. Suponga que la información de la octava empresa, fue erróneo, es decir se cambia por 127.4 a 127.6. ¿Cómo afectaría esto a la mediana de los valores reportados anteriormente? Que dice esto sobre la sensibilidad de la mediana. 4. considere las siguientes observaciones de las ventas de minutos (en miles de pesos) en un punto de atención en cierto barrio de la ciudad durante los primeros 11 días. 73.7 ; 36.6 ; 109.9 ; 4.4 ; 33.1 ; 66.7 ; 30.0 ; 81.5 ; 22.2 ; 40.4 ; 16.4

A fin de decidir cuántos mostradores de servicio se necesitarán en tiendas que serán construidas en el futuro, una cadena de supermercados quiso obtener información acerca del tiempo (en minutos) requerido para atender a los clientes. Se registró la duración de 60 casos:

4,8

1,9

2,1

3,3

0,8

0,2

1,4

1,4

1,8

1,6

2,3

1,8

0,3

1,1

1,5

1,2

1,6

1,1

1,9

1,7

1,4

0,2

4,3

3,1

0,4

2,3

1,8

4,5

3,5

5,8

3,8

2,8

2,5

1,1

0,4

1,2

0,4

1,3

4,3

1,3

2,3

1,2

1,8

1,0

0,9

3,7

3,1

1,7

6,4

2,2

3,4

1,9

5,2

0,5

1,8

0,3

1,1

0,6

1,9

5,3

Calcule e interprete el valor de la media y la mediana. ¿Por qué la mediana es tan diferente de la media? 5. veintiuna personas en un salón de clase tienen una altura promedio de 168 centímetros. Si al salón entra una persona adicional, entonces. ¿Cuál es la altura que debe tener esta persona para que la altura promedio se incremente en un centímetro? 6. Diga que la informacion es falsa o verdadera. Justifique siempre su repuesta. En caso de ser falso justifique con el procediemiento adecuado ( contraejemplo) a. si el ingreso promedio de 25 trabajadores es de $2.500.000. Entonces, el ingreso total es de $ 10.000.000 b. si 10 calificaciones tienen una media de 2.0. Y 27 calificaciones una media de 3.0, entonces la media del grupo total de 37 calificaciones es 2.5. 7. Supongamos que a cada dato de un conjunto de datos se le suma una constante c, es decir, supongamos que se agrega una constante c a cada 𝑥𝑖 en una muestra, obteniendo

Cuál es la variable a analizar. ¿Es numérica o categórica? Organiza los datos en una tabla de frecuencias y responde las siguientes preguntas:

𝑦𝑖 = 𝑥𝑖 + 𝑐

Según la tabla Qué porcentaje representa un tiempo mayor a 3,1 minutos en atender un cliente.

(a) Demuestre que la media del nuevo conjunto de datos es igual a la media de los datos

Calcula las 2 medidas de tendencia central( media y mediana) sin agrupar los datos. (interpretarlas)

Originales más la constante. Es decir, 𝑦̅𝑖 = 𝑥̅𝑖 + 𝑐

Estima la media y mediana , con los datos ya agrupados y verifica que tanto se diferencia la medida real de la estimada. Graficar el histograma de frecuencias, el polígono de frecuencias y la ojiva. Realice un pequeño informe.

(b) Demuestre que la mediana del nuevo conjunto de datos es igual a la mediana de los Datos originales más la constante. Es decir,

(Mediana de los 𝑦𝑖 ) = (Mediana de los 𝑥𝑖 ) + c.

3. Los valores que se reportan a continuación son el activo en miles de dólares de 9 empresas de la ciudad de barranquilla.

Página 2 de 7

HOJA DE RESPUESTAS

1. a) b) c) d) e) f) g) h) i) j)

Numérica discreta Categórica nominal Categórica nominal Numérica discreta Numérica continua Numérica continua Categórica ordinal Numérica continua Categórica nominal Numérica continua

2. 

La variable a analizar es numérica.

Tabla de datos de minutos de atención si agrupar: CASOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

TIEMPO (min) 0,2 0,2 0,3 0,3 0,4 0,4 0,4 0,5 0,6 0,8 0,9 1 1,1 1,1 1,1 1,1 1,2 1,2 1,2 1,3

CLASE 6,86789913

7

CASOS 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40

TIEMPO (min) 1,3 1,4 1,4 1,4 1,5 1,6 1,6 1,7 1,7 1,8 1,8 1,8 1,8 1,8 1,9 1,9 1,9 1,9 2,1 2,2

RANGO 6,2

Página 3 de 7

CASOS 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60

TIEMPO (min) 2,3 2,3 2,3 2,5 2,8 3,1 3,1 3,3 3,4 3,5 3,7 3,8 4,3 4,3 4,5 4,8 5,2 5,3 5,8 6,4

TAMAÑO DEL INTERVALO 0,885714286 1

Tabla de datos agrupada TIEMPO ATENCIÓN 𝑓𝑖 # 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒 → → → → → → → ∑

0,2 1,2 2,2 3,2 4,2 5,2 6,2

1,2 2,2 3,2 4,2 5,2 6,2 7,2

F𝑖% # 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒

16 23 8 5 4 3 1 60

26,67 38,33 13,33 8,33 6,67 5,00 1,67 100,00

𝑓𝑖a # de cliente 𝑓𝑖𝑎% # 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒 16 39 47 52 56 59 60

26,67 65,00 78,33 86,67 93,33 98,33 100,00

𝑋𝑖

𝑋𝑖𝑓𝑖

0,7 1,7 2,7 3,7 4,7 5,7 6,7

11,2 39,1 21,6 18,5 18,8 17,1 6,7 133



De acuerdo a la tabla, el porcentaje que representa un tiempo de atención mayor a 3,1 minutos es de 21,67%



Media de datos no agrupados:

𝑥̅ = 2,10833 Interpretación: El tiempo requerido para atender a un cliente es en promedio 2,10 minutos.



Mediana de datos no agrupados:

𝑥̃ = 1,8 Interpretación: El 50% de atención de los clientes tarda por lo menos 1,8 minutos.



Media de datos agrupados:

𝑥̅ = 2,216666667 

Mediana de datos agrupados:

𝑥̃ = 1,808695652 

La diferencia entre la media real y la estimada es de 0,108 minutos.



La diferencia entre la mediana real y la estimada es de 0,008 minutos.

Página 4 de 7



Histograma y polígono de frecuencias de 𝒇𝒊 

𝑓𝑖 # 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒

[0,2 - 1,2) [1,2 - 2,2) [2,2 - 3,2) [3,2 - 4,2) [4,2 - 5,2) [5,2 - 6,2) [6,2 - 7,2)

16 23 8 5 4 3 1

Histograma y polígono de frecuencias 23 16

8 5

4

3 1

[0,2 - 1,2) [1,2 - 2,2) [2,2 - 3,2) [3,2 - 4,2) [4,2 - 5,2) [5,2 - 6,2) [6,2 - 7,2)



Ojiva 

𝑓𝑖𝑎 # 𝑑𝑒 𝑐𝑙𝑖𝑒𝑛𝑡𝑒 [0,2 - 1,2) [1,2 - 2,2) [2,2 - 3,2) [3,2 - 4,2) [4,2 - 5,2) [5,2 - 6,2) [6,2 - 7,2)

70

16 39 47 52 56 59 60

Frecuencia Absoluta Acumulada

60 50

40 30 20 10 0 [0,2 - 1,2) [1,2 - 2,2) [2,2 - 3,2) [3,2 - 4,2) [4,2 - 5,2) [5,2 - 6,2) [6,2 - 7,2)

Página 5 de 7

3. ACTIVOS DE EMPRESAS E1 108.3 E2 113.7 E3 118.6 E4 122.0 E5 127.4 E6 130.0 E7 131.5 E8 133.2 E9 138.4

 Mediana:

𝑥̃ = 127,4

Interpretación: El 50% de las empresas tienen activos por debajo de 127,4 mil dólares.

ACTIVOS DE EMPRESAS E1 108.3 E2 113.7 E3 118.6 E4 122.0 E5 127.6 E6 130.0 E7 131.5 E8 133.2 E9 138.4

 Mediana:

𝑥̃ = 127,6

Interpretación: El 50% de las empresas tienen activos por debajo de 127,4 mil dólares.

La Mediana es una medida que presenta mucha sensibilidad a cambios en datos centrales. Siendo el error justo en esta medida, representa un cambio brusco que afecta significativamente la mediana de los datos con una diferencia de 0,2 mil dólares. 4. Ganancias en venta de minutos 4,4 16,4 22,2 30,0 33,1 36,6 40,4 66,7 73,7 81,5 109,9



Media:

𝑥̅ = 46,8

Interpretación: Las ventas realizadas en promedio en miles de pesos durante los primeros 11 días es de 46,8. 

Mediana:

𝑥̃ =36,6

Interpretación: En el 50% de los días las ganancias en miles de pesos fueron por debajo de 36,6.

Al contar con datos muy extremos se produce que las medidas de media y mediana sean muy diferentes. En este caso, la media es la que sufre ante esta variable ya que esta medida es altamente sensible a datos extremos.

5. Página 6 de 7

𝐴 = 168 → 𝐴 = 168 ∗ 21 = 3528 21 𝐵 = 169 → 𝐴 = 169 ∗ 22 = 3718 22 3718-3528 = 190 La altura de la persona que ingresa al salón de clases debe ser de 190 centímetros.

6. a) FALSA

𝐴 ∗ 2500000 → 𝐴 = 2´500.000 ∗ 25 25 𝐴 = 62´500.000

b) FALSO 10 calificaciones → media= 2,0 27 calificaciones → media= 3,0 𝑥 = 2,0 10

→ 𝑥 = 2 ∗ 10

→ 𝒙 = 𝟐𝟎

𝑦 = 3,0 27

→ 𝑦 = 3 ∗ 27

→ 𝒚 = 𝟖𝟏

101 = 2,7 37

7.

 Media 𝑥𝑖 4 8 3

𝑥̅𝑖 = 5

𝑦𝑖 = 𝑥̅𝑖 + 9 10 14 18

𝑦𝑖 = (42/3) = 14 𝑦𝑖 = 5 + 9 = 14

𝑦̅𝑖 = 14

Página 7 de 7