Estadística descriptiva Paso 3 – Análisis de la información Andrea Carolina Caro Castilla – 1065919257 Tutor (a): Sand
Views 61 Downloads 1 File size 109KB
Estadística descriptiva Paso 3 – Análisis de la información
Andrea Carolina Caro Castilla – 1065919257
Tutor (a): Sandra Viviana Lozano Grupo: 204040_394
Universidad Nacional Abierta y a Distancia – UNAD Escuela de Ciencias Básicas, Tecnología e Ingeniería
Psicología CEAD Aguachica 2020 Paso 3 – Análisis de la información Actividad 2: Laboratorio de Medidas Univariantes 1. Medidas Univariantes de Tendencia Central. a. Para la variable elegida, se deberán calcular las medidas univariantes de tendencia central: media, mediana y moda. Variable cuantitativa discreta: Fallecidos Ene - Feb 2019 15 15 15 21 21 21 27 27 27 27 27 27 27 33 33 39 39 39 51 69
15 15 15 21 21 21 27 27 27 27 27 27 27 33 33 39 39 39 51 69
15 15 15 21 21 21 27 27 27 27 27 27 33 33 33 39 39 45 51 69
Media: Suma de los datos X´ = Número total de datos 6788 X´ = 200
15 15 15 21 21 21 27 27 27 27 27 27 33 33 39 39 39 45 51 81
15 15 15 21 21 21 27 27 27 27 27 27 33 33 39 39 39 45 63 105
15 15 15 21 21 21 27 27 27 27 27 27 33 33 39 39 39 45 63 105
15 15 15 21 21 21 27 27 27 27 27 27 33 33 39 39 39 45 63 105
15 15 15 21 21 21 27 27 27 27 27 27 33 33 39 39 39 51 63 123
15 15 15 21 21 27 27 27 27 27 27 27 33 33 39 39 39 51 69 123
15 15 21 21 21 27 27 27 27 27 27 27 33 33 39 39 39 51 69 371
X´ =33,94 fallecidos Mediana: El dato central obtenido de la organización de menor a mayor del conjunto de datos dados por la variable en estudio es 27 fallecidos. Moda: El dato que más se repite en el conjunto de datos es el 27 fallecidos, con un total de 64 repeticiones.
b. Calcular: Cuartiles Qk=
kn 4
Q 1=
1∙ 200 4
Q 1=
200 4
Q 1=50 El Q1 corresponde a la posición 50 de los datos organizados de menor a mayor, y este corresponde a 21 fallecidos.
Q 2=
2∙ 200 4
Q 2=
400 4
Q 2=100 El Q 2 (o mediana) corresponde a la posición 100 de los datos organizados de menor a mayor, y este corresponde a 27 fallecidos.
Q 3=
3 ∙200 4
Q 3=
600 4
Q 3=150 El Q3 corresponde a la posición 150 de los datos organizados de menor a mayor, y este corresponde a 39 fallecidos.
Deciles 5 y 7 Dk =
kn 10
D 5=
5 ∙200 10
D 5=
1000 10
D5=100 El D5 (o mediana) corresponde a la posición 100 de los datos organizados de menor a mayor, y este corresponde a 27 fallecidos.
D 7=
7 ∙ 200 10
D 7=
1400 10
D 7=140 El D7 corresponde a la posición 140 de los datos organizados de menor a mayor, y este corresponde a 33 fallecidos.
Percentiles 25 y 50 Pk =
kn 100
P25=
25 ∙200 100
P25=
5000 100
P25=50 El P25 corresponde a la posición 50 de los datos organizados de menor a mayor, y este corresponde a 21 fallecidos.
P50=
50∙ 200 100
P50=
10000 100
P50=100 El P50 (o mediana) corresponde a la posición 100 de los datos organizados de menor a mayor, y este corresponde a 27 fallecidos.
c. Interpretar sus resultados: Se puede interpretar que:
La tendencia en el número de fallecidos en accidentes viales en Colombia correspondió a 27 muertes en el lapso de enero – febrero de 2019.
El promedio de fallecidos en accidentes viales en Colombia correspondió a 33,94 muertes en el lapso de enero – febrero de 2019.
La cantidad de fallecidos en accidentes viales en Colombia se ubican entre el intervalo de 21 a 39 muertes en la mayoría de los mucipios.
2. Medidas univariantes de dispersión. a. Para la variable elegida, se deberán calcular las medidas univariantes de dispersión: Variable cuantitativa discreta: Fallecidos Ene - Feb 2019 Rango: Mínimo=15 Máximo=371 Rango=Máximo−Mínimo Rango=371−15 Rango=356
Varianza:
( x−´x )2 ∑ S= 2
n−1
Para calcular la varianza de una muestra, se deben calcular los cuadrados de las diferencias entre el valor de cada dato con su media:
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 291,0436 1229,2036
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 291,0436 1229,2036
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 0,8836 25,6036 25,6036 122,3236 291,0436 1229,2036
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 122,3236 291,0436 2214,6436
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 122,3236 844,4836 5049,5236
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 122,3236 844,4836 5049,5236
Ahora se resuelve la fórmula: S2 =
∑ ( x−´x )2 n−1
S2 =
179818,22 200−1
S2 =
178111,28 199
S2=895,031 La varianza de la muestra corresponde a 895,031.
Desviación típica: S= √ S2 S= √ 895,031 S=29,917 fallecidos La desviación típica de la muestra corresponde a 29,917.
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 122,3236 844,4836 5049,5236
358,7236 358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 291,0436 844,4836 7931,6836
358,7236 358,7236 358,7236 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 291,0436 1229,2036 7931,6836
358,7236 358,7236 167,4436 167,4436 167,4436 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 48,1636 0,8836 0,8836 25,6036 25,6036 25,6036 291,0436 1229,2036 113609,4436
Coeficiente de variación: CV =
S ∙ 100 % X´
CV =
29,917 fallecidos ∙100 % 33,94 fallecidos
CV =0,8814 ∙ 100 % CV =88.14 % El coeficiente de variación de la muestra corresponde a 88,14%.
b. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio: RTA: Se puede concluir que:
El número de fallecidos en accidentes viales de un municipio tiende a desviarse de la media alrededor de 29,917 fallecidos, una cifra algo elevada.
Debido a la elevada desviación típica presente en la muestra de datos, el coeficiente de variación sea mayor. Esto provoca que los datos estén bastante dispersos en relación a la media.
Al haber tanta dispersión en los valores y al amplio rango, se puede establecer que es difícil definir cuantos posibles fallecidos pueda haber a futuro en un municipio.