Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados Estadísticos de posición
Views 146 Downloads 1 File size 301KB
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Estadística Descriptiva Jorge Alberto Barón Cárdenas Universidad de Córdoba Montería, Colombia 2017
15 de agosto de 2017
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
1 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Contenido 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
2 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Índice 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
3 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
La Moda (Mo) Si se tiene una distribución de frecuencias para datos agrupados, se selecciona el intervalo de clase que tiene mayor frecuencia, llamado clase modal, así: d1 ai Mo = Li + d1 + d2 d1 = ni − ni−1 d2 = ni − ni+1 Donde: Li :Es el límite inferior de la clase modal. ni : Es la frecuencia absoluta de la clase modal. ni−1 : Es la frecuencia absoluta anterior a la de la clase modal. ni+1 : Es la frecuencia absoluta posterior a la de la clase modal. ai : Es la amplitud de la clase modal. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
unicor
4 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 1.1.1 La edad de los jubilados encuestados en una determinada zona en el año 2008, esta resumida en la siguiente tabla de frecuencia para datos agrupados: Edad [50, 60) [60, 70) [70, 80) [80, 90) [90, 100)
xi 55 65 75 85 95
ni 10 18 14 6 2
Ni 10 28 42 48 50
fi 0.2 0.36 0.28 0.12 0.04
Fi 0.2 0.56 0.84 0.96 1
Determinar la moda para la anterior distribución de frecuencias.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
5 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 1.1.1 Solución: De la distribución de frecuencias dada, la clase modal es [60, 70), que es la que presenta mayor frecuencia absoluta, por lo cual tenemos que: Li = 60 ni = 18 ni−1 = 10 ni+1 = 14 ai = 10 Luego d1 = 18 − 10 = 8
unicor
d2 = 18 − 14 = 4 Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
6 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 1.1.1
Así: d1 ai d1 + d2 8 = 60 + (10) = 60 + 6.7 = 66.7 8+4
Mo =Li +
Es decir que la edad con mayor frecuencia de los jubilados encuestados es de 66.7 años.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
7 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Índice 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
8 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
La Mediana (Me) Si se tiene una distribución de frecuencias para datos agrupados, se selecciona el intervalo de clase con frecuencia absoluta acumulada (Ni ) , inmediatamente mayor a 2n , el cual es llamado clase mediana o intervalo mediano, así: ! n+1 − N i−1 2 Me = Li + ai ni Donde: Li : Es el limite inferior de la clase mediana. ni : Es la frecuencia absoluta de la clase mediana. Ni−1 : Es la frecuencia absoluta acumulada de la clase interior al de la clase mediana. ai : Es la amplitud de la clase mediana. unicor Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
9 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 1.2.1 Tomando la información del ejemplo de las edades de los jubilados, determine la mediana. solución: De la información dada tenemos que n = 50, implica que: n 50 = = 25 < 28 = N2 2 2 luego la clase mediana es [60, 70), por consiguiente: Li = 60 ni = 18 Ni−1 = 10 ai = 10 Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
10 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 1.2.1 Luego: ! − Ni−1 ai Me = Li + ni ! 50+1 25.5 − 10 2 − 10 = 60 + (10) = 60 + (10) 18 18 15.5 = 60 + (10) = 60 + 8.7 = 68.7 18 n+1 2
Es decir que el 50 % de los jubilados son menores de 68.7 años de edad aproximadamente.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
11 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Índice 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
12 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
La Media Si se tiene una distribución de frecuencias para datos agrupados, la media está dada por: h
∑ xi ni
x¯ =
i=1
n
Ejemplo: Tomando la información del ejemplo de la edad de los jubilados, tenemos que la edad promedio de los jubilados encuestados está dada por: h
∑ xi ni
x¯ =
i=1
n (55 × 10) + (65 × 18) + (75 × 14) + (85 × 6) + (95 × 2) 3470 unicor = = = 69.4 50 50
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
13 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Índice 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
14 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
El rango (R) El Rango (R): R = Lsk − Li1 Donde: Lsk : Es el límite superior de la última clase Li1 : Es el límite inferior de la primera clase Ejemplo: Tomando la información del ejemplo de la edad de los jubilados, tenemos que el rango está dado por: R = Lsk − Li1 = 100 − 50 = 50
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
15 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Índice 1
Medidas de tendencia central para datos agrupados La Moda La Mediana La Media
2
Medidas de variabilidad para datos agrupados El rango La varianza
3
Estadísticos de posición para datos agrupados
Diagrama de caja y bigotes (Box-plot) Referencias 4
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
16 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
La Varianza s2
Estadísticos de posición para datos agrupados
Para una distribución de datos agrupados tenemos: h
∑ (xi − x)¯ 2
S2 =
i=1
n−1 h
∑ xi2 ni − nx¯2
=
i=1
n−1
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
17 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
La Varianza s2
Estadísticos de posición para datos agrupados
Ejemplo: Para la información sobre la edad de los jubilados, tenemos que la varianza está dada por: h
∑ xi2 ni − nx¯2
S2 =
i=1
2n − 1 55 × 10 + 652 × 18 + 752 × 14 + 852 × 6 + 952 × 2 − 50 × 69.42 = 50 − 1 246450 − 240818 5632 = = 114.94 = 49 49
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
18 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 2.2.1
La desviación estándar: S=
√ √ S2 = 114.94 = 10.72
Coeficiente de variación: S 10.72 CV = × 100 % = × 100 % = 15.45 % x¯ 69.4 Es decir que la distribución de las edades de los jubilados presenta una dispersión moderada.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
19 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Calculo de percentiles para datos agrupados En una distribución de frecuencias para datos agrupados, el percentil Pk se calcula como: ! n×k − N i−1 ai Pk = Li + 100 ni Donde: Li : es el límite inferior del intervalo percentilico, para el cual su frecuencia k relativa acumulada (Fi ) , es el primero en cumplir la condición de que Fi > 100 . ni : es la frecuencia absoluta del intervalo percentilico. Ni−1 : es la frecuencia absoluta acumulada del intervalo percentilico. ai : es la amplitud del intervalo percentilico.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
20 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 3.1.1 Tomando la información de la edad de los jubilados encontrar el percentil 25 (P25 ). 25 k = 100 = 0.25 Por consiguiente n = 50, k = 25, 100 Luego el intervalo percentilico es el número dos debido a que es el primero en cumplir la condición. Así: Li = 60 Ni−1 = 10 ni = 18 ai = 10
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
21 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 3.1.1 Luego: P25 = Li +
n×k 100
− Ni−1 ni
50×25 100
!
− 10 = 60 + 18 2.5 = 60 + (10) 18 = 60 + 1.4
ai ! (10)
= 61.4 Significa que el 25 % de los jubilados son menores de 61.4 años. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
unicor
22 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 3.1.1 Tomando la información de la edad de los jubilados encontrar el percentil 75 (P75 ). 75 k = 100 = 0.75. Por consiguiente n = 50, k = 75, 100 Luego el intervalo percentilico es el número 3 debido a que es el primero en cumplir la condición. Así: Li = 70 Ni−1 = 28 ni = 14 ai = 10
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
23 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Ejemplo 3.1.1 Luego: P75 = Li +
n×k 100
− Ni−1 ni
50×75 100
!
− 28 = 70 + 14 9.5 = 70 + (10) 14 = 70 + 6.8
ai ! (10)
= 76.8 Significa que el 75 % de los jubilados son menores de 76.8 años. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
unicor
24 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Diagrama de caja y Bigotes (Box-plot)
Este diagrama constituye una síntesis o resumen sobre la localización, variabilidad, simetría y presencia de datos atípicos. Su sencillez lo hace útil en aquellas situaciones donde se hace necesario comparar dos o más poblaciones. Para hacerlo se requiere calcular los siguientes puntos: • Q1 : primer cuartil. • Q2 : segundo cuartil. • Q3 : tercer cuartil.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
25 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Diagrama de caja y Bigotes (Box-plot) Rango intercuartilico (RIC): RIC = Q3 − Q1 Cercos o Bigotes • Cerco interno inferior (CII)
CII = Q1 − 1.5RIC • Cerco interno superior(CIS)
CIS = Q3 + 1.5RIC
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
26 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Diagrama de caja y Bigotes (Box-plot)
Entre los cercos internos generalmente se encuentra un porcentaje alto de los datos de tal manera que los puntos que se salen de los cercos son puntos sospechosos de ser ”outlier” (puntos atípicos) unicor Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
27 / 29
Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados
Estadísticos de posición para datos agrupados
Diagrama de caja y Bigotes (Box-plot) Útiles para comparar dos conjuntos de datos en cuanto a su localización y dispersión
Los datos de la muestra 2 son más dispersos, la localización (tendencia central) unicor es la misma. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
15 de agosto de 2017
28 / 29
Bibliografía
Referencias
Referencias I
Webster, A. (2000). Estadística aplicada a los negocios y la economía. Bradley University.
Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)
unicor
15 de agosto de 2017
29 / 29