Medidas Para Datos Agrupados

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados Estadísticos de posición

Views 146 Downloads 1 File size 301KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Estadística Descriptiva Jorge Alberto Barón Cárdenas Universidad de Córdoba Montería, Colombia 2017

15 de agosto de 2017

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

1 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Contenido 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

2 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Índice 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

3 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

La Moda (Mo) Si se tiene una distribución de frecuencias para datos agrupados, se selecciona el intervalo de clase que tiene mayor frecuencia, llamado clase modal, así:   d1 ai Mo = Li + d1 + d2 d1 = ni − ni−1 d2 = ni − ni+1 Donde: Li :Es el límite inferior de la clase modal. ni : Es la frecuencia absoluta de la clase modal. ni−1 : Es la frecuencia absoluta anterior a la de la clase modal. ni+1 : Es la frecuencia absoluta posterior a la de la clase modal. ai : Es la amplitud de la clase modal. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

unicor

4 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 1.1.1 La edad de los jubilados encuestados en una determinada zona en el año 2008, esta resumida en la siguiente tabla de frecuencia para datos agrupados: Edad [50, 60) [60, 70) [70, 80) [80, 90) [90, 100)

xi 55 65 75 85 95

ni 10 18 14 6 2

Ni 10 28 42 48 50

fi 0.2 0.36 0.28 0.12 0.04

Fi 0.2 0.56 0.84 0.96 1

Determinar la moda para la anterior distribución de frecuencias.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

5 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 1.1.1 Solución: De la distribución de frecuencias dada, la clase modal es [60, 70), que es la que presenta mayor frecuencia absoluta, por lo cual tenemos que: Li = 60 ni = 18 ni−1 = 10 ni+1 = 14 ai = 10 Luego d1 = 18 − 10 = 8

unicor

d2 = 18 − 14 = 4 Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

6 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 1.1.1

Así:  d1 ai d1 + d2   8 = 60 + (10) = 60 + 6.7 = 66.7 8+4 

Mo =Li +

Es decir que la edad con mayor frecuencia de los jubilados encuestados es de 66.7 años.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

7 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Índice 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

8 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

La Mediana (Me) Si se tiene una distribución de frecuencias para datos agrupados, se selecciona el intervalo de clase con frecuencia absoluta acumulada (Ni ) , inmediatamente mayor a 2n , el cual es llamado clase mediana o intervalo mediano, así: ! n+1 − N i−1 2 Me = Li + ai ni Donde: Li : Es el limite inferior de la clase mediana. ni : Es la frecuencia absoluta de la clase mediana. Ni−1 : Es la frecuencia absoluta acumulada de la clase interior al de la clase mediana. ai : Es la amplitud de la clase mediana. unicor Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

9 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 1.2.1 Tomando la información del ejemplo de las edades de los jubilados, determine la mediana. solución: De la información dada tenemos que n = 50, implica que: n 50 = = 25 < 28 = N2 2 2 luego la clase mediana es [60, 70), por consiguiente: Li = 60 ni = 18 Ni−1 = 10 ai = 10 Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

10 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 1.2.1 Luego: ! − Ni−1 ai Me = Li + ni !   50+1 25.5 − 10 2 − 10 = 60 + (10) = 60 + (10) 18 18   15.5 = 60 + (10) = 60 + 8.7 = 68.7 18 n+1 2

Es decir que el 50 % de los jubilados son menores de 68.7 años de edad aproximadamente.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

11 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Índice 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

12 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

La Media Si se tiene una distribución de frecuencias para datos agrupados, la media está dada por: h

∑ xi ni

x¯ =

i=1

n

Ejemplo: Tomando la información del ejemplo de la edad de los jubilados, tenemos que la edad promedio de los jubilados encuestados está dada por: h

∑ xi ni

x¯ =

i=1

n (55 × 10) + (65 × 18) + (75 × 14) + (85 × 6) + (95 × 2) 3470 unicor = = = 69.4 50 50

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

13 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Índice 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

14 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

El rango (R) El Rango (R): R = Lsk − Li1 Donde: Lsk : Es el límite superior de la última clase Li1 : Es el límite inferior de la primera clase Ejemplo: Tomando la información del ejemplo de la edad de los jubilados, tenemos que el rango está dado por: R = Lsk − Li1 = 100 − 50 = 50

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

15 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Índice 1

Medidas de tendencia central para datos agrupados La Moda La Mediana La Media

2

Medidas de variabilidad para datos agrupados El rango La varianza

3

Estadísticos de posición para datos agrupados

Diagrama de caja y bigotes (Box-plot) Referencias 4

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

16 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

La Varianza s2

Estadísticos de posición para datos agrupados



Para una distribución de datos agrupados tenemos: h

∑ (xi − x)¯ 2

S2 =

i=1

n−1 h

∑ xi2 ni − nx¯2

=

i=1

n−1

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

17 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

La Varianza s2

Estadísticos de posición para datos agrupados



Ejemplo: Para la información sobre la edad de los jubilados, tenemos que la varianza está dada por: h

∑ xi2 ni − nx¯2

S2 =

i=1

 2n − 1  55 × 10 + 652 × 18 + 752 × 14 + 852 × 6 + 952 × 2 − 50 × 69.42 = 50 − 1 246450 − 240818 5632 = = 114.94 = 49 49

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

18 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 2.2.1

La desviación estándar: S=

√ √ S2 = 114.94 = 10.72

Coeficiente de variación:     S 10.72 CV = × 100 % = × 100 % = 15.45 % x¯ 69.4 Es decir que la distribución de las edades de los jubilados presenta una dispersión moderada.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

19 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Calculo de percentiles para datos agrupados En una distribución de frecuencias para datos agrupados, el percentil Pk se calcula como: ! n×k − N i−1 ai Pk = Li + 100 ni Donde: Li : es el límite inferior del intervalo percentilico, para el cual su frecuencia k relativa acumulada (Fi ) , es el primero en cumplir la condición de que Fi > 100 . ni : es la frecuencia absoluta del intervalo percentilico. Ni−1 : es la frecuencia absoluta acumulada del intervalo percentilico. ai : es la amplitud del intervalo percentilico.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

20 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 3.1.1 Tomando la información de la edad de los jubilados encontrar el percentil 25 (P25 ). 25 k = 100 = 0.25 Por consiguiente n = 50, k = 25, 100 Luego el intervalo percentilico es el número dos debido a que es el primero en cumplir la condición. Así: Li = 60 Ni−1 = 10 ni = 18 ai = 10

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

21 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 3.1.1 Luego: P25 = Li +

n×k 100

− Ni−1 ni

50×25 100

!

− 10 = 60 + 18   2.5 = 60 + (10) 18 = 60 + 1.4

ai ! (10)

= 61.4 Significa que el 25 % de los jubilados son menores de 61.4 años. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

unicor

22 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 3.1.1 Tomando la información de la edad de los jubilados encontrar el percentil 75 (P75 ). 75 k = 100 = 0.75. Por consiguiente n = 50, k = 75, 100 Luego el intervalo percentilico es el número 3 debido a que es el primero en cumplir la condición. Así: Li = 70 Ni−1 = 28 ni = 14 ai = 10

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

23 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Ejemplo 3.1.1 Luego: P75 = Li +

n×k 100

− Ni−1 ni

50×75 100

!

− 28 = 70 + 14   9.5 = 70 + (10) 14 = 70 + 6.8

ai ! (10)

= 76.8 Significa que el 75 % de los jubilados son menores de 76.8 años. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

unicor

24 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Diagrama de caja y Bigotes (Box-plot)

Este diagrama constituye una síntesis o resumen sobre la localización, variabilidad, simetría y presencia de datos atípicos. Su sencillez lo hace útil en aquellas situaciones donde se hace necesario comparar dos o más poblaciones. Para hacerlo se requiere calcular los siguientes puntos: • Q1 : primer cuartil. • Q2 : segundo cuartil. • Q3 : tercer cuartil.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

25 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Diagrama de caja y Bigotes (Box-plot) Rango intercuartilico (RIC): RIC = Q3 − Q1 Cercos o Bigotes • Cerco interno inferior (CII)

CII = Q1 − 1.5RIC • Cerco interno superior(CIS)

CIS = Q3 + 1.5RIC

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

26 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Diagrama de caja y Bigotes (Box-plot)

Entre los cercos internos generalmente se encuentra un porcentaje alto de los datos de tal manera que los puntos que se salen de los cercos son puntos sospechosos de ser ”outlier” (puntos atípicos) unicor Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

27 / 29

Medidas de tendencia central para datos agrupados Medidas de variabilidad para datos agrupados

Estadísticos de posición para datos agrupados

Diagrama de caja y Bigotes (Box-plot) Útiles para comparar dos conjuntos de datos en cuanto a su localización y dispersión

Los datos de la muestra 2 son más dispersos, la localización (tendencia central) unicor es la misma. Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

15 de agosto de 2017

28 / 29

Bibliografía

Referencias

Referencias I

Webster, A. (2000). Estadística aplicada a los negocios y la economía. Bradley University.

Jorge Alberto Barón Cárdenas (Universidad de Córdoba Montería, Estadística Colombia Descriptiva 2017)

unicor

15 de agosto de 2017

29 / 29