Medidas de tendencia Central

Medidas de tendencia central En estadística, a la palabra promedio se le conoce como media aritmética. Calcular la me

Views 199 Downloads 4 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Medidas de tendencia central

En estadística, a la palabra promedio se le conoce como media aritmética. Calcular la media aritmética para pocos datos es cosa sencilla, pero se complica cuando el número de datos se incrementa considerablemente.

El total de dinero que debe recibir Juan es: 564 x 22 = 12408 pesos

Si el cálculo se realiza sobre datos muestrales, a los resultados se les conoce como estadísticos. Si los cálculos se realizan sobre toda la población, se les conoce como parámetros.

Imagina que un panadero quiere saber si sus conchas tienen el tamaño adecuado de acuerdo al precio que cobra por ellas. Tomó 8 conchas de un lote de 50 y pesó cada una por separado.

Calculando promedios

El peso en gramos de cada concha fue: 50, 52, 58, 56, 48, 62, 39 y 42 kilos.

¿Cuál fue el promedio del peso de los 6 cerdos de Juan? El promedio del peso de los 6 cerdos es: 564/6=94, es Antes de iniciar con la descripción de las fórmulas decir 94 kilogramos. que se utilizan para el cálculo de las medidas de tendencia central y de dispersión, es conveniente recordar que en estadística se trabaja con dos Media Aritmética conjuntos: población y muestra.

Juan es un productor de cerdos, piensa vender 6 de ellos a un comprador que le ofrece $10,000 pesos por los 6 cerdos pero el comprador no está dispuesto a pesarlos; dice que si los pesan, seguramente le pagará menos dinero a Juan porque el kilo de cerdo está en 22 pesos. Juan le pide que lo espere dos días mientras se decide.

Dado un conjunto de datos X1, X2, . . . , XN, _

se define la media aritmética muestral X de ese conjunto de datos como: X=

∑( x)

n El símbolo Σ se lee 'sumatoria de' y significa que lo que esté enfrente se debe de sumar.

Juan piensa que criar a 6 cerdos no es tan sencillo y no quiere entregarlos sin obtener una ganancia. Tan � pronto se fue el comprador de cerdos, Juan pesó a De la misma manera, se define la media aritmética los 6 animales, obteniendo los siguientes registros: poblacional µ como: 87, 96, 102, 81, 93 y 105 kilos. ∑( x) µ= N ¿Debe aceptar Juan el trato? _ No, porque la suma del peso de los cerdos es: 564 La media aritmética X se emplea cuando kilogramos. estamos hablando de muestras, y la media aritmética µ cuando�estamos estudiando poblaciones. Otra ¿Cuánto dinero pierde o gana Juan si acepta el trato distinción es la n minúscula para muestras y N del vendedor? mayúscula para poblaciones.

Tabla 1

Los valores para nuestro conjunto de datos son el peso de cada concha son: X1=50 X2=52, X3=58, X4= 56, X5=48, X6=62, X7=39, y X8= 42 Sustituyendo en la fórmula obtenemos: X=

∑( X ) N

=

50 + 52 + 58 + 56 + 48 + 62 + 39 + 42 407 = = 50.87 8 8

Es decir, el peso promedio de las conchas es 50.87 gramos.¿Notaste que hubo una pieza de pan que pesó más de 60 gramos y otra que pesó menos de 40?, ¿qué piensas? En los ejemplos anteriores, calculamos la media aritmética de pocos datos que, además, no estaban organizados. Cuando los datos están organizados en una distribución de frecuencias simple o de intervalos, la media aritmética se calcula con la expresión:

3

2

6

5

7

7

10

9

6

0

4

5

6

8

8

8

10

4

50

0 20 35 48 70 64 54 40

337

� X=

n

∑ f ⋅ X = 337 = 6.74 50

n

Cuando � los datos están agrupados en clases, como en la tabla 2, la media aritmética se calcula con la misma expresión, sólo que ahora “x” representa la marca de clase.

Ejemplo : Si consideramos la siguiente distribución de frecuencias para calcular la media aritmética de los datos, primero se calcula la columna f ⋅ x ; cuando se tiene completa la columna, se suma (como lo indica la fórmula) y éste resultado se divide entre N, que es el número total de observaciones o datos.

fx

En la tabla 1 se observa que ∑ fX = 337 y que N = 50. Por lo tanto, la media aritmética del conjunto de observaciones es:

∑( f ⋅ x) x= f ⋅ x es el producto de cada En donde, � el término valor multiplicado por su respectiva frecuencia y el símbolo Σ (sumatoria) significa que se deben sumar estos productos, veamos cómo funciona.

Frecuencia f

Calificación x

X=



∑f ⋅x n

Tabla 2 Clases 42-46

Valor medio x 44

47-51

49

57-61

59

67-71

69

frecuencia f 2 9

31

54

52-56 62-66

64

72-76

74

50 51 30 7

180

En la tabla 2 se observa que la suma y que N = 180.

fx 88

441

2950 3264 2070

5,5,6,7,7,7,7,7,8,9,10,11,11,12, el número que más se repite es el 7 ya que aparece 5 veces. En este caso decimos que la moda de este conjunto de datos es Mo = 7.

518

En estadística, la moda (Mo) es una medida de tendencia central que se define como aquel valor que tiene la frecuencia mayor (es decir, el dato que más se repite).

11005

∑ f ⋅ X = 11005

∑ fx = 11005 = 61.14 n

Por ejemplo, en el conjunto:

1674

Por tanto, la media aritmética de los datos de la � tabla 2 es: X=

Una respuesta puede ser: que lo que está de moda es lo que más prefiere la gente; mientras que lo que ya pasó de moda puede ser algo que se usó pero que actualmente ya no se usa. ¿Se te ocurre algo más?

180

Ahora que ya hemos estudiado la media aritmética, que� es uno de los parámetros más útiles de la estadística, vamos a revisar la moda.

La moda ¿A qué te suena la palabra 'moda'? Ésta se usa normalmente para referirnos a lo que la gente usa: vestidos, pantalones, bolsos, gorras, lentes o cualquier otro accesorio. Entonces, ¿qué es la moda?, ¿es una forma de vestir?, ¿cuándo se considera que algo está de moda o que ya pasó de moda?

Veamos la siguiente distribución de frecuencias:

Clases 42-46

Valor medio x 44

47-51

49

57-61

59

67-71

69

52-56

54

62-66

64

72-76

74

frecuencia f 2 9

31 50 51 30 7

180

fx 88

441

1674 2950 3264 2070 518

11005

La clase con la frecuencia mayor es 62-66 con f = 51. Sin embargo, nota que la clase 57 – 61 tiene una frecuencia f = 50. En este caso, se pueden considerar dos modas.

En distribuciones de frecuencias con intervalos, la moda es la marca de clase con la mayor frecuencia por lo que, si consideramos las dos modas: Mo1 = 59 y Mo2 = 64 Es importante notar que una distribución puede tener más de una moda, como en el ejemplo anterior, o puede no tener moda. Cuando un conjunto de datos no tiene moda significa que ningún dato u observación se está presentando más que los demás de manera significativa. Si recordamos el peso de las conchas del panadero: 50, 52, 58, 56, 48, 62, 39 y 42, ningún dato aparece más que los demás. Por lo tanto, este conjunto de datos no tiene moda. Sencillo, ¿no? A diferencia de la moda, el cálculo de la tercera medida de tendencia central, la mediana, es un poco más complicado... pero sólo un poco, así que no hay de qué preocuparse.

Una consideración importante para la determinación de la mediana es que los datos deben estar ordenados por magnitud; en nuestro curso del menor al mayor. Es necesario distinguir cuando tenemos: 1) un número impar de datos 2) cuando tenemos un número par. 1) Cuando el tamaño de la muestra es impar, la mediana es la observación que ocupa el lugar n + 1 2 , veamos el siguiente ejemplo: Encontrar la mediana para el siguiente conjunto de datos: � 40

La observación o dato que ocupe la posición será la mediana. n +1 Mediana = 2



60

62

70

90

7 +1 8 = =4 2 2

40

Dado un conjunto de datos, la mediana se define como el valor tal, que abajo � de él se encuentra el 50% del total de datos, y arriba de él otro 50%. (Exacto, es el dato que se encuentra en medio)

52

Como tenemos 7 datos, la mediana es el dato que ocupa la posición

La mediana La mediana (Mdn) es la última de las medidas de tendencia central que analizaremos. ¿Alguna idea del significado de la mediana? Suena a que es algo que esta en medio ¿o no?

50



50

52

60

62

70

90

Posición 1 Posición 2 Posición 3 Posición 4

Concluimos que la mediana del conjunto de datos es mdn = 60 . 2) Si el conjunto tiene un número par de datos que están ordenados por su magnitud, entonces la mediana es la media aritmética de los valores centrales. Para el conjunto

n+1 2

27

30

31

34

40

Valores centrales

41

54

el número total de datos es par (8 datos) cuyos valores centrales son 34 y 40, por lo que la mediana será la media aritmética de 34 y 40, esto es: X=

34 + 40 74 = = 37 2 2

Con el propósito de visualizar el dato que ocupa la � posición 25.5 en nuestra distribución de frecuencias simple, a continuación se muestra nuevamente la tabla agregando la columna de la frecuencia acumulada:

Por�lo tanto, el valor de la mediana es mdn = 37 . Los cálculos anteriores sirven para datos no agrupados. Cuando los datos están agrupados ya sea en una distribución de frecuencias simple o en una distribución de frecuencias con intervalos, el procedimiento es algo distinto.

Mediana de un conjunto de datos en una distribución de frecuencia simple La posición de la mediana la determinamos n +1 nuevamente con la fórmula . 2 Tomemos como ejemplo la distribución frecuencias simple de la tabla siguiente. �

Calificación x

Frecuencia f

3

2

2 4 5 6

0 5 7 8

7

10

9

6

8 10

8 4

50

Como N=50, la mediana será el valor que ocupa el lugar 50 + 1 = 25.5 2

de

Calificación x 2 3 4

5 6 7 8 9

10

Frecuencia f 0 2 5

7 8

10 8 6 4

50

Frecuencia acumulada 0 2

7 Los diez datos iguales a 7, ocupan desde la posición 23 a la 32. 14 22 32 40 46 50

En la tabla se señala que hay 10 valores iguales a 7, que ocupan desde la posición 23 a la 32, por lo que la mediana es: Mdn=7 Lo anterior es debido a que el lugar 25.5 se encuentra entre la posición 23 y la 32. ¿Por qué si hay un número par de datos no se calculó la media aritmética de los valores centrales? Porque en este caso, los dos valores centrales son ambos el número 7 y al calcular la media aritmética sigue siendo 7.

Mediana de un conjunto de datos en una distribución de frecuencia con intervalos

Tabla 4 Clases

Valor medio x

El cálculo de la mediana en una distribución de frecuencias con intervalos implica una serie de pasos que se describen a continuación:

42-46

44

1. Determina la clase que contiene a la mediana. Esto se llama clase de la mediana y es la que contiene el valor que ocupa el lugar , en donde N es el número total de datos.

57-61

2. Calcula la frecuencia acumulada que corresponde a la clase inmediata inferior a la clase de la mediana.

47-51 52-56 62-66 67-71 72-76

49 54 59 64 69 74

frecuencia f 2 9

31 50

fa 2

11

42 92

51

143

7

180

30 n=180

173

Datos de la posición

1 al 2

3 al 11

12 al 42 43 al 92

93 al 143

3. Determina la frecuencia de la clase de la mediana.

1. Lo primero es determinar la clase de la mediana.

4. Determina el ancho de la clase.

Calcula

5. Determina el límite inferior de la clase de la mediana. 6. Aplica la fórmula: n − fa Mdn = L + 2 ×i f En donde: � L = Límite inferior de la clase de la mediana. N = número total de datos. fa = frecuencia acumulada en la clase inmediata inferior a la clase de la mediana. f = frecuencia en la clase de la mediana. i = la longitud del intervalo o clase de la mediana. Utilizaremos la tabla 4 para calcular la mediana aplicando los pasos indicados.

n 180 = = 90 2 2 Como � la clase de la mediana es la clase que contiene el dato que ocupe la posición 90, en este caso la clase de la mediana es 57 – 61, porque en esa clase se encuentra el dato que ocupa la posición 90. En la última columna de la tabla se indica que los datos de esta clase van desde el dato en la posición 43 hasta el dato en la posición 92. 2. Luego se necesita determinar la frecuencia acumulada (fa) de la clase inmediata inferior a la clase de la mediana. Esto se puede determinar inspeccionando la tabla (la cual ya incluye la frecuencia acumulada).

Clase inmediata inferior Clase de la mediana

Clases

Valor medio x

42-46

44

frecuencia f 2

52-56

54

31

42

64

51

143

7

180

47-51 57-61 62-66 67-71 72-76

49 59 69 74

9

50 30 180

fa 2

11

92

La media ponderada y la media geométrica Existen, además de la media aritmética, la media ponderada y la media geométrica que son muy útiles en situaciones específicas. La siguiente tabla muestra la fórmula que se utiliza para calcularlas. Se incluye también la media aritmética para tenerla de referencia. Fórmula

173

Esto es, el valor de fa es 42. 3. Determinar la frecuencia de la clase de la mediana. La frecuencia de la clase de la mediana es f=50 4. El ancho de la clase es 61-56=5, por lo que i=5. 5. Hallar el límite inferior de la clase de la mediana. Éste número es L=57. 6. Ahora sólo falta sustituir los valores encontrados en la fórmula.

∑X

Media Aritmética

X=

Media Ponderada

XW =

� Media Geométrica

n

∑ XW ∑W

n MG = X1 X 2 X 3  X n

� � es utilizada cuando, al calcular La media ponderada un promedio, algunos de los datos a considerar tienen un peso mayor que los demás, vamos a ver de qué se trata. Ayudando a Raúl a calcular su promedio: Raúl estudia bachillerato en la UVEG y en las políticas de uno de sus cursos, se le informó que la forma de evaluarlo sería la siguiente: Rubro

Ponderación

Promedios parciales

40%

Examen Final

50%

Trabajo final

10%

Si Raúl obtuvo un promedio parcial de 83, 75 en su examen final y 92 en el trabajo final, ¿cuál es la calificación que aparecerá en la boleta de Raúl?

Para resolver el problema de Raúl, debemos tomar en cuenta que las calificaciones no tienen el mismo peso, es decir, el examen final es la calificación con el mayor peso en la calificación (50%) mientras que el trabajo final es la de menor peso (10%). Por ello, para calcular la media ponderada es necesario incluir dos columnas más: la columna peso (W) y la columna del producto XW. Rubro

Peso (w)

Calificación 83

4

332

Examen Final

75

5

375

Trabajo final

92

1

92

∑W = 10 ∑ XW = 799 Si ahora sustituimos �el valor de �∑W y la fórmula obtenemos:

∑ XW

en

∑ XW � ∑W

X W =�

799 XW = = 79.9 10 Raúl tiene una calificación final de 79.9 � La media ponderada es utilizada cuando, al calcular un promedio, algunos de los datos a considerar tienen un “peso mayor” que los demás. XW =



∑ XW ∑W

Tienda de abarrotes La Veracruzana La tienda de abarrotes La Veracruzana vende cuatro diferentes tipos de escobas, algunas de ellas le dan a ganar más que otras. La siguiente tabla muestra la utilidad de cada escoba y el número de escobas vendidas.

xw

Promedios parciales

Sin embargo, la media ponderada no se utiliza sólo para obtener promedios, veamos el siguiente ejemplo:

Marca de Escoba

Utilidad en pesos por escoba (X)

Limpia todo

$3.0

Número de escobas vendidas en un mes (w) 7

Plasti-limpia

$2.4

6

14.4

Escobón

$5.2

12

62.4

D’zacate

$7.4

4

29.6

$18

XW 21.0

∑W = 29 ∑ XW = 127.4

• Nota: Se puede calcular la media de las utilidades dividiendo la � � de marcas de escoba, esto suma de las utilidades entre el número es, 18/4=4.5. Este resultado no es completamente cierto porque vende más escobas de una marca que de otras.

La media ponderada es: 127.4 29 X W = 4.393 XW =

Esto significa que la utilidad promedio de La � Veracruzana, en la venta de sus escobas es de $4.393 pesos.

Eduardo y sus quesos Eduardo Negrete es un conocido empresario del estado de Hidalgo y productor de quesos, que destina gran parte de sus ingresos en campañas publicitarias para incrementar sus utilidades. Quiere determinar la tasa promedio de aumento de sus ingresos de los últimos 5 años y evaluar si continúa o no con la misma compañía de publicidad. La tasa promedio del estado de Hidalgo es del 13%. La siguiente tabla muestra los ingresos de la empresa de Eduardo de los últimos 5 años: Año

Ingreso en pesos

2002

$142,000

2003

152000

2004

165000

2005

182000

2006

203000

Año

Ingreso en pesos

2002

$142,000

2003

152000

1.070

2004

165000

1.105

2005

182000

1.327

2006

203000

1.174

Porcentaje

Estos resultados se sustituyen en la fórmula para calcular la media geométrica (MG) ǡ Žƒ …—žŽ se determina calculando la enésima raíz del producto de n números mediante la fórmula: n MG = X1 X 2 X 3  X n

Sustituyendo tenemos: � MG = 4 (1.070)(1.105)(1.327)(1.174 ) = 1.1649

Para calcular la media geométricaǡ es necesario � calcular primero el porcentaje de aumento de los ingreso por cada año. En otras palabras ¿qué incremento tuvieron los ingresos de 2002 a 2003? Este incremento se calcula dividiendo el ingreso del año 2003 entre el ingreso del año 2002, es decir: 152000/142000=1.07

Lo anterior significa que el incremento promedio porcentual de los ingresos de Eduardo es 0.1649 (o 16.49%). ¿Cuál hubiese sido el resultado si se hubiera utilizado la media aritmética? Observa:

X=

1.070 + 1.105 + 1.327 + 1.174 = 1.169 4

Lo anterior significa que el incremento fue de 0.07 o del 7%. De la misma manera se calculan los demás El error o diferencia entre los resultados parece no incrementos. Los resultados de los cálculos se� ser significativo. Antes de llegar a una conclusión al respecto, analiza la siguiente tabla que compara muestran en la siguiente tabla: ambos resultados.

Usando

X

Usando

XM

142000x1.169=165998

142000x1.1649=165415

165998x1.169=194051

1655415x1.1649=192691





164862x1.169=226845

192691x1.1649=224465

226845x1.169=265181

224465x1.1649=261479≈262000

265181 es mayor que 262000.

261479 es prácticamente igual que 262000.

En este ejemplo viste la forma de calcular la media geométrica y queda de manifiesto que, en ocasiones es más apropiado utilizarla que la media aritmética. Por último, debido a que el incremento promedio porcentual de los ingresos de Eduardo es de 16.49% y es superior al promedio estatal (13%), Eduardo ha decidido no cambiar de compañía de publicidad.

La media geométrica (MG) es muy recurrida en economía y negocios pues muestra los cambios en porcentaje de una serie de números positivos, por ejemplo: el cambio porcentual en ventas, en ingresos, en utilidades, entre otros. Se determina calculando la enésima raíz del producto de n números mediante la fórmula: n MG = X1 X 2 X 3  X n



Comparación entre media, mediana y moda. De las medidas de tendencia central, la media es la de uso más común ya que su manipulación e interpretación es más sencilla. Desafortunadamente, la media se ve afectada por valores extremos. Para el conjunto de datos 3, 5, 8, 12, 17, 18, la media es 10.5 y la mediana es 10. Ambos representa de buena manera al conjunto de datos. Sin embargo, si cambiamos el 18 por un 68, por ejemplo, la media es 18.83 mientras que la mediana sigue siendo 10. Debido a que el valor de la mediana no cambia con el valor extremo, representa de mejor forma al conjunto de datos. Por otro lado, el inconveniente de la moda es que en ocasiones no existe y cuando hay más de una moda su existencia puede no ser de gran ayuda. El anterior análisis no significa que una medida de tendencia central sea mejor que la otra, sólo invita a utilizar la más adecuada para un conjunto de datos en específico.