Estadigrafos de Tendencia Central

I. ESTADÍGRAFOS 1. ESTADÍGRAFOS DE TENDENCIA CENTRAL 1.1 MEDIA ARITMÉTICA.- La media aritmética o llamada simplemente

Views 43 Downloads 2 File size 193KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

  • Author / Uploaded
  • dcadc
Citation preview

I.

ESTADÍGRAFOS

1. ESTADÍGRAFOS DE TENDENCIA CENTRAL 1.1 MEDIA ARITMÉTICA.- La media aritmética o llamada simplemente media (mean) es la más conocida y usada. Es además la más fácil de calcular ya sea para datos agrupados o sin agrupar, hablaremos así del salario medio, numero medio de pulsaciones por minuto, rendimiento medio de una máquina, etc... 1.1.1 Definición (datos no tabulados).- la media o promedio de una muestra x1 , x2 ,..., xn de tamaño n de una variable o característica x se denota como x o M  x  y se define como la suma de todos los valores observados en la muestra entre el número total de observaciones  n  . Es decir: n

x  x , ...  xn  x  M  x  1 2  i 1 n n

xi

Ejemplo.- Un técnico dental independiente gana un mes 800 soles, un segundo mes 950 soles y un tercer mes 1250 soles. ¿Cuánto gana en promedio mensual? 800  950  1250  1000 En este caso aplicando directamente la formula tenemos: x  3 Aunque en ninguno de estos meses gano exactamente 1000 soles podríamos interpretar este valor como que “la persona debe de esperar ganar 1000 soles mensualmente” 1.1.2

Definición (datos tabulados).- la media o promedio de una variable que a sido clasificada en m clases en una tabla de frecuencias esta definida por: m

y n  y n , ...  ym xm y  M  y  1 1 2 2  n

 yi ni i 1 m

n i 1

m



yn

i i

i 1

n

i

O equivalentemente: m

y  M  y    hi ni i 1

Donde: yi = i-ésima marca de clase i  1, 2,3,....m ni  Frecuencia absoluta de la i-ésima característica

hi  Frecuencia relativa de la i-ésima característica OBSERVACIONES: i. Cuando los datos tabulados son discretos la media de los datos originales (sin agrupar) coincide exactamente con la media de los datos agrupados (en la tabla de frecuencias) en este caso no hay perdida de información, es decir:

x  M  x  y  M  y  ii.

Cuando los datos tabulados son continuos (o han sido agrupados en intervalos) hay una pérdida de información con respecto a los datos originales, el grado de pérdida será mínimo cuando los datos estén uniformemente distribuidos o en caso que las clases (intervalos) no sean muy amplias. En general diremos: x  M  x  y  M  y  Ejemplo.- Calcular la media aritmética de los datos agrupados en la siguiente tabla 2.1 TABLA 2.1 Distribución de frecuencias de números de hijos por familia

yi 0 1 2 3 4 total

ni 3 4 8 6 2 23

yi ni 0 4 16 18 8 46

hi

yi hi

m

yn

i i

46 2 n 23 Así el número promedio de hijos por familia es aproximadamente familia.

Aplicando la formula tenemos: y  M  y  

1.1.3

i 1



2 hijos por

MEDIA DE LA POBLACIÓN.- La media aritmética de una población finita de N elementos x1 , x2 ,..., xN , se denota por  y se define por: N

xi x1  x2 , ...  xN  i 1   N N

1.1.4

Algunas propiedades de la media aritmética: a. Si Todos los valores observados son iguales entre si e iguales a una constante b entonces: M  x   M b   b b. CAMBIO DE ESCALA.- Si a cada xi se le multiplica por una constante a y se le suma una constante b, la media aritmética del nuevo conjunto transformado yi  axi  b será:

y  M  y   a.M  x   b  ax  b, a, b  c. La suma algebraica de las desviaciones de una variable con respecto a su media es cero, es decir:

n

 x  x   0 i

i 1

d. Equivalentemente para datos tabulados: m

n  y  y  0 i 1

i

i

e. Si son dos conjuntos x1 , x2 ,..., xn , v1 , v2 ,..., vn de observaciones de n valores cada uno, donde x y v están expresados en las mismas variables entonces: M  x  v  M  x   M v  1.1.5

1.1.6

Ventajas de la media aritmética.- las principales son: a. Es un concepto intuitivo y muy familiar. b. Es fácil de calcular y el valor obtenido es único. c. Son tomados en cuenta los valores de todas las observaciones del conjunto de datos. Desventajas.- Debemos estar consientes de: a. La media puede ser afectado por valores extraños o atípicos (extremos) que no son representativos del comportamiento de la variable. b. No se puede calcular la media para un conjunto de datos agrupados en intervalos donde el último intervalo no tiene límite superior.

1.2 LA MEDIANA.-Dado un conjunto de n observaciones x1 , x2 ,..., xn , de la variable o característica x, se define a la mediana (Median) como aquel valor que no es superado ni supera a más de la mitad de las n observaciones, ordenadas en magnitud creciente o decreciente. La mediana la denotaremos indistintamente como: x, xme , Me, Me  x 

1.2.1

CALCULO DE LA MEDIANA PARA DATOS NO TABULADOS: a. Numero de observaciones impar, en este caso basta ordenar los datos en magnitud creciente x1 , x 2 ,..., x n (es decir x1  x 2 ,...,  x n ) y tomar como valor de la mediana el valor que ocupa la posición central. Es decir:

Me  x   xn1 / 2

Ejemplo: Suponga que el número de alumnos por salón de un colegio son: 35, 38,40, 37, 39, 25, 42, 41, 24. Hallar la mediana de este conjunto de datos. Solución:

b. Si el número de observaciones es par, en este caso, después de ordenado los datos, existen dos valores centrales

x n / 2 y xn /21 en este caso se toma

como mediana la semisuma de ambos valores. Es decir:

Me  x  

x n / 2  xn / 21 2

Ejemplo: Suponiendo que se considerara un nuevo salón de 28 alumnos adicional en el ejemplo anterior Hallar la mediana de este nuevo conjunto de datos. Solución:

1.2.2

CALCULO DE LA MEDIANA PARA DATOS TABULADOS: Cuando los datos están agrupados en una tabla de frecuencias se seguirán las siguientes pautas: a. VARIABLE DISCRETA.i. Se construye la tabla de distribución de frecuencias acumuladas “menor que” ( N i ) ii. Se determina la menor frecuencia absoluta acumulada N j que supera a n/2. Es decir:

n  N j , tomar La mediana según los 2

conceptos anteriores. b. VARIABLE CONTINUA O DATOS AGRUPADOS EN INTERVALOSen este caso el problema consiste en determinar un punto dentro del intervalo en que esta comprendida la mediana. Procedimiento: n i. Calcular la posición de orden . Como la variable es 2 continua no nos preocupamos si n es par o impar. ii. Por las frecuencias acumuladas se identifica a la clase que contiene a la mediana, esto es la clase para la cual se cumple: n N J 1   N J 2 Con lo cual la mediana estará en la clase que tiene como frecuencia acumulada N J iii.

Utilizar la formula:  n   2  N J 1  Me  Li  c j    N J  N J 1   

Donde: Li = limite inferior de la clase mediana c j = amplitud de la clase mediana

N J = frecuencia absoluta acumulada de la clase mediana

n = numero de observaciones EJEMPLO: 1. El numero de pasajeros por automóvil trasportados por una empresas de taxi se da a continuación en la siguiente tabla: Núm. De Casos pasajeros 1 10 2 15 3 12 4 3 total Hallar la mediana para esta variable. Sol.

2. Una empresa decide aplicar un test para evaluar a sus empleados. Los resultados son resumidos en la siguiente tabla de frecuencias: Puntuaciones Núm. De yi yi .ni empleados (ni) 94 15 0,30

30,50

140

40

50,70

160

60

70,90

98

80

90,100 total

8

95

500 Determinar la mediana. Sol.

1.2.3

Ventajas de la mediana.a. La mediana es fácil de entender y puede ser calculada a partir de cualquier clase de datos; aun para datos agrupados en clases abiertas en los extremos salvo claro que la mediana caiga justo en la clase de extremo abierta. b. La mediana esta afectada por el número de observaciones y no por la magnitud de cualquier valor extremo. c. Se puede encontrar la mediana incluso de datos cualitativos ordinal.

1.2.4

Desventajas de la mediana.a. Se deben organizar los datos antes de realizar algún cálculo para determinar la mediana. b. Algunos procedimientos en la estadística inferencial son más complicados cuando se usa la mediana en caso de la media.

1.3 LA MODA.- La moda es el valor que aparece con más frecuencia en un conjunto de datos, la denotaremos como " Mo " o " xmo " La moda es especialmente útil para encontrar el punto central de un grupo de datos de tipo nominal u ordinal. y en consecuencia, en una distribución de frecuencias, es el valor de la variable que viene afectada por la máxima frecuencia de la distribución. En distribuciones no agrupadas en intervalos se observa la columna de las frecuencias absolutas, y el valor de la distribución al que corresponde la mayor frecuencia será la moda. A veces aparecen distribuciones de variables con más de una moda (bimodales, trimodales, etc.)

Calculo de la moda en el caso de datos agrupados en intervalos de clase: i. ii.

Se identifica la clase modal (la clase de mayor frecuencia absoluta simple) Se aplica la formula:

 1  Moi  Li  c j    1   2  Donde: Li= limite inferior de la clase modal 1  n j  n j 1  2  n j  n j 1

n j  frecuencia absoluta de la clase modal n j 1  frecuencia absoluta de la clase pre modal n j 1  frecuencia absoluta de la clase pos modal c j = amplitud de la clase modal

Algunas características de la moda son: a. Se puede determinar la moda en grupos de datos de todos los niveles (nominales, ordinales, y cuantitativas). b. Puede existir más de una moda para cada grupo de datos. c. A la moda no le afectan valores extremadamente grandes ni extremadamente pequeños, por eso es especialmente útil cuando se tienen estos valores. d. La moda se emplea sobre todo cuando los valores de la variable presentan una gran concentraci6n hacia un valor determinado. Sólo se utilizará en distribuciones de gran frecuencia total.

Emplo1 calcular la moda para el ejemplo anterior:

Una empresa decide aplicar un test para evaluar a sus empleados. Los resultados son resumidos en la siguiente tabla de frecuencias: Puntuaciones

0,30

Núm. De empleados 94

30,50

140

50,70

160

70,90

98

90,100

8