UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES Dra. Sara Adelin
Views 75 Downloads 0 File size 996KB
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
BIOESTADISTICA MODULO: ESTADIGRAFOS
SARA ADELINA ARANA LOPEZ
LIMA, 2014
RESEÑA HISTORICA Dra. SARA ADELINA ARANA LOPEZ
LIMA, 2017
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
MEDIDAS DE TENDENCIA O ESTADÍGRAFOS
INTRODUCION
Para describir un conjunto de datos, además de la tabulación y la representación gráfica, se utilizan valores numéricos de funciones de la variable, llamadas medidas de resumen, o estadísticos. Son valores únicos que representan al conjunto de los datos observados de la variable, también llamadas medidas de Resumen, porque resumen en un solo valor a todo el conjunto de valores de las observaciones, representando a toda la muestra que es el objeto de estudio, para su análisis y posterior estimación a toda la población. Se clasifican en:
Si, según Montaigne, ‘‘para juzgar cosas grandes y nobles, es necesario poseer un alma igual de grande y noble’’(*), para juzgar un artículo científico escrito por un colega es necesario poseer, además, conocimientos, experiencia, imparcialidad, confidencialidad, diligencia, una cierta dosis de pedagogía y otra no menos esencial de compañerismo (**).
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
1. MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA, MODA, CUARTILES Las medidas de tendencia central tienden a ubicarse en el centro de la información (de los valores de las observaciones de la variable), solo en algunos casos estas medidas coinciden juntas en el centro de los datos. Considerando que solo la mediana y el cuartil dos siempre van a ubicarse en el centro de los valores observados (acumulando el 50% de información en cada caso) Se clasifican en:
1.1. MEDIA ARITMETICA O PROMEDIO ARITMETICO Es el estadígrafo o medida de resumen más importante de la estadística. Es el único valor que representa a todo el conjunto de datos (valores) observados de una variable, denominado como el promedio aritmético de las observaciones de la variable elegida de la muestra para el estudio Se obtiene: sumando todos los valores de las observaciones y luego se divide entre el número total de observaciones (n) Se denota: n
X
x i 1
n
i
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Donde:
X:
Media o promedio aritmético: se lee X - barra
xi :
Valores de las observaciones
n:
Tamaño de la muestra
1.1.1. Casos 1.1.1.1. Caso no agrupado: n
X
x i 1
i
n
Ejemplo: El gerente de una empresa que se dedica a la fabricación de gelatina, desea adquirir una máquina para el llenado de bolsas de aproximadamente 200 gramos. Debe decidir en adquirir una de dos máquinas que le ofrecen, en igualdad de condiciones de costes, aunque que no está convencido de la precisión de las máquinas, para elegir una se realizan 6 prueba con cada máquina y se obtienen los resultados siguientes:
(Pesos gr)
Maq. A
195
198
1199
1197
1199
200
Maq. B
199
200
200
200
198
201
a. ¿Cuál será el peso promedio de bolsas obtenido de las máquinas? b. ¿Cuál es el peso promedio de las dos máquinas juntas? c. ¿Qué maquina elige el gerente de la empresa? SOLUCION a. Promedio de las maquinas
MAQUINA A: n
X
x i 1
n
i
195 198 199 197 199 200 1188 198 6 6
La máquina A empaca en promedio 198 gramos de gelatina en cada bolsa
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
MAQUINA B: n
X
x i 1
i
n
199 200 200 200 198 200 1197 199.5 n6 6
La máquina B empaca en promedio 199.5 gramos de gelatina b. Promedio de las maquinas juntas n
X
x i 1
i
n
195 198 199 197 199 200 199 200 200 200 198 200 2385 198.75 12 12
el promedio de empaque de las dos máquinas juntas es de 198.75 gramos de gelatina. El gerente de la fábrica elige la maquina B, por hacer un empacado en cada bolsa de gelatina de 199.5 gramos. 1.1.1.2. CASO AGRUPADO: A diferencia del caso no agrupado, en este ítem, los valores de las observaciones de la variable se agrupan y se muestra en consolidados de los datos, en tablas estadísticas, las se presentan en dos casos: 1.1.1.2.1. CASO DISCRETO n
X
x i 1
i
fi
n
Donde:
X : Media o promedio aritmético: se lee X - barra xi : Valores de las observaciones
n : Tamaño de la muestra f i : Frecuencia Ejemplo: Un estudio realizado por una institución de salud para conocer el nivel de plomo en la sangre de Mujeres del Distrito de Morococha del depto. de Junín, están interesado en conocer el numero de hijos
por mujer, para lo cual,
seleccionan una muestra de 34 mujeres, los datos se registran en la siguiente tabla.
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Tabla Nº: Mujeres del Distrito de Morococha del Dpto. de Junín según número de hijos por mujer n
Nº de hijos
Frecuencias
X
x
i
i 1
n
0
4
0*(4) = 0
1
6
1*(6) = 6
2
11
2*(11) = 22
3
9
3*(9) = 27
4
0
4*(0) = 0
5
4
5*(4) = 20
34
75
Total
fi
Fuente: elaboración propia n
X
x i 1
i
fi
n 0 * ( 4) 1 * (6) 2 * (11) 3 * (9) 4 * (0) 5 * ( 4) 75 2.21 34 12
el promedio de hijos por mujer es de 2.21 hijos
1.1.1.2.2. Caso Continuo n
X
m
i
i 1
fi
n
Donde:
X : Media o promedio aritmético: se lee X - barra mi : Punto medio o marca de clase (Valores de las observaciones)
n : Tamaño de la muestra f i : Frecuencia
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Ejemplo: Tabla Nº: Mujeres del Distrito de Morococha del Dpto. de de Junín según grupo etáreo (edad) n
Edad
m
Punto Medio O Marca de Clase :MJ
fi
I1 = 15 – 21
18
3
18 * (3) = 54
I2 = 21 – 27
24
15
24 * (15) = 360
I3 = 27 – 33
30
8
30 * (8) = 240
I4 = 33 – 39
26
3
26 *(3) = 78
I5 = 39 – 45
42
4
42 * (4) = 168
I6 = 45 – 51
48
1
48 * (1) = 48
34
984 / 34 = 28.94
TOTAL
X
i
i 1
fi
n
Fuente: elaboración propia
El promedio de edad de las mujeres de Morococha es 28.94 años, la edad mínima es de 15 años y la edad máxima es de 51 años. 2. MEDIANA o VALOR MEDIO Es el valor central de un conjunto finito de observaciones; la mediana divide al conjunto en dos partes exactamente iguales, 50% a la derecha y 50% a la izquierda.
50%
50% Mediana
Se denota por: Med.
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
2.1. Casos
2.1.1. CASO NO AGRUPADO: Procedimiento: a. Las observaciones se ordenan de menor a mayor b. Se determina si el conjunto de datos es conjunto par o impar c. Ubicar los valores centrales del conjunto de datos
i.
Conjunto par: La mediana se halla sumando los dos valores centrales y se divide por dos
Med
ii. iii.
Suma de dos valores centrales 2
Conjunto impar: Se determina la mediana Med
n1 2
d. Se procede a calcular la mediana Ejemplo: Los siguientes datos corresponden a los números de hijos de 12 mujeres 5 0 3 2 0 3 2 2 1 3 1 2 3 Solución a. Ordenar los datos de menor a mayor 0
1
0
1
2
1
2
2
1
2
50%
b. El conjunto de datos es par c. Los valores centrales son el 2,3 d. Calculara la mediana:
3
2
3
3
2
4
5
3
5
3 3 4
5 5 50%
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Med
Suma de dos valores centrales 2 3 2.5 2 2
La mediana es 2.5 hijos. 2.1.2. CASO AGRUPADO:
2.1.2.1. Caso agrupado discreto Para determinar la mediana, se tiene en cuenta: a. Que los valores de las observaciones estén registradas en una tabla de frecuencias b. Similar al casos no agrupados, se identifica si el conjunto es par o impar. c. La mediana se obtiene considerando a las frecuencias absolutas acumuladas. Ejemplo Tabla Nº: Mujeres del Distrito de Morococha de la región Junín según número de hijos Nº de hijos
Total
Frecuencias
Frec. Acumuladas
0
4
4
1
6
10
2
11
21
3
9
30
4
0
30
5
4
34
34
Fuente: elaboración propia
Con los datos de la tabla calcular la mediana Como el conjunto de datos es par: Los valores centrales son: 2,2 Med
La mediana es 2 hijos
22 2 2
Esta frecuencia (F3) contiene a más del 50% de los datos, por lo tanto allí se ubicamos a la mediana
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Dr. Jacobo Díaz Portillo: Hay verdades que por sabidas no se dicen, y por no decirlas se olvidan... Hay mentiras (mitos o leyendas) que por decirlas pueden terminar siendo pseudorealidades o realidades virtuales
2.1.2.2. Caso agrupado Continuo En este caso se determina la mediana usando el siguiente modelo n Fi 1 Med Li a 2 fi
Donde: Med : Mediana Li : limite inferior del intervalo que contiene a la mediana
a : Amplitud n: Tamaño de la muestra
n : Indica el lugar que ocupa la mediana 2 Fi : Frecuencia absoluta acumulada que contiene a la mediana Fi 1 : Frecuencia absoluta acumulada anterior a la frecuencia absoluta
acumulada que contiene a la mediana
f i : Frecuencia absoluta simple que contiene a la mediana Ejemplo Tabla N 1: Mujeres del Distrito de Morococha de la Región Junín según grupo etáreo (edad) Punto Edad
Medio :M J
fi
Fi
I1 = 15 – 21
18
3
3
I2 = 21 – 27
24
15
18
I3 = 27 – 33
30
8
26
I4 = 33 – 39
36
3
29
I5 = 39 – 45
42
4
33
I6 = 45 – 51
48
1
34
TOTAL Fuente: elaboración propia
34
Mediana se ubica en la frecuencia F3 acumulada y f3 simple, en el tercer intervalo
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Con los datos de la tabla calcular el valor mediano. Solución Determinar el lugar que ocupa la mediana en el conjunto de datos
n 34 17 , la mediana se ubica en el 17avo lugar, es decir, la mediana se 2 2 ubica en el 17avo lugar, en la frecuencia absoluta acumulada F2 (18), en la frecuencia absoluta simple f2 (15) y en el intervalo I2 ( Li = 21), la amplitud (A) es 6 Reemplar los valores hallados en el modelo: 17 3 Med 21 6 26.6 15
La edad mediana de las mujeres del distrito de Morococha es 26.6 años 3. LA MODA La moda es la observación(es) que se repite con mayor frecuencia. O se dice que es el valor de una observación de la variable que ocurre con mayor frecuencia. O es la observación que más veces se repite, o se dice que es la frecuencia con el valor más alto de las observaciones Se denota como Mod.: Moda
1 2
3
4
5
6 7
Moda = 5
8
9
10
11
12
13 14
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
3.1. CARACTERISTICAS: - Es Unimodal, si en el conjunto de datos, solo, un valor de la observación se repite con mayor frecuencia - Es Bimodal, si en el conjunto de valores de las observaciones dos de estas observaciones se repiten en igual número de veces. - Multimodal: cuando existen más de dos modas - Clase Modal: es el intervalo que contiene al número más alto de observaciones (moda). - No tiene moda: cuando en el conjunto de datos no presenta repeticiones diferentes.
1
2
3
4
5
6
7
SIN MODA
3.2. Casos: 3.2.1. Caso no Agrupado Procedimiento ordenar los datos de menor a mayor ubicar al valor modal Ejemplo: Una agencia de Turismo, ofrece paquetes turísticos con precios módicos para visitar la Ciudad de Caral, la oferta es para la temporada de verano, en la Ofic., de logística, se esta planificando promocionar los paquetes enviando avisos impresos a los clientes. El gerente de la empresa desea conocer las edades de los clientes que ya hicieron uso de sus servicios, para hacer mayor inversión en el grupo atareo que mayormente visita Caral, y selecciona una muestra de 20 turistas. Hallar el valor modal de los datos
20 50 25 30 40 35 50 22 22 55 52 54 60 65 40 48 30 35 55 60
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
SOLUCION. 20 22 22 25 30 30 30 30 40 40 48 50 50 52 54 55 60 60 60 65
El valor modal de los turistas que visitan Caral es 30 años (30 anos se repite 4 veces) 3.2.2. Caso agrupado
3.2.2.1. Caso agrupado discreto: Se observa en una tabla o cuadro estadístico, la frecuencia absoluta simple (fi) de mayor valor o el valor mas alto de las frecuencia Esta frecuencia se relaciona con una de las observaciones de la variable
EJEMPLO Tabla Nº: Mujeres del Distrito de Morococha del depto. de Junín según número de hijos Nº de hijos frecuencias 0
4
1
6
2
11
3
9
4
0
5
4
Total
Fi Moda = 2
34
Fuente: elaboración
El valor modal de las mujeres que tienen más hijos es 2 hijos ( 2 es la observación que mas veces se repite) 3.2.2.2. Caso agrupado continuo: Para obtener el valor modal se hace uso de la siguiente formula:
D1 Mod Li a D1 D2 i
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Donde :
Mod :
Moda
Li :
limite inferior del intervalo que contiene a la moda
a:
Amplitud del intervalo
D1 f i f i 1 : Frecuencia absoluta simple que contiene a la moda menos la
frecuencia anterior a la frecuencia que contiene a la moda
D1 f i f i 1 : Frecuencia absoluta simple que contiene a la moda menos la frecuencia posterior a la frecuencia que contiene a la moda
EJEMPLO:
Los datos corresponden a una muestra de 50 alumnos seleccionados según sus calificaciones (suspenso, aprobado, notable y sobresaliente). Calcular la moda Tabla Nº: alumnos seleccionados según calificaciones Calificaciones
Frecuencias ( fi )
0 - 5
15
5 - 7
20
7 - 9
12
9 - 10
3
Total
hi
Moda
50
Solución:
La moda se encuentra en segunda frecuencia absoluta simple (f2), corresponde al 2º intervalo D1 Mod Li a = D1 D2 i
La moda es 5.769 puntos.
20 15 Mod 5 2 5.769 20 15 20 12i
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
4. LOS CUARTILES Los cuartiles dividen al conjunto de datos en 4 partes iguales: el primer cuartil llamado también cuartel inferior, el segundo cuartil o cuartil medio (corresponde a la mediana) y el tercer cuartil o cuartil superior
Primer Cuartil Q 1 = 25% Segundo Cuartil Q 2 = mediana = 50% Tercer Cuartil Q 3 = 75%
Se denota:
Qi
in 4
Donde:
Qi : Cuartil i n: tamaño de la muestra
in : es el lugar que ocupa el cuartil (i) 4
Cada cuartil (i) representa el total de datos acumulados hasta i
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
4.1. Casos: 4.1.1. Caso no agrupado: Para calcular el valor de los cuartiles, se tiene en cuenta: a. Ordenar los datos de menor a mayor b. Determinar el lugar que ocupa cada cuartil Ejemplo Los siguientes datos corresponden al número de atenciones que realiza una empresa de currier, en un tiempo establecido 2 3 2 1 1 5 1 4 1 1 4 2 1 2 4 3 4 1 5 3 Solución: 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4 4
5º lugar
10º lugar
5 5
15º lugar
1 111 1 1 1 2 2 2 2 3 3 3 4 4 4 4 5 5 Q1 1
Q2 2
Q3 4
Para Q 1:
Q1
1n 1(20) Q1 5 4 4
El primer cuartil se ubica en el 5º lugar y es 1 atención Es decir, que hasta el cuartil 1 se acumula el 25% de atenciones que realiza la empresa, entonces
Q1 = 1
atención
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Para Q 2:
Q2
2(n) 2(20) Q1 10 4 4
El segundo cuartil se ubica en el 10º lugar y es 2 atenciones: Es decir, que hasta el cuartil 2 se acumula el 50% de atenciones que realiza la
Q2 =2
empresa, por lo tanto :
atenciones
Para Q 3:
Q3
3n 3(20) Q3 15 4 4
El tercer cuartil se ubica en el 15º lugar y corresponde a 2 atenciones Es decir, que hasta el cuartil 3 se acumula el 75% de atenciones que realiza la empresa, por lo tanto:
Q3 =4
atenciones
4.1.2. Caso agrupado: 4.1.2.1.
Caso agrupado discreto
El valor de los cuartiles se obtiene, observando en la tabla o cuadro, las frecuencias absolutas acumuladas (Fi), allí se ubica el lugar que ocupa el cuartil (i) y luego se relaciona con la observación (en la columna de las observaciones de la variable) que le corresponde. El procedimiento es similar al empleado para el caso no agrupado.
Ejemplo:
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Tabla Nº: alumnos seleccionados según calificaciones Atenciones
Frecuencias ( fi )
Fi
1
7
7
2
4
11
3
3
14
4
4
18
5
2
20
Total
Primer cuartil = 1 Ocupa el 4º lugar
Segundo cuartil = 2 Ocupa el 10º lugar
Tercer cuartil = 4 Ocupa el 15º lugar
20
Solución:
Q1
1n 1(20) Q1 5, 4 4
Se ubica en el 5º lugar y es 1 atención Los cuartiles 2 y 3 queda como ejercicio para el alumno
4.1.2.2. Caso agrupado continuo En este caso se calculan los cuartiles haciendo uso de la tabla de distribución de frecuencia continua, observando las frecuencias absolutas acumuladas (Fi) para localizar el lugar que ocupa cada cuartil, asociando este valor con su intervalo correspondiente, y reemplazando los valores en la siguiente formula in Fi 1 Qi Li a 4 fi
Donde:
Qi : Cuartil i Li : Límite inferior que contiene al cuartil i
a : Amplitud n : Tamaño de la muestra
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
in : Lugar que ocupa el cuartil (i) 4
Fi : Frecuencia absoluta acumulada donde se ubica el cuartil (i)
Fi 1 Frecuencia absoluta acumulada anterior a la frecuencia donde se ubica el cuartil i f i : Frecuencia absoluta simple que contiene el cuartil (i) Ejemplo La gerencia de relaciones Humanas de una empresa textil, desea conocer el nivel de satisfacción y liderazgo de sus empleados, y selecciona a 88 trabajadores para aplicarles un test, obteniéndose los siguientes resultados.
Tabla Nº: trabajadores de una empresa textil según puntuación de un test Puntuaciones
Frec.=fi
Fi
[38,44)
7
7
[44,50)
8
15
[50,56)
15
30
[56,62)
25
55
[62,68)
18
73
[68,74)
9
82
[74,80)
6
88
Total
88
Calcular el valor de los cuartiles
SOLUCION: Cuartil Uno: 1n Fi 1 Q1 Li a 4 fi
1(88) 15 Q1 50 6 4 8
El cuartil 1 es 55.25 puntos Utilizando el modelo hallar el valor de los cuartiles 2 y 3
55.25
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Cuartil Dos: 2n Fi 1 Q2 Li a 4 fi
1n Fi 1 Q1 Li a 4 fi
Cuartil Tres:
3. MEDIDAS DE DISPERSIÓN:
Mide el grado de concentración, dispersión o variabilidad de los valores de las observaciones o datos alrededor de un valor central. Es decir explican cuan distante se encuentran los valores de las observaciones del valor central. También se dice que es la distancia que tienen las observaciones hacia el valor central.
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
A. MEDIDAS DE DISPERSIÓN PARA LA POBLACIÓN
N
2
(X i 1
i
)2
cv
N 1 N
Donde:
2 : Varianza X : Observaciones de la población
: Promedio de la población N : Tamaño de la población
(X i 1
i
)2
N 1
* 100
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
B. MEDIDAS DE DISPERSIÓN PARA LA MUESTRA
n
S2
(x i 1
X )2
i
cv
n 1 n
S
(x i 1
i
S * 100 X
X )2
n 1
a. Varianza
Mide el grado de variación de los valores de las observaciones respecto a la media aritmética o promedio aritmético. Es la distancia de cada una de las observaciones hacia la media. Casos Caso no agrupado n
S 2
(x i 1
i
n
X )2
n 1
Forma abreviada
Donde:
S 2 : Varianza de la muestra xi : Valores de las observaciones de la muestra
S2
x i 1
2 i
nx 2
n 1
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
X : Media aritmética de la muestra
n . Tamaño de la muestra Caso agrupado Discreto
S2
x
X 2 fi
i
n 1
Donde: fi: frecuencias observadas Caso agrupado continuo
S2
M
i
X 2 fi
n 1
Dónde: M i : Punto medio o marca de clase
Ejemplo Un consultor estudió una muestra de 40 empresas de venta de lácteos de ciudad, su interés era investigar el monto del gastado anual en publicidad, entre otras cosas, por esas empresas. Los datos del estudio se registraron en la siguiente tabla. Tabla Nº: empresas de ventas de lácteos por gasto anual en publicidad 2
Mj
fi
Fi
10 – 20
15
4
4
(15 – 35.5)2 *4 =
20 – 30
25
14
18
(25 – 35.5)2 *14 =
30 – 40
35
8
26
(35 – 35.5)2 *8 =
40 – 50
45
6
32
(45 – 35.5)2 *6 =
50 – 60
55
3
35
(55 – 35.5)2 *3 =
60 – 70
65
4
39
(65 – 35.5)2 *4 =
70 – 80
75
1
40
(75 – 35.5)2 *1 =
TOTAL
40
2
S = ∑(xi – media) *fi
Miles de soles
254.103
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Solución n
X
m
fi
i
i 1
15 * (4) 25 * (14) 35 * (8) .... (75 * 1) 36.5 40
n
El promedio en el gasto anual en publicidad que hacen las empresas es de 36,500 soles
S2
M
i
X 2 fi n 1
254.103
La varianza del gasto anual en publicidad es 254.103 soles b. Desviación estándar
Es la raíz cuadrada de la varianza, al ser un elemento que proviene de la varianza, mide el grado de variabilidad de los datos respecto al promedio de la muestra n
S
(x i 1
i
X )2
n 1
= 15.941 soles
La desviación estándar del gasto anual en publicidad que hacen las empresas es de 15.941 soles. c. coeficiente de variación El coeficiente de variación mide el porcentaje de variabilidad de la varianza.
cv
S 15.941 * 100 cv *100 ........ X 36.500
El porcentaje de variación del gasto anual en publicidad de las empresas de productos lácteos es 43.67 %
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
4. MEDIDAS DE ASIMETRÍA Y CURTOSIS
Llamados también medidas de forma, indican la morfología de la distribución de los datos, es decir la simetría y apuntamiento que tiene el histograma de la variable (continua) en estudio. Sólo se pueden calcular en variables medidas en escala intervalar y de razón. Clases de medidas Sesgo (Coeficiente De Asimetría) Curtosis A. COEFICIENTE DE ASIMETRIA
Es la falta de simetría de la curva de distribución con respecto a la ordenada levantada sobre la media aritmética. Una curva de distribución de frecuencias es simétrica si las medidas de tendencia: media, mediana, y moda coinciden en el mismo punto (o tienen el mismo valor). El coeficiente de asimetría se denota;
IA
3 X mediana S
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
FORMAS DE DISTRIBUCIONES MAS FRECUENTES DISTRIBUCIÓN ASIMETRICA
DISTRIBUCIÓN SIMETRICA
DISTRIBUCIÓN SIMÉTRICA TRIANGULAR
B. COEFICIENTE DE CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
Fuente: Econ: Alexander Nuñez
1
1. Distribución Mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales (media, mediana, moda) de la variable (el mismo que presenta una distribución normal). 2. Distribución
Leptocúrtica:
presenta
un
elevado
grado
de
grado
de
concentración alrededor de los valores centrales de la variable. 3. Distribución
Platicúrtica:
presenta
un
reducido
concentración alrededor de los valores centrales de la variable.
1
MSc.. Econ. Alexander Núñez: medidas de distribución: Asimetría y Curtosis
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
ASIMETRIAS Y KURTOSIS ASIMETRIA
El Coeficiente de Pearson varía entre -3 y 3 Si As < 0:
la distribución será asimétrica negativa.
Si As = 0:
la distribución será simétrica.
Si As > 0:
la distribución será asimétrica positiva.
Medida de Yule Bowley o Medida Cuartílica
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López
2
KURTOSIS
2
http://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-forma-asimetria-curtosis.shtml#ixzz4IvmaWdFu
UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES
Dra. Sara Adelina Arana López