30 08 2017 Estadigrafos

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES Dra. Sara Adelin

Views 75 Downloads 0 File size 996KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

BIOESTADISTICA MODULO: ESTADIGRAFOS

SARA ADELINA ARANA LOPEZ

LIMA, 2014

RESEÑA HISTORICA Dra. SARA ADELINA ARANA LOPEZ

LIMA, 2017

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

MEDIDAS DE TENDENCIA O ESTADÍGRAFOS

INTRODUCION

Para describir un conjunto de datos, además de la tabulación y la representación gráfica, se utilizan valores numéricos de funciones de la variable, llamadas medidas de resumen, o estadísticos. Son valores únicos que representan al conjunto de los datos observados de la variable, también llamadas medidas de Resumen, porque resumen en un solo valor a todo el conjunto de valores de las observaciones, representando a toda la muestra que es el objeto de estudio, para su análisis y posterior estimación a toda la población. Se clasifican en:

Si, según Montaigne, ‘‘para juzgar cosas grandes y nobles, es necesario poseer un alma igual de grande y noble’’(*), para juzgar un artículo científico escrito por un colega es necesario poseer, además, conocimientos, experiencia, imparcialidad, confidencialidad, diligencia, una cierta dosis de pedagogía y otra no menos esencial de compañerismo (**).

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

1. MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA, MODA, CUARTILES Las medidas de tendencia central tienden a ubicarse en el centro de la información (de los valores de las observaciones de la variable), solo en algunos casos estas medidas coinciden juntas en el centro de los datos. Considerando que solo la mediana y el cuartil dos siempre van a ubicarse en el centro de los valores observados (acumulando el 50% de información en cada caso) Se clasifican en:

1.1. MEDIA ARITMETICA O PROMEDIO ARITMETICO Es el estadígrafo o medida de resumen más importante de la estadística. Es el único valor que representa a todo el conjunto de datos (valores) observados de una variable, denominado como el promedio aritmético de las observaciones de la variable elegida de la muestra para el estudio Se obtiene: sumando todos los valores de las observaciones y luego se divide entre el número total de observaciones (n) Se denota: n

X 

x i 1

n

i

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Donde:

X:

Media o promedio aritmético: se lee X - barra

xi :

Valores de las observaciones

n:

Tamaño de la muestra

1.1.1. Casos 1.1.1.1. Caso no agrupado: n

X 

x i 1

i

n

Ejemplo: El gerente de una empresa que se dedica a la fabricación de gelatina, desea adquirir una máquina para el llenado de bolsas de aproximadamente 200 gramos. Debe decidir en adquirir una de dos máquinas que le ofrecen, en igualdad de condiciones de costes, aunque que no está convencido de la precisión de las máquinas, para elegir una se realizan 6 prueba con cada máquina y se obtienen los resultados siguientes:

(Pesos gr)

Maq. A

195

198

1199

1197

1199

200

Maq. B

199

200

200

200

198

201

a. ¿Cuál será el peso promedio de bolsas obtenido de las máquinas? b. ¿Cuál es el peso promedio de las dos máquinas juntas? c. ¿Qué maquina elige el gerente de la empresa? SOLUCION a. Promedio de las maquinas

MAQUINA A: n

X 

x i 1

n

i



195  198  199  197  199  200 1188   198 6 6

La máquina A empaca en promedio 198 gramos de gelatina en cada bolsa

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

MAQUINA B: n

X 

x i 1

i

n



199  200  200  200  198  200 1197   199.5 n6 6

La máquina B empaca en promedio 199.5 gramos de gelatina b. Promedio de las maquinas juntas n

X 

x i 1

i

n



195  198  199  197  199  200  199  200  200  200  198  200 2385   198.75 12 12

el promedio de empaque de las dos máquinas juntas es de 198.75 gramos de gelatina. El gerente de la fábrica elige la maquina B, por hacer un empacado en cada bolsa de gelatina de 199.5 gramos. 1.1.1.2. CASO AGRUPADO: A diferencia del caso no agrupado, en este ítem, los valores de las observaciones de la variable se agrupan y se muestra en consolidados de los datos, en tablas estadísticas, las se presentan en dos casos: 1.1.1.2.1. CASO DISCRETO n

X



x i 1

i

fi

n

Donde:

X : Media o promedio aritmético: se lee X - barra xi : Valores de las observaciones

n : Tamaño de la muestra f i : Frecuencia Ejemplo: Un estudio realizado por una institución de salud para conocer el nivel de plomo en la sangre de Mujeres del Distrito de Morococha del depto. de Junín, están interesado en conocer el numero de hijos

por mujer, para lo cual,

seleccionan una muestra de 34 mujeres, los datos se registran en la siguiente tabla.

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Tabla Nº: Mujeres del Distrito de Morococha del Dpto. de Junín según número de hijos por mujer n

Nº de hijos

Frecuencias

X



x

i

i 1

n

0

4

0*(4) = 0

1

6

1*(6) = 6

2

11

2*(11) = 22

3

9

3*(9) = 27

4

0

4*(0) = 0

5

4

5*(4) = 20

34

75

Total

fi

Fuente: elaboración propia n

X 

x i 1

i

fi

n 0 * ( 4)  1 * (6)  2 * (11)  3 * (9)  4 * (0)  5 * ( 4) 75    2.21 34 12

el promedio de hijos por mujer es de 2.21 hijos

1.1.1.2.2. Caso Continuo n

X 

m

i

i 1

fi

n

Donde:

X : Media o promedio aritmético: se lee X - barra mi : Punto medio o marca de clase (Valores de las observaciones)

n : Tamaño de la muestra f i : Frecuencia

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Ejemplo: Tabla Nº: Mujeres del Distrito de Morococha del Dpto. de de Junín según grupo etáreo (edad) n

Edad

m

Punto Medio O Marca de Clase :MJ

fi

I1 = 15 – 21

18

3

18 * (3) = 54

I2 = 21 – 27

24

15

24 * (15) = 360

I3 = 27 – 33

30

8

30 * (8) = 240

I4 = 33 – 39

26

3

26 *(3) = 78

I5 = 39 – 45

42

4

42 * (4) = 168

I6 = 45 – 51

48

1

48 * (1) = 48

34

984 / 34 = 28.94

TOTAL

X 

i

i 1

fi

n

Fuente: elaboración propia

El promedio de edad de las mujeres de Morococha es 28.94 años, la edad mínima es de 15 años y la edad máxima es de 51 años. 2. MEDIANA o VALOR MEDIO Es el valor central de un conjunto finito de observaciones; la mediana divide al conjunto en dos partes exactamente iguales, 50% a la derecha y 50% a la izquierda.

50%

50% Mediana

Se denota por: Med.

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

2.1. Casos

2.1.1. CASO NO AGRUPADO: Procedimiento: a. Las observaciones se ordenan de menor a mayor b. Se determina si el conjunto de datos es conjunto par o impar c. Ubicar los valores centrales del conjunto de datos

i.

Conjunto par: La mediana se halla sumando los dos valores centrales y se divide por dos

Med 

ii. iii.

Suma de dos valores centrales 2

Conjunto impar: Se determina la mediana Med 

n1 2

d. Se procede a calcular la mediana Ejemplo: Los siguientes datos corresponden a los números de hijos de 12 mujeres 5 0 3 2 0 3 2 2 1 3 1 2 3 Solución a. Ordenar los datos de menor a mayor 0

1

0

1

2

1

2

2

1

2

50%

b. El conjunto de datos es par c. Los valores centrales son el 2,3 d. Calculara la mediana:

3

2

3

3

2

4

5

3

5

3 3 4

5 5 50%

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Med 

Suma de dos valores centrales 2  3   2.5 2 2

La mediana es 2.5 hijos. 2.1.2. CASO AGRUPADO:

2.1.2.1. Caso agrupado discreto Para determinar la mediana, se tiene en cuenta: a. Que los valores de las observaciones estén registradas en una tabla de frecuencias b. Similar al casos no agrupados, se identifica si el conjunto es par o impar. c. La mediana se obtiene considerando a las frecuencias absolutas acumuladas. Ejemplo Tabla Nº: Mujeres del Distrito de Morococha de la región Junín según número de hijos Nº de hijos

Total

Frecuencias

Frec. Acumuladas

0

4

4

1

6

10

2

11

21

3

9

30

4

0

30

5

4

34

34

Fuente: elaboración propia

Con los datos de la tabla calcular la mediana  Como el conjunto de datos es par: Los valores centrales son: 2,2 Med 

La mediana es 2 hijos

22 2 2

Esta frecuencia (F3) contiene a más del 50% de los datos, por lo tanto allí se ubicamos a la mediana

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Dr. Jacobo Díaz Portillo: Hay verdades que por sabidas no se dicen, y por no decirlas se olvidan... Hay mentiras (mitos o leyendas) que por decirlas pueden terminar siendo pseudorealidades o realidades virtuales

2.1.2.2. Caso agrupado Continuo En este caso se determina la mediana usando el siguiente modelo n   Fi  1 Med  Li  a  2 fi  

    

Donde: Med : Mediana Li : limite inferior del intervalo que contiene a la mediana

a : Amplitud n: Tamaño de la muestra

n : Indica el lugar que ocupa la mediana 2 Fi : Frecuencia absoluta acumulada que contiene a la mediana Fi  1 : Frecuencia absoluta acumulada anterior a la frecuencia absoluta

acumulada que contiene a la mediana

f i : Frecuencia absoluta simple que contiene a la mediana Ejemplo Tabla N 1: Mujeres del Distrito de Morococha de la Región Junín según grupo etáreo (edad) Punto Edad

Medio :M J

fi

Fi

I1 = 15 – 21

18

3

3

I2 = 21 – 27

24

15

18

I3 = 27 – 33

30

8

26

I4 = 33 – 39

36

3

29

I5 = 39 – 45

42

4

33

I6 = 45 – 51

48

1

34

TOTAL Fuente: elaboración propia

34

Mediana se ubica en la frecuencia F3 acumulada y f3 simple, en el tercer intervalo

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Con los datos de la tabla calcular el valor mediano. Solución  Determinar el lugar que ocupa la mediana en el conjunto de datos

n 34   17 , la mediana se ubica en el 17avo lugar, es decir, la mediana se 2 2 ubica en el 17avo lugar, en la frecuencia absoluta acumulada F2 (18), en la frecuencia absoluta simple f2 (15) y en el intervalo I2 ( Li = 21), la amplitud (A) es 6  Reemplar los valores hallados en el modelo: 17  3  Med  21  6    26.6  15 

La edad mediana de las mujeres del distrito de Morococha es 26.6 años 3. LA MODA La moda es la observación(es) que se repite con mayor frecuencia. O se dice que es el valor de una observación de la variable que ocurre con mayor frecuencia. O es la observación que más veces se repite, o se dice que es la frecuencia con el valor más alto de las observaciones Se denota como Mod.: Moda

1 2

3

4

5

6 7

Moda = 5

8

9

10

11

12

13 14

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

3.1. CARACTERISTICAS: - Es Unimodal, si en el conjunto de datos, solo, un valor de la observación se repite con mayor frecuencia - Es Bimodal, si en el conjunto de valores de las observaciones dos de estas observaciones se repiten en igual número de veces. - Multimodal: cuando existen más de dos modas - Clase Modal: es el intervalo que contiene al número más alto de observaciones (moda). - No tiene moda: cuando en el conjunto de datos no presenta repeticiones diferentes.

1

2

3

4

5

6

7

SIN MODA

3.2. Casos: 3.2.1. Caso no Agrupado Procedimiento  ordenar los datos de menor a mayor  ubicar al valor modal Ejemplo: Una agencia de Turismo, ofrece paquetes turísticos con precios módicos para visitar la Ciudad de Caral, la oferta es para la temporada de verano, en la Ofic., de logística, se esta planificando promocionar los paquetes enviando avisos impresos a los clientes. El gerente de la empresa desea conocer las edades de los clientes que ya hicieron uso de sus servicios, para hacer mayor inversión en el grupo atareo que mayormente visita Caral, y selecciona una muestra de 20 turistas. Hallar el valor modal de los datos

20 50 25 30 40 35 50 22 22 55 52 54 60 65 40 48 30 35 55 60

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

SOLUCION. 20 22 22 25 30 30 30 30 40 40 48 50 50 52 54 55 60 60 60 65

El valor modal de los turistas que visitan Caral es 30 años (30 anos se repite 4 veces) 3.2.2. Caso agrupado

3.2.2.1. Caso agrupado discreto:  Se observa en una tabla o cuadro estadístico, la frecuencia absoluta simple (fi) de mayor valor o el valor mas alto de las frecuencia  Esta frecuencia se relaciona con una de las observaciones de la variable

EJEMPLO Tabla Nº: Mujeres del Distrito de Morococha del depto. de Junín según número de hijos Nº de hijos frecuencias 0

4

1

6

2

11

3

9

4

0

5

4

Total

Fi Moda = 2

34

Fuente: elaboración

El valor modal de las mujeres que tienen más hijos es 2 hijos ( 2 es la observación que mas veces se repite) 3.2.2.2. Caso agrupado continuo: Para obtener el valor modal se hace uso de la siguiente formula:

 D1  Mod  Li  a    D1  D2 i 

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Donde :

Mod :

Moda

Li :

limite inferior del intervalo que contiene a la moda

a:

Amplitud del intervalo

D1  f i  f i  1 : Frecuencia absoluta simple que contiene a la moda menos la

frecuencia anterior a la frecuencia que contiene a la moda

D1  f i  f i  1 : Frecuencia absoluta simple que contiene a la moda menos la frecuencia posterior a la frecuencia que contiene a la moda

EJEMPLO:

Los datos corresponden a una muestra de 50 alumnos seleccionados según sus calificaciones (suspenso, aprobado, notable y sobresaliente). Calcular la moda Tabla Nº: alumnos seleccionados según calificaciones Calificaciones

Frecuencias ( fi )

0 - 5

15

5 - 7

20

7 - 9

12

9 - 10

3

Total

hi

Moda

50

Solución:

La moda se encuentra en segunda frecuencia absoluta simple (f2), corresponde al 2º intervalo  D1  Mod  Li  a   =  D1  D2 i 

La moda es 5.769 puntos.

  20  15 Mod  5  2    5.769  20  15  20  12i 

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

4. LOS CUARTILES Los cuartiles dividen al conjunto de datos en 4 partes iguales: el primer cuartil llamado también cuartel inferior, el segundo cuartil o cuartil medio (corresponde a la mediana) y el tercer cuartil o cuartil superior

Primer Cuartil Q 1 = 25% Segundo Cuartil Q 2 = mediana = 50% Tercer Cuartil Q 3 = 75%

Se denota:

Qi 

in 4

Donde:

Qi : Cuartil i n: tamaño de la muestra

in : es el lugar que ocupa el cuartil (i) 4

Cada cuartil (i) representa el total de datos acumulados hasta i

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

4.1. Casos: 4.1.1. Caso no agrupado: Para calcular el valor de los cuartiles, se tiene en cuenta: a. Ordenar los datos de menor a mayor b. Determinar el lugar que ocupa cada cuartil Ejemplo Los siguientes datos corresponden al número de atenciones que realiza una empresa de currier, en un tiempo establecido 2 3 2 1 1 5 1 4 1 1 4 2 1 2 4 3 4 1 5 3 Solución: 1 1 1 1 1 1 1 2 2 2 2 3 3 3 4 4 4 4

5º lugar

10º lugar

5 5

15º lugar

1 111 1 1 1 2 2 2 2 3 3 3 4 4 4 4 5 5 Q1  1

Q2  2

Q3  4

Para Q 1:

Q1 

1n 1(20)  Q1  5 4 4

El primer cuartil se ubica en el 5º lugar y es 1 atención Es decir, que hasta el cuartil 1 se acumula el 25% de atenciones que realiza la empresa, entonces

Q1 = 1

atención

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Para Q 2:

Q2 

2(n) 2(20)  Q1   10 4 4

El segundo cuartil se ubica en el 10º lugar y es 2 atenciones: Es decir, que hasta el cuartil 2 se acumula el 50% de atenciones que realiza la

Q2 =2

empresa, por lo tanto :

atenciones

Para Q 3:

Q3 

3n 3(20)  Q3   15 4 4

El tercer cuartil se ubica en el 15º lugar y corresponde a 2 atenciones Es decir, que hasta el cuartil 3 se acumula el 75% de atenciones que realiza la empresa, por lo tanto:

Q3 =4

atenciones

4.1.2. Caso agrupado: 4.1.2.1.

Caso agrupado discreto

El valor de los cuartiles se obtiene, observando en la tabla o cuadro, las frecuencias absolutas acumuladas (Fi), allí se ubica el lugar que ocupa el cuartil (i) y luego se relaciona con la observación (en la columna de las observaciones de la variable) que le corresponde. El procedimiento es similar al empleado para el caso no agrupado.

Ejemplo:

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Tabla Nº: alumnos seleccionados según calificaciones Atenciones

Frecuencias ( fi )

Fi

1

7

7

2

4

11

3

3

14

4

4

18

5

2

20

Total

Primer cuartil = 1 Ocupa el 4º lugar

Segundo cuartil = 2 Ocupa el 10º lugar

Tercer cuartil = 4 Ocupa el 15º lugar

20

Solución:

Q1 

1n 1(20)  Q1   5, 4 4

Se ubica en el 5º lugar y es 1 atención Los cuartiles 2 y 3 queda como ejercicio para el alumno

4.1.2.2. Caso agrupado continuo En este caso se calculan los cuartiles haciendo uso de la tabla de distribución de frecuencia continua, observando las frecuencias absolutas acumuladas (Fi) para localizar el lugar que ocupa cada cuartil, asociando este valor con su intervalo correspondiente, y reemplazando los valores en la siguiente formula  in  Fi  1  Qi  Li  a  4 fi  

Donde:

Qi : Cuartil i Li : Límite inferior que contiene al cuartil i

a : Amplitud n : Tamaño de la muestra

    

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

in : Lugar que ocupa el cuartil (i) 4

Fi : Frecuencia absoluta acumulada donde se ubica el cuartil (i)

Fi  1 Frecuencia absoluta acumulada anterior a la frecuencia donde se ubica el cuartil i f i : Frecuencia absoluta simple que contiene el cuartil (i) Ejemplo La gerencia de relaciones Humanas de una empresa textil, desea conocer el nivel de satisfacción y liderazgo de sus empleados, y selecciona a 88 trabajadores para aplicarles un test, obteniéndose los siguientes resultados.

Tabla Nº: trabajadores de una empresa textil según puntuación de un test Puntuaciones

Frec.=fi

Fi

[38,44)

7

7

[44,50)

8

15

[50,56)

15

30

[56,62)

25

55

[62,68)

18

73

[68,74)

9

82

[74,80)

6

88

Total

88

Calcular el valor de los cuartiles

SOLUCION: Cuartil Uno:  1n  Fi  1  Q1  Li  a  4 fi  

    

 1(88)  15  Q1  50  6  4 8  

El cuartil 1 es 55.25 puntos Utilizando el modelo hallar el valor de los cuartiles 2 y 3

    55.25  

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Cuartil Dos:  2n  Fi  1  Q2  Li  a  4 fi  

    

 1n  Fi  1  Q1  Li  a  4 fi  

    

Cuartil Tres:

3. MEDIDAS DE DISPERSIÓN:

Mide el grado de concentración, dispersión o variabilidad de los valores de las observaciones o datos alrededor de un valor central. Es decir explican cuan distante se encuentran los valores de las observaciones del valor central. También se dice que es la distancia que tienen las observaciones hacia el valor central.

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

A. MEDIDAS DE DISPERSIÓN PARA LA POBLACIÓN

N



2



(X i 1

i

  )2

cv 

N 1 N

 

Donde:

 2 : Varianza X : Observaciones de la población

 : Promedio de la población N : Tamaño de la población

(X i 1

i

  )2

N 1

 * 100 

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

B. MEDIDAS DE DISPERSIÓN PARA LA MUESTRA

n

S2 

 (x i 1

 X )2

i

cv 

n 1 n

S 

 (x i 1

i

S * 100 X

 X )2

n 1

a. Varianza

Mide el grado de variación de los valores de las observaciones respecto a la media aritmética o promedio aritmético. Es la distancia de cada una de las observaciones hacia la media.  Casos  Caso no agrupado n

S  2

 (x i 1

i

n

 X )2

n 1

Forma abreviada

Donde:

S 2 : Varianza de la muestra xi : Valores de las observaciones de la muestra

S2 

x i 1

2 i

 nx 2

n 1

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

X : Media aritmética de la muestra

n . Tamaño de la muestra  Caso agrupado Discreto

S2 

 x

 X  2 fi

i

n 1

Donde: fi: frecuencias observadas  Caso agrupado continuo

S2 

 M

i

 X  2 fi

n 1

Dónde: M i : Punto medio o marca de clase

Ejemplo Un consultor estudió una muestra de 40 empresas de venta de lácteos de ciudad, su interés era investigar el monto del gastado anual en publicidad, entre otras cosas, por esas empresas. Los datos del estudio se registraron en la siguiente tabla. Tabla Nº: empresas de ventas de lácteos por gasto anual en publicidad 2

Mj

fi

Fi

10 – 20

15

4

4

(15 – 35.5)2 *4 =

20 – 30

25

14

18

(25 – 35.5)2 *14 =

30 – 40

35

8

26

(35 – 35.5)2 *8 =

40 – 50

45

6

32

(45 – 35.5)2 *6 =

50 – 60

55

3

35

(55 – 35.5)2 *3 =

60 – 70

65

4

39

(65 – 35.5)2 *4 =

70 – 80

75

1

40

(75 – 35.5)2 *1 =

TOTAL

40

2

S = ∑(xi – media) *fi

Miles de soles

254.103

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Solución n

X 

m

fi

i

i 1

15 * (4)  25 * (14)  35 * (8) ....  (75 * 1)  36.5 40



n

El promedio en el gasto anual en publicidad que hacen las empresas es de 36,500 soles

S2 

 M

i

 X  2 fi n 1

 254.103

La varianza del gasto anual en publicidad es 254.103 soles b. Desviación estándar

Es la raíz cuadrada de la varianza, al ser un elemento que proviene de la varianza, mide el grado de variabilidad de los datos respecto al promedio de la muestra n

S 

 (x i 1

i

 X )2

n 1

= 15.941 soles

La desviación estándar del gasto anual en publicidad que hacen las empresas es de 15.941 soles. c. coeficiente de variación El coeficiente de variación mide el porcentaje de variabilidad de la varianza.

cv 

S 15.941 * 100  cv  *100  ........ X 36.500

El porcentaje de variación del gasto anual en publicidad de las empresas de productos lácteos es 43.67 %

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

4. MEDIDAS DE ASIMETRÍA Y CURTOSIS

Llamados también medidas de forma, indican la morfología de la distribución de los datos, es decir la simetría y apuntamiento que tiene el histograma de la variable (continua) en estudio. Sólo se pueden calcular en variables medidas en escala intervalar y de razón. Clases de medidas  Sesgo (Coeficiente De Asimetría)  Curtosis A. COEFICIENTE DE ASIMETRIA

Es la falta de simetría de la curva de distribución con respecto a la ordenada levantada sobre la media aritmética. Una curva de distribución de frecuencias es simétrica si las medidas de tendencia: media, mediana, y moda coinciden en el mismo punto (o tienen el mismo valor). El coeficiente de asimetría se denota;

IA 

3 X  mediana  S

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

FORMAS DE DISTRIBUCIONES MAS FRECUENTES DISTRIBUCIÓN ASIMETRICA

DISTRIBUCIÓN SIMETRICA

DISTRIBUCIÓN SIMÉTRICA TRIANGULAR

B. COEFICIENTE DE CURTOSIS

Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

Fuente: Econ: Alexander Nuñez

1

1. Distribución Mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales (media, mediana, moda) de la variable (el mismo que presenta una distribución normal). 2. Distribución

Leptocúrtica:

presenta

un

elevado

grado

de

grado

de

concentración alrededor de los valores centrales de la variable. 3. Distribución

Platicúrtica:

presenta

un

reducido

concentración alrededor de los valores centrales de la variable.

1

MSc.. Econ. Alexander Núñez: medidas de distribución: Asimetría y Curtosis

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

ASIMETRIAS Y KURTOSIS ASIMETRIA

El Coeficiente de Pearson varía entre -3 y 3 Si As < 0:

la distribución será asimétrica negativa.

Si As = 0:

la distribución será simétrica.

Si As > 0:

la distribución será asimétrica positiva.

Medida de Yule Bowley o Medida Cuartílica

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López

2

KURTOSIS

2

http://www.monografias.com/trabajos87/medidas-forma-asimetria-curtosis/medidas-forma-asimetria-curtosis.shtml#ixzz4IvmaWdFu

UNIVERSIDAD NACIONAL DE INGENIERÍA FACULTAD DE INGENIERÍA AMBIENTAL DEPARTAMENTO DE ESTUDIOS GENERALES

Dra. Sara Adelina Arana López