Esta Di Stica

MINISTERIO DE EDUCACIÓN CENTRO EDUCATIVO MADRE CARIDAD BRADER TEMA MATEMATICA “MEDIDAS DE TENDENCIA CENTRAL” PROFERSOR

Views 91 Downloads 0 File size 244KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

MINISTERIO DE EDUCACIÓN CENTRO EDUCATIVO MADRE CARIDAD BRADER

TEMA MATEMATICA “MEDIDAS DE TENDENCIA CENTRAL” PROFERSOR CHAYANE

30 OCTUBRE 2019

YOIRA SAMANIEGO

12-1P

1

Introducción La estadística es una ciencia que s remonta al inicio de las sociedades humanas, como una necesidad para la realización de actividades elementales, desde una simple colección de datos hasta la interpretación de los mismos. Las primeras sociedades que se formaron en la historia, necesitaban saber cuántos habitantes formaban cada tribu, la cantidad de bienes poseían, etc. de esa manera planificaban mejor la asignación de los recursos. La estadística: - La primera parte de la definición: recopilar, organizar e interpretar conjuntos de datos se llama “Estadística Descriptiva”. - La segunda parte: interpretar datos de manera que pueda llevar a conclusiones válidas se llama “Estadística Inferencial”. En este trabajo abarcaré el proceso de evolución y desarrollo de la estadística. Presentaré las diferentes escuelas que surgieron, cada una con una tendencia y punto de vista diferente, ampliando con el paso del tiempo el campo de acción de la estadística. La estadística consiste en recolectar, organizar, resumir y analizar datos, a partir de los cuales se deducen conclusiones que validen decisiones razonables. De la estadística se derivan varias ramas, dependiendo del área de estudio de la misma.

También están las medidas que resumen los datos

recolectados: las medidas de tendencia central, que permiten la comparación de datos cuantitativos, promediándolos. Las medidas de variabilidad y dispersión, que determinan la variación de datos en un periodo y otro.

2

INDICE . ESTADÍSTICA Introducción 1. Medidas de Tendencia Central……………………………………………………..4 1. Organización de los datos de un conjunto……………………………………4 1. Distribuciones de frecuencias…………………………………………………….4 1.3.1 Definición de distribución de frecuencia. Terminología 1.3.2 Reglas generales para formar distribuciones de frecuencia 1.3.3 Ejercicios 1.4 Representación grafica de los datos de un conjunto………………………………7 1.4.1 Variables Cualitativas 1.4.2 Variables Cuantitativas Discretas 1.4.3 Variables Cuantitativas Continuas 1.4.4 Ejercicios 1.5 Medidas de tendencia central………………………………………………………12 1.5.1 La media aritmética (Media Ponderada) 1.5.2 La moda 1.5.3 La mediana 1.5.4 Ejercicios 1.6 Medidas de dispersión ……………………………………………………………..15 1.6.1 Amplitud (recorrido o rango) 1.6.2 Desviación típica (o estándar).Varianza 1.6.3 Ejercicios 1.7 Medidas de Posición ………………………………………………………………20 1.7.1 Cuantiles(cuartiles, deciles y percentiles) 1.7.2 Ejercicios 1.8. Bibliografia…………………………………………………………………….26. 1.9 Conclusion………………………………………………………………………28.

3

MEDIDAS DE TENDENCIA CENTRAL 1. INTRODUCCION La estadística se puede definir como la ciencia encargada de recopilar, organizar e interpretar conjuntos de datos, de manera que pueda llevar a conclusiones válidas. Los datos se obtienen (de una muestra o población) observando o experimentando. - La primera parte de la definición: recopilar, organizar e interpretar conjuntos de datos se llama “Estadística Descriptiva”. - La segunda parte: interpretar datos de manera que pueda llevar a conclusiones válidas se llama “Estadística Inferencial”. Nos ocuparemos de la Estadística Descriptiva. Cuando el número de datos es relativamente grande, resulta conveniente, para facilitar su interpretación, primero organizarlos y luego representarlos gráficamente. 2. ORGANIZACIÓN DE LOS DATOS DE UN CONJUNTO Los datos recopilados se analizan de acuerdo con una característica: “CUALITATIVA”, por ejemplo, el estado civil, sexo y nacionalidad de una persona; calidad de un plaguicida, como dañino o no dañino para la salud. Cuando la característica es “CUANTITATIVA” se distinguen dos casos: características discretas, como el número de hijos en la familia. En este caso la variable toma valores aislados, 0, 1, 2, 3, etc. Características continuas, como el peso y la estatura de una persona. Aquí la variable en consideración toma todos los valores reales en un intervalo. 3. DISTRIBUCIONES DE FRECUENCIAS DEFINICION DE FRECUENCIA Y TERMINOLOGÍA 4

Definición: Las distribuciones de frecuencias son disposiciones tabulares de los datos, por clases con sus respectivas frecuencias absolutas. Terminología: CLASES. (Para una característica continua): Son intervalos abiertos o cerrados. Deben ser exhaustivos y excluyentes; es decir, tales que se elimine la posibilidad de que un dato dado no corresponda a clase alguna o que pueda quedar incluido en más de una. FRECUENCIA ABSOLUTA: Es el número de datos que pertenecen a la clase. Ejemplo 1. Distribución de frecuencias de puntajes obtenidos por 120 estudiantes en un examen de matemática. Clase

Puntajes (x)

1ra. 2da. 3ra. 4ta. 5ta. 6ta. 7ma.

28 - 32 33 - 37 38 – 42 43 – 47 48 – 52 53 – 57 58 - 62 Total

Frecuencias Absolutas 10 15 20 35 19 12 9 120

- Los números que definen una clase: 28-32, 33-37, etc. se llaman Límites de Clase. - Los valores a la izquierda: 28, 37, etc. se llaman Limites Inferiores aparentes, los valores a la derecha: 32, 37, etc. son los Limites Superiores aparentes de la clase. - La diferencia entre el límite superior (l s) y el límite inferior (li), más 1, es un Intervalo de Clase (o Amplitud de Clase); y se denota por ic . En símbolos: ic = l s – l i + 1 - Marca de clase o punto medio: Es la mitad de la suma de los límites 5

de la clase. Los datos que corresponden a una variable continua, generalmente no son medidas exactas. Así decimos por ejemplo que 58 es un valor que está entre 57.5 y 58.5; el primero es el límite real inferior y el segundo es el límite real superior. Para estas distribuciones ic = lrs – lri. A continuación se presenta la distribución de frecuencias del ejemplo anterior, con límites reales. Ejemplo 2.

Clase

Puntajes

1ra.

27.5 a menos de 32.5 32.5 a menos de 37.5 37.5 a menos de 42.5 42.5 a menos de 47.5 47.5 a menos de 52.5 52.5 a menos de 57.5 57.5 a menos de 62.5 Total

2da. 3ra. 4ta. 5ta. 6ta. 7ma.

Frecuencias Absolutas 10 15 20 35 19 12 9 120

En general, la distribución de frecuencias para una muestra de tamaño n y un número k de clases, con frecuencias fk, respectivamente, se representa así: Clase clase 1 clase 2

Frecuencia Absoluta F1 F2

clase i

Fi

clase k

Fk 6

Total

n k

La frecuencia relativa es fi/n, donde 0 ≤ f i/n ≤ 1 y “  fi / n = i 1

1. Cuando fi/n se multiplica por 100, se llama frecuencia porcentual. La frecuencia acumulada menor que fi se denota por Fi y es la suma de las frecuencias absolutas que van desde la clase 1 hasta la clase i. En símbolos: Fi = f1 +f2 + f3 +…+ fi Ejemplo 3. Distribución de frecuencias porcentuales y acumuladas, basada en los datos que aparecen en la ejemplo 1. Puntajes (x) 28 - 32 33 - 37 38 - 42 43 - 47 48 - 52 53 - 57 58 - 62

Frecuencia Frecuencia s absolutas porcentual 10 8.33 15 12.50 20 16.67 35 29.17 19 15.83 12 10.00 9

7.50

fa 10 25 45 80 99 11 1 12 0

Fia menor que 8.33 20.83 37.50 66.67 82.50 92.50

Fia más que

100.00

7.50

100 91.67 79.17 62.50 33.33 17.50

Con ésta distribución de frecuencias podemos tener, entre otras, las siguientes informaciones: - El 29.17 % de los estudiantes obtuvieron puntaje entre 43 y 47. - El 61.67 % sacaron puntajes entre 38 y 52. - La Fa, 45, que aparece en la tercera clase significa que 45 estudiantes sacaron puntajes de 42 o menos. - El 17.5 % de estudiantes obtuvieron 53 y más puntos.

7

REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE FRECUENCIAS 1. Determinar el mayor y el menor de todos los datos, hallando así el rango (diferencia entre ambos). 2. Dividir el rango en un número adecuado de intervalos de clase del mismo tamaño (de igual amplitud). 3. Mediante una hoja de recuentos, determinar el numero de datos que caen dentro de cada intervalo de clase; esto es hallar la frecuencia de clases.

4. REPRESENTACION CONJUNTO

GRAFICA

DE

LOS

DATOS

DE

UN

La selección apropiada de una gráfica puede relacionarse con el carácter de la variable en estudio. Los principales tipos de gráficas que corresponden a las variables cualitativas , cuantitativas discretas y continuas, se pueden ver en el cuadro siguiente: Variable

Tipo de Gráfica Barras separadas Circular o de Pastel Barras Circular o de Pastel Histograma Polígono de frecuencias

Cualitativa Cuantitativa discreta Cuantitativa continua VARIABLES CUALITATIVAS. BARRAS SEPARADAS.

Ejemplo 4. Una pequeña encuesta estudiantil sobre preferencias de bebidas gaseosas produjo los siguientes resultados: Pepsi coca fanta coca fanta coca pepsi salva pepsi 8

Salva Sprite Sprite salva coca

coca fanta coca pepsi pepsi pepsi salva sprite fanta pepsi fanta coca salva coca pepsi pepsi coca pepsi sprite sprite salva coca salva coca coca fanta pepsi salva coca coca pepsi coca coca fanta coca fanta

Después del conteo, la distribución en clases y frecuencias queda como sigue: i 1 2 3 4 5

bebida Coca Fanta Pepsi Salva Sprite total

fi 17 8 11 8 6 50

fri % 34 16 22 16 12

Fi % 34% 50% 72% 88% 100%

Grafica de barras separadas para las compras de bebidas gaseosas.

CIRCULAR Grafica circular para las compras de bebidas gaseosas. 9

VARIABLES CUANTITATIVAS DISCRETAS Ejemplo 5. Distribución de frecuencias del número de maestros en una muestra de escuelas públicas, en Chalatenango.

Número de maestros 5 6 7 8 9 10 11 12

Cantidad de escuelas 6 8 10 12 8 11 7 4

10

VARIABLES CUANTITATIVAS CONTINUAS Un histograma es una gráfica constituida por barras verticales no separadas(límites reales). Para construirlo se marcan en el eje horizontal las clases y en el eje vertical las frecuencias. Sobre el intervalo correspondiente a cada clase se dibuja una barra de área proporcional a su frecuencia. Ejemplo 6. Clasificación de 40 alumnos de una escuela rural de acuerdo a su peso en libras. Clases

Frecuencia

29.5 – 34.5 34.5 – 39.5 39.5 – 44.5 44.5 – 49.5 49.5 – 54.5 54.5 – 59.5 59.5 – 64.5 64.5 – 69.5 69.5 – 74.5 Total

1 3 8 9 7 4 3 3 2 40

Puntos medios 32 37 42 47 52 57 62 67 72

11

Frecuencia acumulada “menos de” 1 4 12 21 28 32 35 38 40

Frecuencia relativa 0.025 0.075 0.200 0.225 0.175 0.100 0.075 0.075 0.050 1.000

La comparación de dos o mas distribuciones de frecuencias resulta fácil, si en lugar de levantar una barra sobre el intervalo correspondiente al la clase, se marca un punto con abscisa el punto medio y como ordenada la frecuencia. Luego los puntos se une con segmentos de recta y la figura resultante se denomina polígono de frecuencias. El área bajo el polígono de be ser igual al área comprendida por el histograma. Para lograr esto, usualmente el polígono se prolonga tal como puede apreciarse en la gráfica siguiente, procediendo como si existiera una clase adicional al principio y otra al final, ambas con frecuencia de cero.

12

5. MEDIDAS DE TENDENCIA CENTRAL Medidas de Posición: son aquellos valores numéricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las más usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos: de tendencia central o de tipismo.

Medidas de Dispersión: se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las más usuales son el desvío estándar y la varianza.

LA MEDIA ARITMETICA

13

Entre las medidas de tendencia central, la mas popular es la “media aritmética”, que comúnmente se llama “promedio” DEFINICION: La media aritmética de un conjunto de N datos: x1, x2, ….., xN, se denota por x y se define así: N

Suma de todos los datos x Número total de datos

= x1  x 2  .....x N N



x i 1

i

N

NOTA: El símbolo  es la letra griega “sigma mayúscula” que corresponde a la letra S. EJEMPLO 1: Calcular la media de 8, 16, 4, 12 y 10 SOLUCION: x

8  16  4  12  10 50   10 5 5

Advierta: la media es uno de los datos.

EJEMPLO 2: Calcular la media de SOLUCION: x

8, 16, 4, 12 y 5

8  16  4  12  5 45  9 5 5

La media, 9, no es uno de los datos x1  x 2  .....x N f 1 , f 2 ,....., f N Si los números ocurren veces, respectivamente (o sea con frecuencias f1 , f 2 ,....., f N ), la media N

f x  f x  ........f N x N x 1 1 2 2  f1  f 2 ..........f N

 fi x i i 1 N

f i 1

N



f x i 1

i

i

N

i

aritmética es EJEMPLO 3: 5,8,6 y 2 ocurren con frecuencias 3,2,4 y 1 respectivamente. Hallar la media. SOLUCION: x

3(5)  2(8)  4(6)  2 15  16  24  2 57    5.7 3  2  4 1 10 10

14

x1 , x 2 ,....,.x N , A veces asociamos con los números unas w1 , w2 ,....., w N , dependiente de la ponderaciones (o pesos) relevancia asignada a cada número (no a su frecuencia). En este caso: N

w x  w2 x 2  .....wN x N x 1 1  w1  w2  .....wN

w x i 1 N

i

i

w i 1

i

Se llama “media aritmética ponderada” con pesos w 1, w2,......, wn EJEMPLO 4: El primer examen parcial vale el 20%, el segundo parcial, el 25%, las tareas el 30% y el examen final el 25% de la nota final. Si un estudiante tiene las calificaciones 1er. P: 3.0; 2º.P: 5.8; tareas: 8.0 y EF: 6.4, ¿Cuál es la media aritmética ponderada (nota final)?SOLUCION: x

(0.2)(3.0)  (0.25)(5.8)  (0.3)(8.0)  (0.25)(6.4)  6.05 0.2  0.25  0.30  0.25

VERIFICANDO SU COMPRENSIÓN 1. Calcule la media aritmética para el conjunto de datos. a) 6,8,3,9 y 5 b) 6,6,8,8,3,9,9,9,5 y 5 2. Calcule la media aritmética ponderada para el conjunto de datos 3.0, 2.0, 6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30% respectivamente. LA MODA DEFINICION: La moda de un conjunto de números es el valor que ocurre con mayor frecuencia (valor más frecuente)

NOTA: La moda de un conjunto puede no existir, e incluso no ser única, en caso de existir. 15

EJEMPLO 5. EJEMPLO 6. EJEMPLO 7. dice que es

El conjunto 1,2,3,3 y 4 tiene moda 3 El conjunto 1,2,3, y 4 no tiene moda El conjunto 1,1,2,2,3 y 4 tiene dos modas: 1 y 2; se bimodal.

LA MEDIANA DEFINICION: La mediana (med) de un conjunto de números ordenados en sentido creciente (decreciente) es: el valor central, si el número de datos es impar; o la media de los valores centrales, si el número de datos es par. EJEMPLO 8. El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6 EJEMPLO 9. El conjunto de números 5,5,6,8,9 y 10 tiene mediana x

68 7 2

EJEMPLO 10. Calcular la mediana del conjunto: 8,5,10,7,6,9,2,2,5 y 6 SOLUCION: Primero se ordenan los números (orden creciente): 2,2,5,5,6,6,7,8,9 y 10. Como hay un número impar de datos, la mediana es 6 (la mediana es uno de los datos) EJEMPLO 11. Calcular la mediana del conjunto: 7,4,7,4,5,5,6,6,6,3,3,2,1 y 1 SOLUCION: Primero se ordenan los números (orden creciente): 1,1,2,3,3,4,4,5,5,6,6,6,7 y 7. Como hay un número par de datos, la mediana es

45  4.5 2

(la mediana no es

MEDIDAS DE DISPERSION La localización o tendencia central no necesariamente proporciona información para describir datos de manera adecuada. Para el caso, consideramos los siguientes ejemplos. EJEMPLO 1.

16

Suponga que en un hospital, el nivel de azúcar en la sangre de cada paciente se mide tres veces por semana. En cierta semana los registros de dos pacientes indican: Paciente A: 90, 100 y 110 miligramos por decilitro Paciente B: 40, 100 y 160 miligramos por decilitro El promedio de ambos pacientes es 100. En efecto: Paciente A: Paciente B:

90  100  110 300   100 3 3 40  100  160 300   100 3 3

Observe la diferencia en variabilidad. Mientras que el paciente A es bastante estable, el nivel del paciente B fluctúa ampliamente. Este resultado deberá tomarse en cuenta cuando se prescriba su tratamiento. COMENTARIO: Un paciente con un nivel de azúcar en la sangre de 40 mg/dl, convulsiona; con un nivel de 160 mg/dl podría ser diabético. EJEMPLO 2. Se va a seleccionar a un atleta para que represente a la Universidad en los juegos estudiantiles, en la prueba de los 100 metros. Se tienen dos candidatos: A y B. Para decidir por uno de ellos se les toman los tiempos que se tardan en recorrer los 100 metros en cinco ocasiones. A continuación de detallan: Atleta A: Atleta B:

11.0, 11.8, 11.6, 11.3 y 12.3 segundos 11.5, 11.6, 11.6, 11.8 y 11.5 segundos

El tiempo promedio de ambos atletas es 11.6 segundos (verificarlo) pero el grado de variabilidad del atleta B es menos que el del atleta A. Por tener menos altibajos, el atleta B tendría que ser el seleccionado. Casos como los anteriores (medicina, deportes) muestran la necesidad de descripciones estadísticas que midan el grado en que se dispersan (o varían) los 17

datos, respecto a su centro; es decir; la necesidad de las medidas de dispersión. Dos de ellas son: la amplitud (o rango) y la desviación típica. AMPLITUD (RECORRIDO O RANGO) DEFINICION: La amplitud (recorrido o rango) de un conjunto de datos numéricos es la diferencia entre el mayor y el menor de todos ellos. EJEMPLO 3. En el ejemplo 1, el rango para el nivel de azúcar en la sangre del paciente A es 110 – 90 = 20 y de 160 – 40 = 120, para el paciente B. En el ejemplo 2, el rango para el tiempo del atleta A es de 12.3 – 11.0 = 1.3 segundos, y de 11.8 – 11.5 = 0.3 segundos, para el atleta B. DESVIACION TIPICA (O ESTANDAR) El rango se utiliza principalmente como indicación fácil y rápida de la variabilidad, pero por lo general, no es medida de dispersión útil. Su principal inconveniente radica en que nada se dice acerca de la dispersión de los valores que están entre el mayor y el menor valor. Por ejemplo, cada uno de los conjuntos de datos siguientes: Conjunto A: 3,4,5,6,11,16,17,18 y 19 Conjunto B: 3,8,9,10,11,12,13,14 y 19. Tiene un rango de 19 - 3 = 16 ( y una media de 11); pero la dispersión (como se ve en el diagrama adjunto) es completamente distinta en cada caso. media Conjunto A: 3 4 5 6 11 16 17 18 19 media Conjunto B: 18

3

8

9

10

11

12

13

14

19 Observamos que la dispersión en un conjunto de datos:  Es pequeña si los datos están ubicados muy cerca alrededor de su media aritmética y  Es grande si los datos están ubicados distantes alrededor de su media. Por lo tanto, parece razonable tener una medida para la dispersión de un conjunto de datos, en términos de las cantidades por las que difieren de su media aritmética. A estas cantidades les asignaremos un nombre, en la siguiente definición. DEFINICION: Si un conjunto de datos x1 , x 2 ,.....,.x N tiene la media x , las diferencias x1  x, x 2  x,........,.x N  x , se llaman “desviaciones de la media”. DEFINICION: La desviación típica de una población de N datos: se denota por  , (letra griega sigma) y se define como N

 (x



i 1

i

 x) 2

N

Si ocurren con frecuencias desviación típica puede expresarse como x1 , x 2 ,.....,.x N

N



 f (x i 1

i

i

 x) 2

f 1 , f 2 ,..... f N

respectivamente, la

N

donde N =

N

f i 1

i

En palabras:  es la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones. DEFINICION: La desviación típica de una muestra de N datos: se denota por S y se define como N

S

 (x i 1

i

 x) 2

para datos sin agrupar

N 1 19

N

S

 f (x i 1

i

i

 x) 2

para datos agrupados en tablas de frecuencia

N 1

NOTA: “Muestra” es el conjunto de datos que se pueden utilizar, en forma razonable, para hacer generalizaciones acerca de la población de la cual provienen. ADVIERTA: Las fórmulas para S se obtienen escribiendo N-1 en el denominador de las formulas para  . CASO 1: Desviación típica para datos sin agrupar EJEMPLO 1. Considérese cada una de las siguientes muestras: Muestra A: 3,4,5,6,11,16,17,18 y 19 Muestra B: 3,8,9,10,11,12,13,14 y 19

Obtenga la desviación típica de cada muestra e indique cuál de ellas es la que presenta mayor dispersión. SOLUCION. Para la muestra A. Paso 1. Paso 2.

x

3  4  5  6  11  16  17  18  19 99   11 9 9 9

2 El cálculo de S   ( xi  x) i 1

la que sigue: Variable x

Desviación

3 4 5 6 11 16 17 18 19

-8 -7 -6 -5 0 5 6 7 8

se facilita con una tabla como Cuadrado de la desviación ( xi  x) 2 64 49 36 25 0 25 36 49 64

( xi  x )

20

9

S   ( xi  x ) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348 i 1

y 9

 (x

S

i 1

i

 x) 2

=

N 1

348 9 1

=

348 9 1

= 6.6

Para la muestra B Paso 1.

x

3  8  9  10  11  12  13  14  19 99   11 9 9

Paso 2. Calculamos

Variable

x

9

 (x i 1

 (x i 1

i

( xi  x )

-8 -3 -2 -1 0 1 2 3 8

Cuadrado de la desviación ( xi  x) 2 64 9 4 1 0 1 4 9 64

 x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156 9

S

 x) 2

Desviación

3 8 9 10 11 12 13 14 19 9

i

 (x i 1

i

 x) 2

N 1

=

3156 9 1

=

3156 9 1

y

= 4.4

Puesto que la desviación típica del conjunta A es mayor que la del conjunto B, concluimos que la muestra A es la más dispersa. DEFINICION: La varianza de un conjunto de datos se define como el cuadrado de la desviación típica, de modo que  2 y S 2 representan la varianza de la población y la varianza de la muestra, respectivamente. VERIFICANDO SU COMPRENSION 21

1. Determine cuál de las siguientes muestras es la más dispersa. a) 6,3,12,5,8 y 9 b) 3,5,6,7,4,10 y 8 2. Determine cuál de las siguientes muestras es la menos dispersa a) 7,9,3,6,5,4 y 2 b) 8,7,4,11,2 y 5 3. Hallar, en cada caso, la desviación típica y la varianza a) 3,6,2,1,7 y 5 b) 3,2,4,6,5 y 8 CASO 2: Desviación típica para datos agrupados EJEMPLO 2. Supóngase que en 9º grado hay 40 alumnos, cuyas edades se resumen en la siguiente tabla de frecuencias Edades x 14 15 16 17 Hallar el valor de S.

No. de alumnos (f) 6 15 16 3

SOLUCION Para facilitar los cálculos usamos la siguiente tabla

X 14 15 16 17 TOTAL 4

x

 i 1

f i xi

N

f 6 15 16 3 40

f (x )

( xi  x ) 2

f ( xi  x) 2

f ( xi  x ) 2

84 225 256 51 616

-1.4 -0.4 0.6 1.6

1.96 0.16 0.36 2.56

11.76 2.40 5.76 7.68 27.60

N

616   15.4 40

S

22

 f ( x  x) i 1

i

i

N 1

2



27.6  0.84 39

MEDIDAS DE POSICIÓN CUANTILES Para muchos propósitos, es importante obtener valores que dividen un conjunto de datos ordenados, en fracciones especificas. LA mediana es un ejemplo de éste tipo de medida; ella divide al conjunto en dos partes iguales: La mitad de los valores son inferiores a la mediana y la otra mitad superiores. En forma similar se pueden calcular: - Los cuartiles, que son valores de la variable que dividen a conjunto en cuartas partes.

Así, el primer cuartil, Q1, es un valor tal que una cuarta parte de los datos son menores que él y tres cuartas partes son mayores. Q2, es igual a la mediana y Q3, supera a los tres cuartos de los datos y solo es superado por un cuarto de ellos. Además de la mediana y los cuartiles pueden calcularse también lo deciles: D1, D2, ......D9, los cuales dividen al conjunto en décimas. Los percentiles: P1, P2,....P99, que lo dividen en centésimos. Todos éstos valores reciben el nombre de cuantiles y pueden resultar muy apropiados para apreciar la posición de los datos de un conjunto y su posición. Tanto la mediana como los cuartiles y los deciles constituyen casos particulares de los percentiles y pueden expresarse como percentiles. Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc. Resulta entonces que teniéndose una fórmula para el calculo de la posición de los percentiles, puede obtenerse con ella, la posición de cualquier cuantil. Para el calculo de la posición de los percentiles se debe, en primer lugar, ordenar los datos. Una vez hecho esto, puede aplicarse la fórmula siguiente: 23

n

La posición de k-ésimo percentil se encuentra calculando ( 100 )k, donde n es el número de datos. Sí el resultado es un número decimal, seleccione como indicador del orden al entero próximo superior y el percentil a localizar es Pi. Si el resultado es un entero seleccione como indicadores de orden al entero obtenido i y al siguiente i + 1. El percentil se obtiene haciendo Pk =

xi  ( xi  i) 2

Ejemplo. Calcular Q2 y la mediana. Considérense para ello, los siguientes datos, que se refieren a los pesos de 40 estudiantes de una escuela rural y que se presentan en el orden en que fueron pesado los alumnos: 49 44 46 45 42 35 51 41

60 59 52 36 53 74 67 46

45 40 55 50 53 43 40 32

37 62 41 51 68 47 70 57

54 47 66 48 56 60 49 43

Así como están los datos resulta difícil sacar una conclusión, por lo tanto, como no son muchos, puede iniciarse el análisis haciendo una ordenación en forma creciente. 32 35 36 37 40 40 41 41 La posición de Q2 así: es:

40 x 50 = 100

42 43 43 44 45 45 46 46 es igual a la

47 52 47 53 48 53 49 54 49 55 50 56 51 57 51 59 posición de P50, la cual se

60 60 62 66 67 68 70 74 obtiene

20 Los datos a localizar son: X20 y X21. El valor de Q2 Lic. Mauro H. Henríquez Rauda 24

Q2 =

X 20  X 21 50  53  2 2

= 51.5

La mediana es igual a P50 = Q2 = 51.5

25

Conclusión La estadística es una ciencia con un amplio campo de acción. Mediante esta, se recolecta, se ordena, se resume, y se interpretan datos, obtenidos utilizando ciertas técnicas, como lo es la encuesta. Es utilizada a partir de la formación de las sociedades humanas, hasta en al Biblia, se menciona un censo, que no es más que un estudio o un conteo donde se determinan la cantidad de habitantes de un país. La estadística se divide en dos grandes ramas, y de estas se subdividen otras. Estas son la descriptiva y la inferencial. La primera solo se ocupa de describir y analizar un conjunto determinando de datos.; y la segunda permite inferir a la población, o conjunto de valores cuantificables, observando una parte representativa de ella. Para el resumen y distribución se usan un sin número de índices y fórmulas. Se representan estas distribuciones en gráficos de frecuencias, en donde el más utilizado es el histograma y el polígono de frecuencias. Existen ciertas similitudes en ambos, pero se diferencian en que el histograma se representa mediante rectángulos que representan las frecuencias de clases, y en el polígono de frecuencia se unen los puntos medios de las frecuencias de clases, con una línea. En adicción, se cuenta con una gran variedad de medidas centrales, de simetría, de variabilidad, dispersión, índices compuestos, etc., cuyo uso dependerá del estudio de que se trate. Son de gran utilidad, especialmente en el área económica, ya que permiten determinar la variación de determinados datos, en un periodo determinado y así corregir errores en un presente. Algunas de estas medidas se pueden 26

considerar como indicadores económicas, por su función en el desempeño de la economía.

27

Bibliografía  Pérez P., Víctor F. Manual básico de Estadística Descriptiva. 2000.  Sarramona, Jaime. Estadística Aplicada a la Administración  Spiegel, Murria. Estadística Aplicada. 2da Edición.  Stevenson, William J. Estadística para Administración y Economía.

28

29