Banco de Preguntas #01

BIOESTADÍSTICA 1 Pag. 1 USAMEDIC 2015 LAS FUNCIONES DE LA BIOESTADISTICA 1. Primer Acto : Recopilar datos BIOESTADI

Views 87 Downloads 3 File size 4MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

BIOESTADÍSTICA 1

Pag. 1

USAMEDIC 2015

LAS FUNCIONES DE LA BIOESTADISTICA

1. Primer Acto : Recopilar datos

BIOESTADISTICA 1 INTRODUCCION Y CONCEPTOS GENERALES

DEFINICION La Estadística en Medicina, nace por la necesidad de “MEDIR” y conocer el comportamiento de la Población en relación a aspectos relacionados con la salud y la enfermedad. Es la matemática aplicada a las ciencias de la salud. Funciones: -

Recolección de datos. Organización datos. Procesamiento y análisis de datos. Interpretar resultados Para la toma de decisiones.

 Sus fines son describir al conjunto de datos obtenidos y tomar

2. Segundo Acto : Organizar los datos 3. Tercer Acto : Procesar los datos

4. Cuarto Acto : Interpretar resultados

1. RECOPILAR DATOS (RECOGER / RECOLECTAR) FUENTE PRIMARIA

Cuando se registran

características mediante la medición, observación y conteo, para lo cual utiliza Fuentes primarias o

FUENTE SECUNDARIA

secundarias.

decisiones o realizar generalizaciones acerca de las características de todas las observaciones bajo consideración.

TIPOS DE ESTADISTICA • Una vez que se ha realizado la recolección de los datos, se obtienen datos en bruto, los cuales rara vez son significativos sin una organización y tabulación.

LA APLICACIÓN DE LA BIOESTADISTICA EN LA MEDICINA ASISTENCIAL Y LA SALUD PUBLICA

2. ORGANIZAR DATOS (ORDENAR) Cuando se ordenan para una mejor comprensión y facilitar sus análisis.(tablas, gráficos y figuras) Tabla de Distribución Edad 30 35 40 45

-

34 39 44 49

N° Pacientes 6 12 8 2

Diagrama Circular

BIOESTADÍSTICA 1

Pag. 2

3. PROCESAR DATOS (ANALISIS)

USAMEDIC 2015

LA VARIABLE (característica a estudiar) • •

E. DESCRIPTIVA Cuando se calculan promedios y medidas de variabilidad entres otros cálculos.

Es una dimensión o característica de la unidad de análisis, que permite su clasificación. propiedad, atributo, rasgos o cualidades de las Unidades de Análisis (individuos), que es materia de interés del estudio.

Es lo que se quiere conocer de la unidad de análisis. Ejemplo

E. ANALITICA cuando se establecen relaciones entre las variables (regresión y correlación).

En la familia: numero de componentes, ingresos, el grado de educación, gastos mensuales, etc. Lo importante en una variable es: a. Que se derive siempre de una unidad de análisis.

b. Que admita un rango mínimo de variación

TALLA

EDAD

COLOR PISOS

PESO

COLOR DE CABELLO

MIEMBROS VENTANAS

PROFESION AREA IDIOMA

PRESION ARTERIAL

VALOR

4. INTERPRETAR RESULTADOS

Cuando sentido

se

le

otorga

práctico

a

Un valor es la magnitud, rango o atributo a través del cual se expresa la variable. Cada uno de estos rangos son valores de la variable

un

La variable edad puede tomar los siguientes valores:

– 1 a 10 años

los



11 a 20 años



21 a 30 años



31 a 40 años

La variable sexo admite dos valores • Hombre • Mujer

resultados obtenidos en el análisis

La variable educación puede ser construida mediante tres valores • Educación alta • Educación media • Educación Baja

1. ¿Qué es un DATO? Toda unidad de Información

Ejemplo de dato:

Estructura a partir de la cual el investigador genera sus estudios e indagaciones

Características (Variable)

Peso Estatura Profesión

Valor

75 1,80 Médico

Unidad de medida

Kg. mts. ----

Las tres partes del “dato”: • La unidad de análisis. • La variable o variables • El valor o magnitud.

LA UNIDAD DE ANALISIS (individuo) • Es el elemento mínimo de estudio, observable o medible en relación con un conjunto de elementos que son de su mismo tipo. • Se denomina también INDIVIDUO, UNIDAD ELEMENTAL o ESTADISTICA.

INDIVIDUO

Si el DATO es útil para tomar decisiones se convierte en INFORMACIÓN.

2. POBLACION Y MUESTRA La POBLACION o Universo, es un concepto estadístico que hace referencia al conjunto total de elementos a estudiar, el cual es inaccesible e inabordable de manera directa, por lo tanto, se recomienda trabajar con una parte de ella , es decir, la MUESTRA.

Es la persona, animal o cosa de la que se quiere conocer algo. Ejemplos • En ciencia sociales: la familia, el obrero, la empresa, los grupos, las naciones, etc.

MUESTRA

POBLACIÓN

INFERENCIA ESTADÍSTICA

ESTADÍSTICA DESCRIPTIVA

BIOESTADÍSTICA 1

Pag. 3

USAMEDIC 2015

5. Parámetros y estadísticos 3. MARCO POBLACIONAL Y POBLACION ESTADISTICA MARCO POBLACIONAL: Es el conjunto total de individuos, elementos o unidades de análisis.

• Parámetro: Valor representativo de una POBLACION. Se

simboliza por letras griegas. Sólo hay un parámetro en cada población.

 2  

Media poblacional Varianza poblacional Desviación estándar poblacional Proporción poblacional

• Estadístico: Valor representativo de una MUESTRA. Se

TODAS las Unidades de análisis (Individuos)

simboliza por letras latinas. Existen tantos estimadores como muestras se extraigan de una población. Sinónimo: EstimadorEstadígrafo.

POBLACION (UNIVERSO): Es el conjunto total de VARIABLES (características) de interés del estudio que se encuentran en un marco poblacional.

Cada población tiene el mismo número de VARIABLES que número de INDIVIDUOS tiene el marco poblacional. De cada Marco Poblacional se podrán extraer tantas poblaciones como características de interés se deseen investigar.

x

Media muestral.

s2

Varianza muestra.

s

Desviación estándar muestral.

p

Proporción muestral.

RELACION ENTRE PARAMETRO Y ESTIMADOR

4. MARCO MUESTRAL Y MUESTRA ESTADISTICA POBLACION

n1

MUESTRAS

x1

MARCO MUESTRAL: subconjunto de individuos extraído de un marco poblacional.

Todas los pesos de los alumnos de USAMEDIC

Sub conjunto de Unidades de análisis (Individuos)

n2

x2 x3

n3 . .

Promedio de peso = 65 Kg. Promedio de peso = 62 Kg.

. .

nm

MUESTRA: subconjunto de variables, extraído del marco muestral.

Promedio de peso = 55 Kg.

x m Promedio de peso = 58 Kg.

•Una muestra tiene el mismo número de variables que número de individuos tiene el

marco muestral. •De cada marco muestral se podrán extraer tantas muestras como características se

deseen investigar.

ESTIMADORES Varios promedios

PARÁMETRO Promedio del peso= 60 Kg

Ejemplo: Unidad de análisis = Paciente del hospital

6. TIPOS DE DATOS (INFORMACION)

MARCO POBLACIONAL Unidad de Análisis

Característica (VARIABLE)

(1200 pacientes de un Hospìtal)

Edad

Enfer. Anteriores

Peso

Población Registro de la característica

Estado Civil

Población

Población

P2

P3

P1 (1200 datos)

¬

DATO CONSTANTE: Si el registro de la característica toma un sólo valor en todas las unidades elementales. Ejemplo: • Profesión de los Médico del Perú

integrantes

del

Colegio

Pn

...

(1200 datos)

Las constantes no son de mayor interés en Estadística.

Marco Poblacional

Técnicas

Característica Edad

Marco Muestral

de muestreo

1200 pacientes de un hospital

Edad

Peso

MUESTRA

75 datos

POBLACIÓN

POBLACIÓN

P1

P2

Peso

Énf. Ant.

Estado civil

Estado civil

Enf. Ant.

m1

Registro de la característica.

- DATO VARIABLE:

75 pacientes de un hospìtal

POBLACIÓN

P3

POBLACIÓN

...

Pn

MUESTRA

m2

MUESTRA

m3

Si el registro de la característica toma diversos valores en las unidades elementales.

MUESTRA

mn

Ejemplo: • Edad de los pacientes. • Profesión de los profesores de Universidad Daniel Alcides Carrión

la

Los datos variables son los de mayor interés en Estadística. A estos se les denomina comúnmente “VARIABLES”.

BIOESTADÍSTICA 1

Pag. 4

USAMEDIC 2015

7. CLASIFICACIÓN DE VARIABLES

VARIABLES

   NUMÉRICAS  cuantitativas        CATEGORICAS  cualitativas 

 CONTÍNUAS     DISCRETAS

Tipos de escalas de medición a) Escala Nominal o Intensiva: variables cualitativas nominales b) Escala Ordinal: variables cualitativas ordinales

c) Escala de Intervalo d) Escala de Proporción o Razón  DICOTOMICAS   ORDINALES   NOMINALES

CLASIFICACIÓN DE VARIABLES

a) Escala Nominal:

1.- Variables Numéricas o Cuantitativas : Aquellas variables que se expresan por números los que se obtienen a través de un conteo o una medición. Las operaciones posibles entre estas variables son los promedios y las medidas de dispersión, entre otras. Se reconocen porque tienen unidades de medida.

(variables cualitativas nominales) La escala de medida nominal, consiste en la asignación arbitraria de números o símbolos a cada una de las diferentes categorías en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones entre dichas categorías. – consiste en clasificar los objetos de estudio según las categorías de una variable. El alcance de esta escala es el conteo. •

Las variables cuantitativas pueden ser:

Ejemplo

- DISCRETA : Cuando la variable sólo puede tomar valores enteros dentro de una escala de valores. Proviene de un conteo.

Ejemplo: Número de emergencias médicas por día.

Sexo

1:Masculino

Especialidad

1:Clínico

2:Femenino 2:Cirugía

- CONTINUA : Cuando la variable puede tomar cualquier valor (entero fracción), dentro de una escala de valores. Provienen de una medición.

Ejemplo: Tiempo de permanencia de un paciente en un consultorio externo

CLASIFICACIÓN DE VARIABLES 2.-Variables Cualitativas : Aquellas variables que no se pueden expresar por números sino por cualidades o categorías que representen sus atributos. Solo se pueden registrar mediante el conteo. Las operaciones posibles son: la tasa porcentual, proporciones y la moda. No tienen unidades de medida. Ejemplo: Profesión de los participantes a un curso. • 80% son médicos (tasa porcentual). • 8 de cada 10 participantes son médicos (proporción).

b) Escala Ordinal:

(variables cualitativas ordinales y cuantitativas) •



En caso de que puedan detectarse diversos grados de un atributo, la medida ordinal es la indicada, puesto que puede recurrirse a la propiedad de "orden" de los números asignándolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado que B. Hay variables cuantitativas que se pueden convertir a la escala ordinal por ejemplo, la glicemia se puede expresar en: Hipoglicemia, Normoglicemia e Hiperglicemia.

Ejemplo: • Calificación : A,B,C,D A>B • Lugar : 1º , 2º , 3º 1º > 2º • Grado de deshidratación : I, II, III, IV I>II • APGAR, Silverman, Glasgow. • Escala del dolor • Satisfacción de usuarios

Las variables cualitativas pueden ser:

a) Dicotómicas o Binarias (si o no) b) Ordinales (orden creciente o decreciente) c) Nominales (Profesiones, Estado Civil, etc.)

c) Escalas de intervalos iguales: 8. ESCALAS DE MEDIDA O MEDICION:

DEFINICION Una escala es un patrón convencional de medición, y básicamente consiste en un instrumento capaz de representar con gran fidelidad verbal, gráfica o simbólica, el estado de una variable

(variables cuantitativas) •

Se basa en la afirmación de la existencia de un continuo, seccionable en partes iguales, en donde cada parte seccionada contiene la misma cantidad de unidades que cualquier otra sección.



Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo.



Esta escala, además de poseer las características de la escala ordinal, encontramos que la asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de los intervalos (distancia) entre todos los elementos de la escala.

Ejemplo: Año Hora Temperatura

0 00:00 0ºC

BIOESTADÍSTICA 1

Pag. 5

USAMEDIC 2015

d) Escala de coeficientes o Razones: (Variables cuantitativas) •

El nivel de medida más elevado es el de coeficientes o razones, y se diferencia de las escalas de intervalos iguales únicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que se mide.

La muestra

:

Registro diario de procesos deficientes durante los 10 días elegidos al azar.



Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B.

Tipo de dato

:

Variable cuantitativa discreta

Un valor registrado

:

Ejemplo:

Ingreso mensual : Nº de hijos Procesos deficientes

S/.00. : :

0 0

Ejercicio Aplicativo 1

32

La unidad de medida :

Procesos

El estimador

:

Media aritmética muestral (

El parámetro

:

Media aritmética poblacional (µ)

x)

BIOESTADISTICA 2

En un programa para la detección de hipertensión en un marco muestral de 30 hombres en edades entre 30 y 40 años, la distribución de la presión diastólica (mínima) en mm Hg fue la siguiente: 70

85

85

75

65

90

110

95

90

70

60

75

80

120

85

95

90

70

100

65

80

90

95

90

95

110

100

85

80

75

Cual es el Marco Poblacional: Cual es la Población:

PRESENTACION DE DATOS

Tabulación y Graficación Todo análisis estadístico es una estrategia para traducir la cantidad de información obtenida en la recolección de datos, a índices o formas que sean interpretables y que representen alguna dimensión del comportamiento de las variables

Cual es el Marco Muestral: Cual es la Muestra: Cual es el individuo o unidad de análisis Cual es un valor

La estrategia más sencilla es mostrar la información en un formato visual (gráficos) o en un esquema sintetizado (tablas)

Que tipo de variable es: Cual es la Unidad de Media..

39

Ejercicio Aplicativo 2

TABLAS (tabulación)

En un Centro Médico se desea estimar el número promedio diario de procesos que no cumplen las normas de calidad. Con este fin se elige por sorteo 10 días laborales del último mes. En uno de los días elegidos se registraron 32 procesos médicos deficientes.

Las tablas deben incluir todos los puntajes registrados Deben respetar las características de la variable Llevan un título representativo del contenido (sobre la tabla, numerado)

PARTES DE UNA TABLA

En esta situación, identifique: La característica

: Número de procesos deficientes por día.

La unidad elemental

:

Un día (laboral).

   

TITULO TALON CUERPO NOTAS EXPLICATIVAS (Fuente) TITULO

El marco poblacional : Número de días (laborales) que viene funcionando el Centro Médico.

La población :

TALON

CUERPO

Registro diario de procesos médicos deficientes en todo el tiempo que viene funcionando el Centro Médico.

El marco muestral :

Diez días laborales (elegidos al azar)

NOTAS EXPLICATIVAS

BIOESTADÍSTICA 1

Pag. 6

USAMEDIC 2015

Gráficos de barras

TABLAS ESTADISTICAS (de frecuencia)

CARGO



Exponen la información recogida en la muestra:

OPERARIO GENERAL OPERADOR DE MAQUINA AUTOMATICA

– La forma más sencilla de presentar la información obtenida en un estudio es contabilizar el número de veces que aparece cada VARIABLE. Este indicador se conoce como la frecuencia de aparición da cada respuesta. – Cuando presentamos una variable indicando la frecuencia de aparición de cada uno de sus valores, tenemos una tabla de frecuencia.

Se utilizan para representar la frecuencia de variables de tipo cualitativa, por lo general de nivel nominal.

DESPACHADOR DE PRODUCTO TERMINADO LOCAL OPERADOR DE DOBLE FILO OPERARIO GENERAL OPERADOR DE DOBLE FILO

Para graficarla, la variable debe haberse resumido previamente en una tabla de frecuencias...

CARGO

Frec

OPERARIO GENERAL

145

OPERADOR DE M AQUINA AUTOM ATICA DESPACHADOR DE PRODUCTO TERM INADO LOCAL

10 8

OPERADOR DE DOBLE FILO

4

OPERADOR DE M AQUINA ST

12

OPERADOR DE SERVICIOS GENERALES

1

OPERADOR GRAL. ALM ACEN M ATERIA PRIM A Y PRODUCTOS

203 operarios clasificados segùn tipo

– Frecuencias absolutas: Contabilizan el número de variables de cada modalidad o clase (intervalo).

160

5

TERM INADOS

145

– Frecuencias acumuladas absolutas y relativas: Acumulan las frecuencias absolutas y relativas. Son especialmente útiles para calcular cuantiles (como veremos más adelante).

Número de operarios

140

– Frecuencias relativas (porcentajes unitarios): Ídem, pero dividido por el total, normalizadas.

120

100

80

60

40

10

20

8

4

12

5

1

0 OPERARIO GENERAL

OPERADOR DE MAQUINA DESPACHAD OR DE AUTOMATICA PRODUCT O TERMINAD O LOCAL

OPERADOR DE DOBLE OPERADOR DE MAQ UINA OPERADOR DE FILO ST SERVICIOS GENERALES

OPERADOR GR AL. ALMACEN MAT ERIA PRIMA Y PRODUCTOS TERMINAD OS

Tipo de ope rario

Las barras están separadas entre si, y el ancho de las mismas no es representativo

TABLA DE FRECUENCIAS Variable

Frecuencia

Frecuencia Normalizada (relativa)

Frecuencia acumulada

x

f

F

Fr

60 - 69

3

0.1

3

0.1

70 - 79

6

0.2

9

0.3

fr

Gráfico o Diagrama de Pareto

Frecuencia acumuada normalizada (relativa)

Se trata de una variante del gráfico de barras, en el que la tabla de frecuencias está ordenada de mayor a menor ... • 80%

7

0.23

90 - 99

9

0.3

25

0.83

100 - 109

2

0.07

27

0.90

110 - 119

2

0.07

29

0.97

1

0.03

30

1.00

30

1.0

80 - 89

120 - 129 total

16

0.53



Este gráfico permite identificar aquellas causas que explican el 80% de los efectos, por lo que también se le conoce como un gráfico de PRIORIZACION. Para su elaboración se requiere de la frecuencia acumulada relativa (porcentual).

Gráficos circulares (tortas, sectores, pie)

Ejemplo de Tabla para variables cualitativas nominales

Al igual que los gráficos de barra, se utilizan para representar variables de tipo cualitativa, generalmente para representar distribuciones porcentuales respecto a una clasificación. 203 operadores según tipo

Ejemplo de Tabla para variables cuantitativas discretas

2%

1% OPERARIO GENERAL

4%

3% OPERADOR DE MAQUINA ST

5%

OPERADOR DE MAQUINA AUTOMATICA

7%

DESPACHADOR DE PRODUCTO TERMINADO LOCAL OPERADOR GRAL. ALMACEN MATERIA PRIMA Y PRODUCTOS TERMINADOS

OPERADOR DE DOBLE FILO 78% OPERADOR DE SERVICIOS GENERALES

OJO: Todo tipo de variables (cuanti y cuali) se pueden tabular.

Otros gráficos para variables cualitativas

44

GRAFICOS (graficación)

Pictogramas  

Son complementos a la tabulación

Representan la distribución de la variable Deben ser fáciles de interpretar Deben llevar un título representativo (bajo el gráfico y numerado)

Fáciles de entender. Cada modalidad debe ser proporcional a la frecuencia.

BIOESTADÍSTICA 1

Pag. 7

USAMEDIC 2015

Ojiva

Gráficos para variables cuantitativas VARIABLES CUANTITATIVAS DISCRETAS GRAFICO DE BARRAS (diferencial)

GRAFICO INTEGRAL

También se vincula a los histogramas, ya que usa la información de la tabla de frecuencia (frecuencia acumulativa) para generar un gráfico muy usado para hacer estimaciones y generar respuestas

Operadores

Ojiva Resultado Evaluación 1,2 1 0,8 0,6 0,4 0,2 0 11,53 12,17 12,81 13,45 14,08 14,72 15,36 16,00 16,64 Salarios en miles de Bs.

Asimismo permite comparar varios conjunto de datos

VARIABLES CUANTITATIVAS CONTINUAS

Otros tipos de Gráficos

Histograma

Gráficos de cajas

Se utilizan para representar un conjunto de datos cuantitativos continuos. En general se requiere previamente el cálculo de una tabla de frecuencia, y su posterior representación.



Resultado Evaluación

Operadores

(Diagrama de Tuckey) •

70 60 50 40 30 20 10 0

Son gráficos muy simples que ayudan, entre otras cosas, a comparar la dispersión de dos o mas grupos de datos. Se utilizan principalmente para variable cuantitativas, excepcionalmente cualitativas ordinales. Cuartil 1

Cuartil 3 máximo

mínimo

Mediana (Cuartil 2)

10.89 11.55 12.22 12.88 13.54 14.21 14.87 15.53 16.20 Salarios en miles

Histograma

Diagramas de dispersión

• Es una gráfica de barras de una distribución de frecuencias.

 Son gráficos muy simples que sirven para comparar la relación que existe entre

variables cuantitativas. Clase fx

Curva de frecuencia

Frecuencia

Clases

Tipos de Clases

Limite superior de clase Limite inferior de Clase

Polígonos de frecuencia Diagrama de Tallos y Hojas Están vinculados al histograma porque trabajan con la misma información.

Resultado Evaluación 60 Operadores

50

40

Con dos pequeños cambios se puede convertir un histograma en este polígono.

30 20 10 0 11.21 11.85 12.49 13.13 13.77 14.40 15.04 15.68 16.32 Salarios en miles

No es un gráfico muy difundido a pesar de sus ventajas sobre el histograma.

Permite comparar varios conjunto de datos cuantitativos continuos

Es un diagrama donde cada valor de datos es dividido en una “hoja” (normalmente el último dígito) y un “tallo” (los otros dígitos). Por ejemplo el valor 32 seria dividido en “3” (tallo) y “2” (hoja). Se aplica para variables cuantitativas discretas.

BIOESTADÍSTICA 1

Pag. 8

Gráficos temporales Se utilizan para representar series de datos donde el eje horizontal está representado por el tiempo, es decir la variable evoluciona en el tiempo.

USAMEDIC 2015

BIOESTADISTICA 3

ESTADISTICA DESCRIPTIVA I

Energía Consumida Mensual 8.000 7.500 GWh

7.000 6.500 6.000 5.500 5.000 1

3

5

7

9 11 13 15 17 19 21 23 25 27 29 31 33 35 Meses

Estos gráficos son útiles para explorar datos donde no hay relaciones causales conocidas con otras variables

Diagrama máximo – mínimo 1. Centralización (Tendencia central) Útil para visualizar movimientos en el valor de cierta variable, dentro de un periodo de tiempo establecido

Ejemplo:

Variación en el número de emergencias diarias por semana. Julio 1998 100 90 80 70 60 50 40 30 20 10 0

– Indican valores con respecto a los que los datos parecen agruparse. • Media, mediana y moda

2. Medidas de Posición – Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. • Cuantiles, percentiles, cuartiles, deciles,...

3. Medidas de Dispersión – Indican la mayor o menor concentración de los datos con respecto a las medidas de centralización. • Desviación típica, coeficiente de variación, rango, varianza

4. Formas de la Distribuciòn – 4.1 Simetría – 4.2 Apuntamiento o curtosis 1ra. Semana

2da. Semana

3ra. Semana

4ta. Semana

Fuente: Hoja de registro, julio 1998

MEDIDAS DE TENDENCIA CENTRAL  Son medidas estadísticas que se usan para describir como se puede resumir la localización de los datos.  Ubican e identifican el punto alrededor del cual se centran los datos. Las medidas de tendencia central nos indican hacia donde se inclinan o se agrupan más los datos.  Las más utilizadas son: la media, la mediana y la moda.  Es un valor de resumen que pretende “representar” a los valores del conjunto. . . . .. . . . . . . . . . . . .. . . . .. . . . . . . . . .. . . . . . .. . . . . MTC . . . .... . .

.

.

RESUMEN DE GRAFICAS ESTADISTICAS

. . .

.

.

.

MEDIDAS DE TENDENCIA CENTRAL MEDIA MEDIANA MODA PERCENTILES CUARTILES

BIOESTADÍSTICA 1

Pag. 9

USAMEDIC 2015 Ventajas y desventajas de la media aritmética

LA MEDIA (promedio)

Ventajas:

• La media o media aritmética, usualmente se le llama promedio. • Se obtiene sumando todos los valores de los datos y dividiendo el resultado entre la cantidad de datos. • Si los datos proceden de una muestra, el promedio se representa con X. Si los datos proceden de la población, se utiliza la letra griega µ. • Este valor “depende” de las magnitudes de cada dato del conjunto.

ä

Concepto familiar para muchas personas

ä

Es única para cada conjunto de datos

ä

Es posible comparar medias de diferentes muestras Desventajas ä

Se ve afectada por los datos extremos

ä

Si la muestra es grande y los datos no están agrupados, su cálculo es tedioso

ä

Si los datos están agrupados en clases con extremos

abiertos, no es posible calcular la media.

Calculo de la media o promedio •

x

x

LA MEDIANA

La fórmula matemática para calcular la media o promedio es la siguiente:

donde;

N

N

X

= promedio = signo de sumatoria = numero de datos



La segunda medida de tendencia central que analizaremos es la mediana, en ocasiones se le llama media posicional, porque queda exactamente en la mitad de un grupo de datos, luego de que los datos se han colocado de forma ordenada.



En este caso la mitad (50%) de los datos estará por encima de la mediana y la otra mitad (50%) estará por debajo de ella.



La mediana es el valor intermedio cuando los valores de los datos se han ordenado.



Se puede aplicar para variables cuantitativas y cualitativas ordinales.

 Otro Ejemplo: La siguiente tabla muestra el número de reclamos y quejas presentadas por pacientes de una clínica a lo largo de una semana. Calcule e interprete la media.

Día/Semana Reclamos/día

Media aritmética

=

x

Lun 8

Mar 10

Mier 5

Jue 12

Vier 10

Sab 15

8  10  5  12  10  15 60  6 6

=

10 reclamos Interpretación: si elige al azar un día de la semana, se espera que los pacientes de esta clínica realicen 10 reclamos por día (función de representación).

La media aritmética ponderada (

xp )

Ejemplo: El Hospital del Callao atiende 2,800 consultas diarias, cobrando

tres tipos de tarifas: social, diferenciada y por convenio. El número de pacientes y el valor de cada nivel tarifario se muestra a continuación. Calcule e interprete la tarifa media por consulta. Tipo de Tarifa

Tarifa S/.

Pacientes

5 15 40

Social Diferenciada Por convenio

60% 30% 10%

Calculo de la mediana Obtención: Se obtiene ordenando la serie de datos (en forma ascendente o descendente) y ubicando el dato central.

Ejemplo: Los siguientes datos se refieren al número de niños atendidos durante los últimos 11 días en un Servicio de Emergencia Pedriáticas del Hospital de Huacho. Calcule e interprete la mediana.

12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16 Primero se ordenan los datos:

5(0,60)  15(0,30)  40(0,10) 0,60  0,30  0,10 11,5 xp   S / .11,50 1,0

xp



5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 5 datos menores

5 datos mayores

mediana

Interpretación: Durante 5 días iempo)(50% del se atendieron a menos de 11 pacientes por día, y durante 5 días se atendieron a más de 11 pacientes por día.

La media geométrica (

xg

)

Reglas

se usa para encontrar el promedio de porcentajes, razones, índices o tasas, como la tasa media de crecimiento poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros. a) Obtención: se obtiene extrayendo la raíz enésima del producto de los n valores de una serie.

xg

 n X1



X2



X3

 ... 

Xn

xh Se utiliza para calcular variables como productividades, velocidades, rendimiento, aceleración media, cambios o variaciones como el tiempo medio para realizar un proceso médico.

1º Si la serie es impar, la mediana ocupa el lugar central de la serie previamente ordenada. Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24

2º Si la serie es par, la mediana se obtiene de la semisuma de los dos valores centrales de la serie previamente ordenada.

Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34 mediana 

a) Obtención: se obtiene calculando el inverso de la media aritmética de los inversos de una serie.

xh

1



n

1 X 1

 i

i

n

18  23  20,5 2

3º Sea la serie par o impar, la mediana ocupa el lugar, de la serie previamente ordenada.

 n  1  2 

BIOESTADÍSTICA 1

Pag. 10

USAMEDIC 2015

Ventajas y desventajas de la moda.

• Ejemplo:

Ventajas:

Los salarios de siete empleados fueron los siguientes (en 1000s) : 28, 60, 26, 32, 30, 26, 29. ¿Cuál es la mediana?

Supongamos que se agrega al grupo el Salario de un empleado más ($31,000). ¿Cuál es la mediana?

Nro. de observaciones es impar

Nro. de observaciones es par

Primero, ordenar los salarios. Luego, localizar el valor en el medio.

Primero, ordenar los salarios. Luego, localizar el valor en el medio.

26,26,28,29,30,32,60

ä Se puede utilizar tanto para datos cualitativos como cuantitativos. ä No se ve afectada por los valores extremos ä Se puede calcular, a pesar de que existan una o más clases abiertas.

Desventajas:

26,26,28,29,29.530,31, 32,60 ,30,31,32,60 26,26,28,29,

ä

No tiene un uso tan frecuente como la media.

ä

Muchas veces no existe moda (distribución amodal).

ä

En otros casos la distribución tiene varias modas, lo que dificulta su interpretación.

73

Hay dos valores en el medio!

Ventajas y desventajas de la mediana

Relación entre: Media, Mediana y Moda

Ventajas: ä

Los valores extremos no afectan a la mediana como en el caso de la media aritmética.

ä

Es fácil de calcular, interpretar y entender.

ä

Se puede determinar para datos cualitativos.

• Si una distribución es simétrica, la media, mediana y modo coinciden • Si una distribución no es simétrica, las tres medidas difieren.

Desventajas: ä

Como valor central, se debe ordenar primero la serie de datos.

ä

Para una serie amplia de datos no agrupados, el proceso de ordenamiento

Asimetría hacia la izquierda (asimetría negativa)

Asimetría hacia la derecha (asimetría positiva)

de los datos demanda tiempo y usualmente provoca equivocaciones.

Modo

Media Mediana

Media Modo Mediana

Altura mediana

MEDIDAS DE POSICION (fractiles, cuantiles)

LA MODA •

La moda es el dato que más se repite o el dato que ocurre con mayor frecuencia.



Un grupo de datos puede tener más de una moda.



Se puede aplicar para variables cuantitativas y cualitativas nominales.



MEDIA MEDIANA MODA

Veamos el siguiente ejemplo: se tiene una muestra con valores 20, 23, 20, 24, 25, 25, 26 y 30. El 20 y 25 son la moda entonces, se dice que es bimodal.

PERCENTILES CUARTILES

Calculo de la moda

DEFINICIONES Y EQUIVALENCIAS

Obtención: se obtiene organizando la serie de datos y seleccionando el o los datos que más se repiten.

Las medidas de posición nos permiten dividir a una distribución en 2 o mas partes iguales. Según el número de partes, éstas divisiones tendrán distintos nombres:



Ejemplo: •

4, 5, 7, 8, 8 , 10, 12, 15 4, 7, 12,12 , 15, 16, 20, 20 , 24, 27

– Percentiles: Cuando dividimos una distribución en100 partes.

7, 12, 15, 18, 25, 30, 31, 38

– Deciles: Cuando dividimos distribución en 10 partes.

Equivalencias Como todas las medidas se refieren al mismo grupo de datos, se pueden hacer equivalentes entre sí

50%

una 25%

– Cuartiles : Cuando dividimos una distribución en 4 partes.

El modo

Cuando la muestra es grande, los datos se agrupan en intervalos y obtenemos el Intervalo modal

– Mediana: Cuando dividimos una distribución en 2 partes. 

Q1

20%

10 %

25%

10 %

25%

Q2

20%

10 %

50%

M

20%

10 %

10 %

D5

Q3 20%

10 %

10 %

20%

10 %

Se aplica para Variables cuantitativas, excepcionalmente cualitativas ordinales.

P25

P50

25%

P75

10 %

10 %

BIOESTADÍSTICA 1

Pag. 11

USAMEDIC 2015

CUARTILES

PERCENTILES • •



Los percentiles dividen a los datos en cien partes iguales, cada una de ellas contiene el 1% de los elementos del conjunto. Más o menos el (p) por ciento de los datos tienen valores menores que el percentil y aproximadamente (100-p) por ciento de los datos tienen valores mayores que el percentil. Un percentil nos provee información de como se distribuyen los valores de los datos desde el menor hasta el mayor.

• • • •

Los cuartiles dividen los datos en cuatro partes iguales. Cada una de las partes representa una cuarta parte, o el 25% de las observaciones. Los cuartiles son percentiles específicos; por consiguiente, los pasos para calcular los percentiles los podemos emplear para calcular los cuartiles. El primer cuartil Q1 es un valor que deje por debajo de él 25% de las y por encima 75% de las observaciones (equivale al P 25). El Q2 es la mediana (50%) (equivale al P50) y Q3 deja por debajo 75% y por encima 25% de las observaciones (equivale al P75)

Un percentil divide en dos partes las observaciones. Por ejemplo, el percentil 20, P20, es el valor que deja por debajo un 20% y por encima un 80% de las observaciones

20%

75%

80%

Mínimo

Mínimo

25%

PASOS PARA CACULAR EL PERCENTIL Para calcular la posición del percentil, debe seguir los siguientes pasos:

 P  i n  100 

Cuartil 3

Máximo

Q3

A continuación se presenta un conjunto de datos con los siguientes valores; 5, 12, 8, 14, 11, 15, 20, 18, 30 y 25.



¿ Cómo identificamos los cuartiles en este ejemplo? Utilizarás los mismos pasos para identificar los percentiles:

Primero, ordenamos los datos

en donde (p) es el percentil de interés y (n) es el número de datos u observaciones del conjunto o serie. Paso 3. a) Si (i) no es entero, utilizando las reglas de redondeo, se lleva al próximo numero entero. El valor entero inmediato mayor que (i) indica la posición donde se encuentra el percentil. Esto significa que si (i) = 3.5, el percentil se encuentra en la posición 4 de los datos ordenados.

Mediana Cuartil 2 Q2

Q1

25%

PASOS PARA CALCULAR LOS CUARTILES

Paso 1. Ordene los datos de manera ascendente. Paso 2. Calcule un índice (i) que indica la posición del percentil que se busca en la serie de datos ordenados.

25%

Cuartil 1

(P20)



75%

25% Máximo

Percentil 20

25%

25%

5 8 11 12 14 15 18 20 25 30 Segundo, determinamos (i) para cada cuartil:

Q1 = primer cuartil, o percentil 25 Q2 = segundo cuartil, o percentil 50 (también la mediana) Q3 = tercer cuartil, o percentil 75

b) Si (i) es entero, la posición del percentil es el promedio de los valores de

los datos ubicados en los lugares i e (i + 1). Veamos como se aplica

EJEMPLO •

PASOS PARA CALCULAR LOS CUARTILES

Como ejemplo de este procedimiento, determina el percentil 75 de los datos sobre las edades del siguiente un grupo de ciudadanos: 25, 20, 26, 21, 19, 23, 22, 30, 28, 27.

Primer cuartil: Q1 = primer cuartil, o percentil 25



 25  i 10 = 2.5  100  Como(i) no es un número entero, se redondea al próximo entero mayor que 2.5, o sea 3. Al referirnos a los datos vemos que el primer cuartil está ubicado en la posición 3 de los datos que este caso es 11. El primer cuartil en los datos se divide de la siguiente forma: 5 8 11 12 14 15 18 20 25 30 Q1=11

Paso 1. Ordene los datos en orden ascendente:

19 20 21 22 23 25 26 27 28 30 Paso 2. Calcule el índice (i):

 P  i n  100 

 75  i 10  7.5  100 

Paso 3. Como (i) no es entero, redondeamos al próximo entero mayor que 7.5, o sea, el lugar 8. Al referirnos a los datos del ejemplo, vemos que el percentil 75 es el valor del dato ubicado en la posición número 8, que en este caso es 27. 19 20 21 22 23 25 26



27 28 30

 50  i 10 = 5  100 

Nota. Recuerda que (i) nos indica el lugar del dato donde se encuentra el percentil que estamos buscando.



Segundo cuartil: Q2 = segundo cuartil, o percentil 50 (también la mediana)

Como (i) es un número entero, el segundo cuartil es el promedio de los valores de los datos que están en las posiciones i e (i+1), que en este caso es, (14+15)÷2=14.5, entonces, el segundo cuartil en los datos se divide así: 5 8 11 12 14 15 18 20 25 30 Q1=11 ; Q2=14.5

Significa que el 75% de las edades son menores de 27 años y el 25% restante (100-p) es mayor de 27 años.

PASOS PARA CALCULAR LOS CUARTILES VALORES •

Tercer cuartil: Q3 = tercer cuartil, o percentil 75

 75  i 10 = 7.5  100  Como (i) no es un número entero, se redondea al próximo entero mayor que 7.5, o sea 8. Al referirnos a los datos , vemos que el tercer cuartil está ubicado en posición 8 de los datos que en este caso es el 20. Finalmente, los cuartiles en este caso se presentan de la siguiente forma:

5 8 11 12 14 15 18 20 25 30 POSICION

Q1=11

Q2=14.5

Q3=20

BIOESTADÍSTICA 1

Pag. 12

USAMEDIC 2015

Ejemplos

3. MEDIDAS DE DISPERSIÓN

En el Hospital Dos de Mayo los pesos de RN durante el año 2009 variaron entre los 1500 gr hasta los 4,500 gr. Diga usted que porcentaje de niños tuvieron un peso mayor de 3000 gr si se sabe que este peso corresponde al percentil 80 de la serie total de RN durante el 2009?

Llamadas también medidas de variabilidad, variación Son útiles porque: ä Permiten juzgar la confiabilidad de la medida de tendencia central.

p80

ä Miden la variabilidad de los datos y reflejan la tendencia de los datos de cómo 1500 gr

3000 gr

se desvían de la media, ya que caracterizar una distribución solamente a través de una medida central no es apropiado.

4500 gr

ä Es posible comparar dispersión de diversas muestras. ä Son importantes debido a que dos muestras de observaciones con el mismo

valor central pueden tener una variabilidad muy distinta.

Miden el grado de dispersión (variabilidad) de los datos, independientemente de su causa.

Ejercicios •

Medidas de dispersión

El 5% de los recién nacidos tiene un peso demasiado bajo. ¿En que percentil se encuentra el peso por debajo del cual se considera “demasiado bajo”?

Ejemplo de dos conjuntos de datos con igual media

◦ ¿En que percentil se encuentra el peso que es superado sólo por el 25% de los recién nacidos? ◦ El colesterol se distribuye simétricamente en la población. Si se consideran patológicos los valores extremos. El 90% de los individuos son normales ¿Entre qué percentiles se encuentran los valores que incluyen a los individuos normales? ◦ ¿Entre qué percentiles se encuentran los valores en los que está la mitad de los individuos “más normales” de una población?

Datos con baja dispersión

EJERCICIOS DE PRÁTICA

Datos con alta dispersión

MEDIDAS DE DISPERSIÓN

Resuelve los siguientes ejercicios: Se ha obtenido una muestra del salario de los Bomberos. Los datos recopilados fueron los siguientes: 1500 $1400 $1600 $2100 1200 1300 1900 1800 2000 1200 1200 1500 2200 2300 1500 1400 a. b. c.

d.

RANGO RANGO INTERCUARTIL

DESVIACION MEDIA

determine el salario promedio calcule la mediana y la moda. calcule el percentil 65. Explique el resultado. determine los cuartiles.

VARIANZA DESVIACIÓN ESTÁNDAR COEFICIENTE DE VARIACION

RANGO

BIOESTADISTICA 4 • • •

Es también llamado: Amplitud, intervalo, recorrdio o Alcance. Es la medida de dispersión más sencilla. Se determina restando el valor mayor de los datos del valor menor. Ejemplo: Se tienen los siguientes valores de datos:

20, 25, 10, 5, 30, 35, 31, 23. Rango = valor mayor – valor menor 35 – 5 = 30

ESTADISTICA DESCRIPTIVA II

Interpretación La diferencia entre el valor mayor y el menor es de 30.

BIOESTADÍSTICA 1

Pag. 13

USAMEDIC 2015

DESVIACION MEDIA Ventajas y desventajas del rango Ventajas fácil de calcular fácil de entender e interpretar

Permite calcular la desviación media de todos los datos respecto a su media aritmética. A cada dato se le resta la Media Aritmética sin hacer caso de los signos negativos (valor absoluto), y se divide luego por el número total de términos.



DM =

Desventajas sólo considera los valores extremos no toma en cuenta ni el número de datos ni el valor de éstos no es posible de calcular en tablas con extremos abiertos.

(Xi – X)

----------n

Ejemplo

Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18

VARIANZA

RANGO INTERCUARTILICO •

La varianza es otra medida de dispersión que se basa en la diferencia entre el valor de cada dato (Xi) y la media ( ).



La diferencia entre cada dato (Xi) y su media ( ) para una muestra se llama desviación con respecto a la media o promedioxy se expresa con la siguiente fórmula:

x

También se denomina Alcance intercuartilico.

n

Permite ubicar 50% de los datos que se encuentran en el centro de la distribución, es decir, 25% de los datos son menores al primer cuartil y también 25% de los datos son mayores al tercer cuartil.

S  2

 (X i  x )

2

i 1

n 1



Para calcular la varianza, las desviaciones respecto a la media se elevan al cuadrado y se dividen entre (N – 1).



Este indicador nos muestra las variaciones al cuadrado respecto al promedio.



No se puede interpretar

RI  Q3  Q1

Veamos el siguiente ejemplo: Determine el rango intercuartil para los datos siguientes (pesos de pacientes pediátricos);

Ejemplo: La siguiente información se refiere al número de quejas recibidas en un Centro Médico durante una semana. Calcule la varianza de 8, 10, 5, 12, 10, 15. Elaboramos un cuadro de la forma siguiente

30, 40, 35, 5, 10, 20, 15, 30 y 45: Paso 1. Ordenar los datos de forma ascendente. 5 10 15 20 30 30 35 40 45 Paso 2. Calcular los cuartiles Q3 y Q1: Q3 = 75 percentil Q1 = 25 percentil Nota: Utiliza el mismo procedimiento para calcular los percentiles.  Cuartil uno: Q1 = 25 percentil

x

Xi  x

2

8

8 - 10 = - 2

10 5

10 - 10 = 0 5 - 10 = - 5

12

12 - 10 = 2

25 4

10

10 - 10 = 0 15 - 10 = 5

0 25

15

4 0

 Xi  x   58

x

60 6

x  10

2  Xi  x   58

 Xi  x   0

 X  60

 P  =  25  = 2.25 i n i   9  100   100 

Xi  x 

2

Como (i) no es un entero, redondeamos al próximo entero mayor que 2.25, o sea 3. Así, que Q1 está ubicado en la posición tres (3) de los datos, que en este ejemplo es 15.

2

S

=

 75  = 6.75 i 9  100 

Como (i) no es un entero, redondeamos al próximo entero mayor que 6.75, o sea 7. Así, que Q1 está ubicado en la posición siete (7) de los datos, que en este ejemplo es 35. 5 10 15 20 30 30 35 40 45



n 1

• • •

Paso 3. Ahora, podemos sustituir los valores de los cuartiles en la fórmula.

Interpretación: El 50% de los pacientes pediátricos pesan entre 15 y 25 Kilos. El rango intercuartilico de pesos de los pacientes pediátricos es de 20 Kilos.

2



58  11,6 quejas2 6 1

También llamada DESVIACION TIPICA, es la RAÍZ CUADRADA DE LA VARIANZA. Es una medida de la variabilidad de un conjunto de datos respecto a la MEDIA. Se calcula sacando la raíz cuadrada de la varianza. Nos indica cuánto tienden a alejarse los datos del promedio. Si los datos son de una muestra, la desviación estándar se representa como:

n

Rango Intercuartil = Q3 – Q1

S

DESVIACION ESTANDAR

 Cuartil tres: Q3 = 75 percentil

 P  i n  100 

 (X i  x )

2



 (Xi 



x)2

i 1 S  loss 2datos  debemos Para poder interpretar regresarlos a la escala original (sacar la raíz cuadrada de la varianza). n 1

BIOESTADÍSTICA 1

Pag. 14

USAMEDIC 2015

Ejemplo: La siguiente información se refiere al número de quejas recibidas en un Centro Médico durante una semana. Calcule la desviación estándar.

Farmacia I

x 

Ya sabemos por el ejemplo anterior que S2 = 11,6 quejas2. Entonces:

s

2

S  11,6 quejas2

La unidad de medida de la DS es igual a la de las variables del conjunto

Propiedades del desviación estándar

393  56,14 7

Xi  x

Xi  x 

40

-16,14

70 60

13,86 3,86

260,50 192,10

48

-8,14

14,90 66,26

52

-4,14

17,14

65

8,86 1,86

78,50 3,46

58

2

 Xi  x   0

 X  393

S  3,4 quejas



n

x

8, 10, 5, 12, 10, 15

S

n

 Xi

i 1

 Xi  x 

2

 632,86

Si  Xi  x 2  632,86 n

• Mide la dispersión respecto a la media. Debe emplearse solo cuando se escoge la media como medida central de la distribución.

S

2  ( Xi  x )

i 1

• S = 0; solo ocurre cuando no hay dispersión: todas las observaciones toman el mismo valor. De lo contrario S > 0. • Cuanto más dispersión hay entre las observaciones, mayor es S. • Al igual que la media, la desviación estandar se encuentra fuertemente influenciado por las observaciones extremas.

n 1



632,86  10,27 7 1

CV 

S 100 x

CV 

10,27  100  18,29 56,14

106

COEFICIENTE DE VARIACION R

Farmacia II n

 Xi

x  i 1 n

•También llamado COEFICIENTE DE VARIACION DE PEARSON.

Cálculos a partir de datos no agrupados Para la muestra:

Para la población:

s CV  100 x

CV 

 100 

Ejemplo:

40,70,60,48,52,65,58

Xi  x 

2

70

-35,87

1286,6569

35

-70,87

5022,5569

150

44,13

1947,4569

140

34,13

1164,8569

82

-23,87

569,7769

110

4,13

17,0569

140

34,13

1164,8569

120  X  847

14,13





199,6569

 Xi  x  0,04



 Xi  x



2

 11372,88

2 Si  Xi  x   11372,88 n

A continuación se presentan las ventas (en unidades monetarias) logradas durante una semana por dos farmacias. La farmacia I vende en soles y la farmacia II en dólares ¿Cuál de ellos tiene un desempeño más estable, en cuanto a nivel de ventas?. Farmacia I (soles)

847  105,87 8

Xi  x

x

•Es una medida de variabilidad relativa de los datos, permite comparar la variabilidad de dos o más conjuntos de datos expresados en unidades diferentes (peso; kg. y libras).



i 1

n

S

2  ( Xi  x )

i 1

n 1



11372,88  40,30 8 1

Farmacia II (dólares) 70,35,150,140,82,110,140,120

Calculamos la media y desviación estándar para cada una de las farmacias

CV 

S 100 x

CV 

40,30 100  30,06 105,87

La farmacia II presenta una mayor variabilidad en el volumen de ventas.

BIOESTADÍSTICA 1

Pag. 15

USAMEDIC 2015

4. FORMAS DE DISTRIBUCION

APLICACIÓN EN ESTADISTICA DESCRIPTIVA

(GRAFICOS)

4.1

• Diga ud. ¿cual es el intervalo de peso en Kg. en el que se encontrará el 68% de individuos de un marco muestral, en el cual la media de peso es de 78Kg con una DS de + - 6 Kg.? .

SIMETRIA DE LOS DATOS

Otra característica de un conjunto de datos es la forma, es decir, la manera en que están distribuidas las observaciones.

• En que rango de Talla se encontrará el 95% de la población en la que se sabe que la media de talla es de 160 cm con una DS de + - 15 cm?

La distribución de los datos puede ser o no simétrica. Si la distribución de los datos no es simétrica, se llama asimétrica o sesgada.

• En que rango de edades se encontrará el 99% de individuos de una muestra (marco), cuya media aritmética fue de 35 años con una DS de +- 3 años.

Para describir la forma se puede comparar la media y la mediana. También puede observarse a través del coeficiente de asimetría Mide el grado de Simetría / Asimetría de la distribución

11 4

Ejemplos de diferentes formas de distribución

4.2

KURTOSIS

Mide el grado de apuntamiento de la curva

Distribuciones simétricas

Interpretación: =0 Mesocúrtica CK

>0 Leptocúrtica 0, X>Md Asimétrica Positiva < 0, X