Formulario Estadistica Descriptiva (1)

ESTADÍSTICA DESCRIPTIVA DATOS NO AGRUPADOS O INDIVIDUALES. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Medida Media _ x

Views 360 Downloads 0 File size 339KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESTADÍSTICA DESCRIPTIVA DATOS NO AGRUPADOS O INDIVIDUALES. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN Medida Media _

x

Fórmula/Muestra _

x

Fórmula/Población

x



n

x n

Descripción de formula

Media  Suma de datos

Número de datos

Moda



Mediana

MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

~ x

Posición de la mediana=

Posición de la mediana= Número de datos+uno dos

n+1 2 Posición de la mediana= N + 1 2

Cuartiles

i (n – 1 ) 4

Posición del cuartil i = 1 +

Valor del cuartil i = Valor del dato en la posición i Deciles

Posición del decil i = 1 +

i (n – 1 ) 10

Valor del decil i = Valor del dato en la posición i Posición del percentil i = 1 + Percentiles

i (n – 1 ) 100

Valor del percentil i = Valor del dato en la posición i

Definición Se encuentra sumando todos los valores de la variable y dividiendo entre el número de estos. Es el valor más frecuente de un conjunto de datos. En ocasiones se presentan dos o más valores que se repiten con mayor frecuencia. En este caso a los datos se les conoce como bimodales o multimodales. Es el valor del elemento de la posición central, con los datos individuales ordenados de menor a mayor o viceversa y es el punto que marca la mitad de los valores mayores que él y la mitad de valores menores que él. Para calcular la mediana:  Ordene los datos.  Calcule la posición de la mediana  Determine el elemento de la posición central. Si el número de datos es par, deberá obtener el promedio del valor de los dos datos centrales. Dividen a un conjunto de datos en cuatro partes iguales, se simbolizan por : Q1 , Q2 , Q3 y

Q4 . Se

consideran medidas de posición. Dividen a un conjunto de datos en diez partes iguales, Se simbolizan por :

D1...........D10

. Se

consideran medidas de posición. Dividen a un conjunto de datos en 100 partes iguales, se simbolizan por:

P1 , P2 .......P100

.

Se

consideran medidas de posición.

1

Rango Varianza Desviación estándar

Coeficiente de variación

MEDIDAS DE DISPERSIÓN Y FORMA

Curtosis

Rango = Dato mayor- Dato menor

s

2

(x  x) 

s

2



n 1

 ( x  x)

C.V . 

n 1

s x

2

(x  ) 

2



2

var ianza 

N

 (x  )

C.V . 

N

 

Suma(cada valor  media) 2 numero de valores

2

desviación estándar  var ianza

Coeficient e de variación 

d.estándar media

Diferencia o distancia entre el dato mayor y menor del conjunto de datos. Diferencia o distancia promedio de los datos a la medida referencia que es la media. Las unidades son al cuadrado. Diferencia o distancia promedio de los datos a la medida referencia que es la media. Las unidades son lineales. Medida que permite comparar el grado de dispersión, es decir, que tan diferentes son en valor relativo, dos o más conjuntos de datos. Si el coeficiente de variación se multiplica por 100 se convierte en porcentaje de variación. La deformación con respecto al eje horizontal de una distribución de frecuencias se conoce como curtosis o aplastamiento. Una medida cualitativa de la forma de las distribuciones se clasifica en:  Leptocúrticas: sus datos se concentran en un reducido intervalo de valores.  Mesocúrticas: éstas presentan una concentración de valores alrededor de la media y una reducción de éstos hacia los extremos. A éstas se les conoce también como distribuciones normales.  Platicúrticas: en ella los datos se distribuyen de manera relativa uniforme en todo el rango de valores.

2

ESTADÍSTICA DESCRIPTIVA DATOS AGRUPADOS MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN En este caso solo se considera la formula para la muestra, recordando que en la fórmula para la población solo cambia cuando se identifica cada uno de los elementos que contengan las formulas con respecto a la población, como se especifico para los datos no agrupados o individuales,

Medida

x

 (M f)

Formula

n

Descripción de la formula

Media 

Suma Marca de clase frecuencia de cada clase  numero de datos

Donde:

Media

M  Marca de clase 

 D1  c xˆ  Li    D1  D2  MEDIDAS DE TENDENCIA CENTRAL Y POSICIÓN

limite inferior  limite superior 2

f = frecuencia de cada clase n = numero de datos en la muestra Dónde: xˆ  Moda

Li  Límite inferior de la clase o intervalo más abundante o clase modal D1  Frecuencia de la clase o intervalo más abundante – Frecuencia de la clase

anterior

D2  Frecuencia de la clase o intervalo más abundante – Frecuencia de la clase siguiente c  Ancho del intervalo de la clase más abundante

Moda



Mediana

n     fa  ~ c x  Li   2  fmediana     

Para determinar la clase más abundante se toma el mayor valor en la columna de la frecuencia absoluta y de la clase correspondiente se considera el límite inferior.

Dónde: ~ x  Mediana

Li  Límite inferior de la clase mediana o intervalo mediano n  numero de datos o valores, tamaño de la muestra fa  frecuencia acumulada antes de la clase mediana fmediana  frecuencia de la clase mediana c  Ancho del intervalo de la clase mediana 

Para determinar la clase mediana o intervalo mediano se considera el

3

total de datos, éstos se dividen entre dos y el resultado se ubica en la columna de la frecuencia acumulada de la tabla de distribución y de la clase correspondiente se toma el limite inferior.

Posición del cuartil i  1 

Cuartiles

i(n  1) 4

  n i   fa   4 c Valor del cuartil i  Li    frecuencia de la clase   

Frecuencia de la clase = frecuencia de la clase que contiene el cuartil deseado c  Ancho del intervalo de la clase que contiene el cuartil deseado 

Para determinar la clase que contiene el cuartil deseado, se calcula la posición y el resultado se ubica en la columna de la frecuencia acumulada y de la clase correspondiente se toma el límite inferior.

Aplica lo mismo que en el caso de los cuartiles.

i(n  1) 100    n  i   fa    100  c Valor del cuartil i  L i    frecuencia de la clase   

Aplica lo mismo que en el caso de los cuartiles.

Posición del cuartil i  1 

Percentiles

Li  límite inferior de la clase que contiene el cuartil deseado. fa  frecuencia acumulada de la clase anterior a la que contiene el cuartil deseado

i(n  1) 10   n i   fa    10  c Valor del cuartil i  L i    frecuencia de la clase   

Posición del decil i  1  Deciles

Dónde: i  es el cuartil deseado, por ejemplo, 1,2 o 3. n  es el numero de datos o tamaño de la muestra

4

MEDIDAS DE DISPERSIÓN

Rango

Rango 

Límite inferior de la primera clase

Límite superior de la última clase

 M  x  

2

s

Varianza

2

n 1

f



s2 

 Desviación estándar

 M  x 

2

s

n 1

f





Suma marca de clase  media  (frecuenci a de clase) numero de datos menos uno 2



Recordar que en el caso de la varianza de la población se divide solo entre el número de datos (N).

desviación estándar  var ianza

5