255123625-Apuntes-estadistica

1 Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez ESTADISTICA Introducción El trabajo del experto

Views 69 Downloads 5 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Citation preview

1

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

ESTADISTICA Introducción El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo el proceso de interpretación de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticas. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. En Química, incluye tareas tan diversas como calcular el promedio aritmético de la cantidad de sólidos suspendidos en muestras de agua, determinar cuántos compuestos de tres elementos pueden elaborarse con cinco sustancias, comparar dos métodos de determinación del porcentaje de calcio, el crecimiento del número de bacterias según días de inoculación. Definición: La estadística se define como una rama de las matemáticas que trata de la recopilación, el análisis, la interpretación y la representación de una gran cantidad de datos numéricos. 

Estadística Descriptiva : Es el conjunto de procedimientos utilizados para organizar resumir y presentar grupos de datos numéricos



Estadística Inferencial: Es el conjunto de métodos utilizados para obtener conclusiones relativas a una población, basándose en el conocimiento de las características de una muestra.

La población es el conjunto de datos que es el centro de nuestro interés y el subconjunto de ahí seleccionado representa una muestra. La estadística es un elemento decisivo en el incremento de la calidad, ya que las técnicas estadísticas pueden emplearse para describir y comprender los elementos de la variabilidad. ¿Qué es la variabilidad? Es el resultado de cambios en las condiciones bajo las que se hacen las observaciones. El muestreo también puede ser causa de variabilidad. El campo de la estadística y la probabilidad consiste de métodos tanto para describir y modelar la variabilidad, como para tomar decisiones en presencia de esta. En la estadística inferencial lo que se desea es tomar decisiones acerca de una población en particular.

2

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

Escalas de Medición Escala Nominal El término nivel nominal es normalmente usado para referirse a datos que solamente pueden clasificarse en categorías. Sin embargo, no hay mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de medición el orden en que están acomodadas la categorías es totalmente arbitrario.

2. Escala Ordinal Este tipo de nivel de medición tiene características similares al nivel nominal con la diferencia de que en el nivel ordinal las categorías indican que unas son más que las otras.

3. Escala cuantitativa intervalo En este nivel de medición, las categorías están definidas por intervalos de valores, y están acomodadas en orden a la magnitud de los valores. El tamaño de los intervalos es el mismo.

4. Escala cuantitativa Racional En este nivel al igual que en el nivel intervalo, las categorías son del mismo tamaño. La diferencia es que este nivel tiene un punto cero significativo y el valor de los categorías es en relación a ese punto.

3

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

Clasificación de las variables  Variable cualitativa: Cuando la variable estudiada es no numérica. Ejemplo: Lugar de nacimiento, religión, color de ojos.  Variable Cuantitativa: Cuando la variable estudiada puede expresarse en forma numérica. Ejemplo: El saldo de una cuenta bancaria, la duración de una batería.  Variables Discretas: Cada una de las variables puede valer solo un número entero por ejemplo 1, 2, 3, etc. Ejemplo: Número de cuartos en una casa, número de carros en el estacionamiento, número de estudiantes en la clase de estadística.  Variables Continuas: Las variables continuas pueden asumir todos los valores dentro de un rango específico. Ejemplo: Presión del aire en una llanta, el tiempo que se toma en viajar de Puebla a México. Las variables continuas resultan de medir algo, y lógicamente dependen de la exactitud del instrumento de medición. Reglas generales para construcción de distribuciones de frecuencia 1) Determinar el número mayor y el menor en los datos sueltos con el fin de especificar el rango (diferencia entre ambos). 2) Dividir el rango el rango en un número adecuado de intervalos de clase del mismo tamaño. 3) Determinar el número de observaciones que corresponden a cada intervalo de clase; es decir, hallar la frecuencia de clase. Los histogramas y los polígonos de frecuencia son dos representaciones gráficas de las distribuciones de frecuencia. Un histograma se construye a partir de la distribución de frecuencias representado sobre cada intervalo, un rectángulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectángulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y su área. Los histogramas, son gráficas de barras verticales, construidos sobre los límites reales de cada clase. Ejemplo Por ejemplo, los siguientes datos son los tiempos de ignición de ciertos materiales expuestos al fuego, dados a la más cercana centésima de segundo:

4

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

2,58 5,50 6,75 2,65 7,60 6,25 3,78 4,90 5,21 2,51 6,20 5,92 5,84 7,86 8,79 4,79 3,90 3,75 3,49 4,04 3,87 6,90 4,72 9,45 7,41 2,45 3,24 5,15 3,81 2,50 1,52 4,56 8,80 4,71 5,92 5,33 3,10 6,77 9,20 6,43 1,38 2,46 7,40 6,25 9,64 8,64 6,43 5,62 1,20 1,58 Solución: Suponga, que se tiene interés de construir cinco clases. Con el arreglo ordenado de los tiempos se determina que la observación más grande es de 9,65 y la más pequeña, de 1,20. Por tanto, la amplitud o rango se calcula como: Rango=9.64-1.20=8.44 y se tiene la aproximación del tamaño del intervalo de clase , dividiendo el rango entre el número de intervalos que nos piden así obtenemos el Intervalo de clase=8.44/5=1.688 se aproxima a 1.69 Tiempos de ignición 1,20 – 2,88 2,89 – 4,57 4,58 – 6,26 6,27 – 7,95 7,96 – 9,64

Conteo Absoluta //// //// // //// //// / //// //// //// //// //// //// / //// //

Frecuencia (fi) 10 9 16 9 6

Frecuencia relativa 0.20 0.18 0.32 0.18 0.12

Porcentaje % 20 18 32 18 12

Con esta tabla, se pueden calcular los porcentajes por clase al multiplicar por 100 cada frecuencia relativa. Un 32% de los materiales fueron consumidos por el fuego entre 4,58 y 6,26 centésima de segundo.

Ejemplo 2 En la tabla que sigue se registran los pesos de 40 estudiantes hombres de una universidad, con precisión de una libra. Construya una distribución de frecuencias. 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 165 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 128 138 Solución El mayor peso es de 176lb y el menor es de 119lb. Por lo que el rango es 176-119=57lb Si se usan 5 intervalos de clase, su tamaño será de 57/12=4.75 aproxima 5

5

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

frecuencia 9 8 7 6 5 4 3 2 1 0

frecuencia

Distribución de frecuencias relativas La frecuencia relativa de una clase es su frecuencia dividida entre la frecuencia total de todas las clases es 1 es decir 100%. Por ejemplo la frecuencia relativa de la clase 133-137 es 4/40=.1%. La suma de todas las frecuencias relativas de las clases es 1 es decir 100%. Distribución de frecuencia acumulada La frecuencia total de todos los valores menores que la frontera de clase superior de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo la frecuencia acumulada, incluyendo hasta el intervalo de clase 133-137 es 1+2+2+4=9 lo que significa que 9 estudiantes tienen el peso menor de 137.5 Distribución de frecuencia relativa acumulada La frecuencia relativa acumulada es la frecuencia acumulada dividida entre la frecuencia total. Así la frecuencia relativa acumulada de peso menor que 137lb Es 9/100=0.09% lo que significa que 9% de los estudiantes pesa menos de 137.5lb.

6

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

La tabla siguiente muestra la distribución de frecuencia de los salarios semanales de 65 empleados salario

Número de empleados

Frecuencia relativa(%)

$250.00-$259.99

8

12.3

$269.00-$268.99

10

15.4

$270.00-$279.99

16

24.6

$280.00-$289.99

14

21.5

$290.00-$299.99

10

15.4

$300.00-$309.99

5

7.7

$310.00-$319.99

2

3.1

Total 65

Total 100%

30 25 20 15 10 5 0

Series1

Construya para la distribución de frecuencia anterior una distribución de frecuencia acumuladas y una distribución de frecuencias relativas acumuladas.

Dist. De frec. Relativas acumuladas 120 100 80 60 40 20 0

Dist. De frec. Relativas acumuladas Menor Menor Menor Menor Menor Menor Menor Menor que que que que que que que que $250.00 $260.00 $270.00 $280.00 $290.00 $300.00 $310.00 $320.00

7

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

Medidas de localización Se buscan números que describan la distribución de frecuencia para cualquier conjunto de mediciones. Se concentrará la obtención en dos tipos de números descriptivos, las medidas de tendencia central y las medidas de dispersión o variación. Una característica importante de un conjunto de números es su localización o su tendencia central, el promedio es un valor típico o representativo de un conjunto de datos, tales valores suelen ubicarse en el centro del conjunto de datos  Media aritmética  Mediana  Moda Media muestral Es un conjunto de n valores, es el resultado de la suma de todos ellos divididos entre n. n

x  x1  x2  ...  xn 

x i 1

i

n

Donde x1,x2,…xn, son las observaciones de la muestra y n es el tamaño de la muestra. La media de la muestra y la media de la población Las medidas características de una muestra son llamadas estadísticos y las medidas características de una población se denominan parámetros. La media de la población se calculan de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente notación: N



x i 1

i

N

N número de elementos de la población La media aritmética de datos no agrupados: Si los números datos x1 ,x2, …xn ocurren f1,f2,…,fn veces respectivamente (es decir , con frecuencias f1,f2,…,fn ) n

La media aritmética es

x

fx i 1 n

i i

f i 1

i

Ejemplo: si 5, 8,6 y 2 ocurren con frecuencia 3,2, 4 y 1, en ese orden, su media aritmética es:

x

8

(3)(5)  (2)(8)  (4)(6)  (1)(2) 15  16  24  2   5.7 3  2  4 1 10

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

La mediana Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana. La mediana es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos. Ejemplo: El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la mediana de las observaciones muestreadas? 85.4 85.4 85.3--- x% 84.9 84.0

° como la mediana poblacional; esto es, la mitad de la población se encuentra por Se define 

° , mientras que la otra mitad está por encima de este valor. debajo de la  La mediana para datos agrupados Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos: 1. Calcular el valor n / 2 2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano). Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada es igual o mayor que n / 2. 3. Aplicando la siguiente fórmula con los valores del intervalo mediano:

N   2  fA  Mediana  LSR   c f mediana     Donde: LSR frontera superior real de la clase de la mediana N: número de datos fA: suma de las frecuencias de las clases hasta el intervalo de clase de la mediana. fmediana: es la frecuencia de la clase de la mediana C: es el tamaño del intervalo de la clase de la mediana Ejemplo: Calcular mediana de la siguiente distribución de frecuencia del número de meses de duración de una muestra de 40 baterías para coche. duración de las baterías (meses)

Número de baterías

15 - 19

2

20 - 24

1

9

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

25 - 29

4

30 - 34

15

35 - 39

10

40 - 44

5

45 - 49

3

1.- n/2=40/2=20 2.- el intervalo mediano es: LI

LS

LSR

X

F

FA

15

19

19.5

17

2

2

20

24

24.5

22

1

3

25

29

29.5

27

4

7

30

34

34.5

32

15

22

35

39

39.5

37

10

32

40

44

44.5

42

5

37

45

49

49.5

47

3

40

N=

40

intervalo mediano

3.- Aplicar la fórmula con los datos del intervalo mediano

N   2  fA  (20  22) Mediana  LSR   (5)  33.8  c  34.5  15  f mediana    Moda La moda es la observación que se presenta con mayor frecuencia en la muestra. Es decir, el valor más frecuente. La moda puede no existir e incluso no ser única.

10

Apuntes de Estadística Profesora Homaira Athenea Ramírez Gutiérrez

Si los datos son simétricos y hay una sola moda entonces la media la mediana y la moda coinciden. Generalmente se encuentra que la moda