Guia 1 Estadistica Sena

SERVICIO NACIONAL DE APRENDIZAJE SENA GUIA BASICA DE ESTADÍSTICA DESCRITIVA Instructor: FRANKILL SALAZAR LAMILLA E-mai

Views 753 Downloads 13 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

SERVICIO NACIONAL DE APRENDIZAJE SENA

GUIA BASICA DE ESTADÍSTICA DESCRITIVA

Instructor: FRANKILL SALAZAR LAMILLA E-mail: [email protected]

ESTADISTICA DESCRIPTIVA GUIA N°2 Introducción a la Estadística, Fenómenos, Población, Muestra y Tipos de Variables

La Estadística  Es la rama de las matemáticas que se va a encargar de

Recopilar, Organizar, y Procesar datos con el fin de inferir las características de la población objetivo.

3

La Estadística Descriptiva 

Trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones.



Se construyen tablas y se presentan gráficos que permiten simplificar los datos obtenidos.



Se calculan parámetros estadísticos. Se limita a realizar deducciones directas de los datos y parámetros obtenidos 4

Fenómeno Determinístico 

Un fenómeno determinístico es aquel en que se obtiene siempre el mismo resultado bajo las mismas condiciones iniciales.



La relación causa-efecto se conoce en su totalidad. Por ejemplo, todos los fenómenos que siguen las leyes de la física clásica, como puede ser la caída de un cuerpo.



Ejemplos: 

Si se lanza una pelota hacia arriba, sabemos que tiene que caer.



Si se lanza un trozo de hielo en el agua, este se derretirá.



Si el agua se calienta a 100ªC esta se evaporara.



Fecha del cumpleaños.



Nombre del próximo mes.

5

Fenómeno no Determinístico 

Un fenómeno no determinístico es aquel que bajo el mismo conjunto aparente de condiciones iniciales, puede presentar resultados diferentes, es decir, no se puede predecir el resultado exacto de cada experiencia particular.



Este tipo de fenómeno es opuesto al fenómeno determinista, en el que conocer todos los factores de un experimento nos hace predecir exactamente el resultado del mismo.



Ejemplos: 

Si se lanza una moneda esta puede caer cara o sello.



El lanzamiento de los dados, pudiendo salir el 1,2,3,4,5 o 6



Los número premiados de los juegos de azar.

6

Población 

Todo estudio estadístico esta referido a un conjunto o colección de persona o cosas . Este conjunto de personas o cosas es lo que se denomina POBLACIÓN.



Las personas o cosas que forman parte de esta población se denominan ELEMENTOS . En sentido estadístico este elemento puede ser algo tangible como una persona , automóvil o casa, por ejemplo, o algo más abstracto como temperatura, voto, intervalo de tiempo.



A su vez cada elemento de la población puede ser objeto de estudio estadístico. Si consideramos a una persona, se puede distinguir los siguientes caracteres o cualidades: sexo, edad, nivel de estudio, profesión, peso, color de ojos, estatura, etc. Se puede estudiar uno o más aspectos de cada elemento de la población. 7

Clasificación de la Población 

La población según su tamaño puede ser de dos tipos:



Población Finita: Cuando el número de elementos que la forma es finito.





Ejemplo: Si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.



Ejemplo: El número de alumnos en un centro educacional.

Población Infinita: Cuando el número de elementos que la forma es infinito o tan grande que pudiera considerarse infinito. 

Ejemplo: Si se realizara un estudio de todos los productos que existen en el mercado.



Ejemplo: Un estudio astronómico en base a todas las estrellas del universo. 8

Muestra 

En un estudio estadístico no se trabaja con todos los elementos de la población, sino que se realiza sobre un subconjunto de ella.



Este subconjunto puede ser una muestra, cuando se toma un determinado número de elementos de la población, sin que en principio tengan nada en común.



La muestra debe obtener toda la información deseada para tener la posibilidad de extraerla, esto sólo se puede lograr con una buena selección de la muestra y un trabajo muy cuidadosos y de alta calidad en la recogida de los datos. 9

Tipos de Variable y Clasificación

10

Variables 

Los caracteres de un elemento pueden ser de diferentes tipos, por lo cual las variables se pueden clasificar en dos grandes clases:



Variables cualitativas o atributos: Las cuales no se pueden medir numéricamente. Ejemplo: nacionalidad, color de piel, sexo, etc.



Variables cuantitativas: Tienen valor numérico. Ejemplo: Estatura, edad, precio producto, etc. 11

Variables 

También se pueden clasificar, a su vez en:



Variables unidimensionales: Sólo recogen información sobre una característica. Ejemplo: edad de los alumnos de una clase.



Variables bidimensionales: Recogen información sobre dos características de la población. Ejemplo: edad y altura de los alumnos de una clase.



Variables pluridimensionales: Recogen información sobre tres o más características. Ejemplo: edad, altura y peso de los alumnos de una clase. 12

Variables Cuantitativas 

Las variables cuantitativas se pueden clasificar en:



Variables discretas: Sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Ejemplo: número de hermanos (puede ser 1, 2, 3....,etc., pero nunca podrá ser 3,5



Variables continuas: Pueden tomar cualquier valor real dentro de un intervalo. No se pueden expresar mediante un número entero. Ejemplo: la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. 13

Variables Cuantitativas 

La escala de Intervalo:

1.

Posee una unidad de medida constante y arbitraria.

2.

Posee un cero “arbitrario”, es decir no indica la ausencia de la característica que se esta midiendo.

3.

Prevalece la relación de orden “mayor que” (>). La diferencia entre los valores tiene significado.

4.

Entre los valores de las variables solo es posible realizar la suma y la resta de como operaciones aritméticas.

.

EJEMPLOS:

1.

La temperatura de una ciudad medida en grados Celsius o Fahrenheit.

2.

La altura de las ciudades tomando como referencia el nivel del mar.

3.

El rendimiento académico medido en una escala de 0 a 20. 14

Variables Cuantitativas 

La escala de Razón:

1.

Posee una unidad de medida constante y arbitraria.

2.

Posee un cero “absoluto”, es decir indica la ausencia de la característica que se esta midiendo. Este cero tiene significado.

3.

Prevalece la relación de orden “mayor que” (>). El cociente entre ellos tiene significado.

4.

Se puede realizar todas las operaciones aritméticas entre los valores de las variables.

.

EJEMPLOS:

1.

Edad.

2.

Peso.

3.

Estatura

4.

Tiempo invertido por un estudiante en realizar una prueba. 15

Variables Cualitativas 

ESCALA NOMINAL.

1.

Se clasifican a los sujetos en categorías, mutuamente excluyentes y totalmente exhaustivas, tal que todos los sujetos clasificados en la misma categoría son equivalentes respecto a la variable que se esta midiendo.

2.

Solo tiene sentido en la relación de igualdad – desigualdad. Solo clasifica las variables.

3.

Se pueden usar números, letras o símbolos para identificar a cada categoría de variable.

4.

No se puede realizar ninguna operación aritmética en esta escala. 16

Variables Cualitativas 

ESCALA NOMINAL.

Soltero Masculino  M GENERO

 1

Casado

 2

ESTADO CIVIL

Femenino  F Viudo

Divorciado  

3

4

17

Variables Cualitativas 

ESCALA ORDINAL.

1.

Se usa cuando es posible establecer una relación de orden entre las distintas categorías de la variable. Prevalece la relación de orden “mayor que” (>)

2.

Se pueden usar letras o números para identificar cada categoría de la variable. Los números o letras usados deben reflejar el orden de la categoría.

3.

No se puede realizar operaciones aritméticas entre los números asignados a las distintas categorías. Estos números solo reflejan una relación de orden. 18

Variables Cualitativas 

ESCALA ORDINAL. 1

Preescolar Educación Básica NIVEL DE INSTRUCCIÓN

Mala 2

D

Regular

C

CALIDAD DE UN SERVICIO

Media y diversificada 3 Buena

B

4

A

Superior

Excelente

19

Población, Muestra y Variable

20

Tipos de Frecuencias, Representación Gráfica y Variables Discretas.

Tablas de Frecuencia Variable Cualitativa 

La muestra es el sub-conjunto de nuestro universo o población y del cual se recopilan nuestros datos. Es necesario que la muestra sea representativa.



Se debe tener presente que la muestra esta conformada por N elementos.



Uno de los primeros pasos es la tabulación de resultados, es decir, recoger la información de la muestra resumida en un tabla en que cada valor de la variable se le asocian determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros valores de la variable, etc. 22

Tipos de Frecuencia 

FRECUENCIA ABSOLUTA: La frecuencia absoluta de una variable estadística, definida Xi, es el numero de veces que aparece en la muestra dicho valor de la variable.



Se representa por: ni



FRECUENCIA RELATIVA: La frecuencia relativa esta influida por el tamaño de la muestra, es directamente proporcional. Si la muestra es muy grande, para poder comparar se requiere utilizar la frecuencia relativa, la cual es el cociente entre la frecuencia absoluta y el tamaño de la muestra.



Se representa por: fi= ni/N (en algunos textos y/o ejercicios como hi) 23

Ejemplo 

Se realizó una encuesta a 419 personas, en relación a la adquisición de un cierto bien.



Los siguientes datos reflejan las respuestas de las personas encuestadas a la pregunta ¿compraría usted un computador?

a)

¿Qué tanto por ciento de las personas no responden?

b)

¿Qué tanto por ciento de las personas compraría un computador? 24

Solución

a)

El porcentaje de personas que no responden : 0,1098 x 100 = 10,98%

b)

b. El porcentaje de personas que respondieron si : 0,6993 x 100 = 69,93% 25

Representación Gráfica 

Uno de los gráficos más utilizados para representar variables cualitativas es el gráfico sectorial o circular.



Para construir este gráfico, se utiliza una circunferencia, cuyo círculo se divide en sectores tales que sus medidas angulares centrales y, por lo tanto la superficie del sector circular sean proporcionales a las magnitudes de los valores de la variable que representan.



Al total le corresponde el círculo completo, es decir los 360° de la circunferencia y por proporciones, se encuentra el número de grados que le corresponde a cada parte. 26

Ejemplo

27

Representación Gráfica 

Gráfico de barras: Es aquel en el cual el fenómeno que se estudia queda representado por una serie de rectángulos, barras o paralelepípedos, los cuales pueden dibujarse horizontalmente o verticalmente.



Este gráfico se utiliza para representar variables de tipo cualitativo o cuantitativo discreto.



Ejemplo: Confeccionar gráfico de barras, con respecto a la siguiente tabla de distribución de frecuencias: 28

Representación Gráfica

29

Representación Gráfica 

El Pictograma: Se caracteriza este gráfico por figuritas que representan cierta cantidad (por ejemplo 1%). Cada valor de la variable lleva tantas figuritas como sea su frecuencia

1.

Cada fila de figuritas, debe llevar el rótulo que la identifica. Si fuera necesario, se agrega una leyenda explicativa.

2.

Se debe usar la misma figurita para todo el gráfico.

3.

El tamaño y el color de las figuritas debe ser el mismo en todo el gráfico.

30

Representación Gráfica 4.

Debe indicarse claramente cuánto representa cada figurita, y en qué unidades.

5.

Rotular el gráfico, especificando qué muestra. Asimismo, si fuera posible indicar la fuente de los datos.

6.

Evitar trazados en 3D, que suelen interferir la información.

31

Tabla de frecuencia para variable discreta 

Sean x1 , x2 , x3 ..............xm los m diferentes valores de la variable.



Frecuencia absoluta: Se denomina frecuencia absoluta al número de veces que se repite un valor de la variable en el conjunto de observaciones.



Frecuencia relativa: Se denomina frecuencia relativa al cociente de la frecuencia absoluta y el número tota de observaciones n. 32

Tabla de frecuencia para variable discreta 

Frecuencia absoluta acumulada: Se llama Frecuencia Absoluta Acumulada, a la suma acumulativa término a término de las frecuencias absolutas.



El último término de las Frecuencias Absolutas acumuladas es n.



Frecuencia relativa acumulada: Se llama Frecuencia Relativa Acumulada, a la suma acumulativa término a término de las frecuencias relativas.



El último término de las Frecuencias Relativas Acumuladas es 1. 33

Ejemplo de Variable Discreta 

a)

En un packing se examinó un lote de 30 cajas de duraznos para exportación. El número de duraznos en mal estado en cada caja es el siguiente.

Construir tabla de distribución de frecuencias. 34

Ejemplo de Variable Discreta b)

¿Cuantas cajas tienen 2 o 3 duraznos en mal estado? 5 + 8=13 Cajas

c)

¿Qué tanto por ciento de las cajas tiene a lo más 1 durazno en mal estado? 10 + 23,33 = 33,33%

35

Ejemplo de Variable Discreta 

Se dispone de la siguiente información sobre el número de personas activas (trabajan) en 25 familias:

a)

¿Qué tipo de variable es?

b)

Construir Tabla de Distribución de Frecuencias

c)

¿Qué tanto por ciento de las familias tienen 2 o más personas activas?

d)

¿Que tanto por ciento de las familias tienen entre 2 y 3 personas activas? 36

Ejemplo de Variable Discreta a)

Variable Discreta

b)

Tabla

c)

68%

d)

40% 37

Representación Gráfica 

Los gráficos más adecuados, para representar una variable numérica discreta son:

1.

Diagrama de tallo y hojas

. Un

procedimiento semi- gráfico (tabular y gráfico) de presentar la información para datos cuantitativos, especialmente útil cuando el número de observaciones es pequeño (menor a 50)

38

Construcción Tallo y Hoja 

Para datos con un solo dígito, el tallo queda constituido por los distintos valores de la variable, ordenados de menor a mayor, de arriba hacia abajo.



Las hojas quedan representadas por tantos ceros como sea su frecuencia:



Ejemplo: si el 7 se repite 4 veces, se escribe

39

Construcción Tallo y Hoja 

Para datos con dos dígitos, escribir a la izquierda de la línea los dígitos de las decenas, que forman el tallo, y a la derecha las unidades que serán hojas.



Ejemplo: El número 72 se escribe.

40

Construcción Tallo y Hoja 

Para datos con tres dígitos el tallo estará formado por los dígitos de las centenas y decenas, que se escribirán a la izquierda, separados de las unidades que serán las hojas.



Ejemplo: El número 754 se escribe

41

Construcción Tallo y Hoja 

Los siguientes datos representan los ingresos semanales (en dólares) de un grupo de trabajadores. 114, 125, 114, 124, 143, 152, 133, 113, 178, 127, 135, 161, 126, 134, 147, 132

42

Representación Gráfica 2.

Gráfico de Segmento

. Para

representar gráficamente las distribuciones de frecuencias absolutas (o relativas), se ubican en el eje horizontal, los valores de las variables y se levantan sobre cada uno de ellos, un segmento vertical de longitud igual a la frecuencia absoluta (o relativa) correspondiente a cada valor x.

43

Ejemplo 

Dada la siguiente tabla de distribución, construir gráfico de segmentos, utilizando frecuencias absolutas

44

ESTADÍSTICA

Tablas de Frecuencia para Variables Continuas, Representación Gráfica y Tabla de Contingencia

Tabla de frecuencia Variable Continua 

Si la variable que se esta midiendo es de tipo continuo (puede tomar cualquier intervalo determinado por los números reales), no tiene sentido el tabularla para cada una de las observaciones dado que es muy improbable que variable bajo estudio tome el mismo valor durante el experimento.



Recorrido: Es el campo de variación de la variable. Recorrido = X máx – X mín 46

Tabla de frecuencia Variable Continua 

El número y tamaño de los intervalos, dependen de la cantidad de datos de la muestra y de su recorrido.



El número de intervalos debe cumplir con dos condiciones: resumir la información y conservar el detalle de la muestra.



Los intervalos puede ser cerrado- cerrado,



cerrado- abierto

47

Tabla de frecuencia Variable Continua 

Definiciones:

1.

Clases: Consisten en intervalos de valores ordenados en forma accedente y descendente y que cubren todos los valores disponibles. El número de clases se denota K

2.

Limites de clases: Son los extremos de las clases. El valor menos se denomina limite inferior (Li) y le valor mayor limite superior (Ls). Puede ser abierto ( ) o cerrado [ ].

3.

Amplitud de clase: Se obtiene hallando la diferencia entre los limites de clases. Se denota C. 48

Tabla de frecuencia Variable Continua 4.

Marca de clase: Es el punto medio de las clases, es decir, la semisuma del Ls y Li.

.

Las clases deben tener el misma Amplitud.

Amplitud = C = (Máx. - VMín) / K .

Donde K es el número de clases

.

En caso de no saber cuantas clases se deben tener (K) ni la amplitud de estas, se utiliza la Regla de Sturges.

K = (1 + 3,322 Log n) 49

Ejemplo 

Los siguientes datos indican el número de minutos que ocuparon sus asientos 20 clientes de una cafetería.



Construir tabla de distribución de frecuencias, utilizando intervalo cerrado – abierto. Calcular el número de intervalos utilizando la expresión [1+ 3,3log n]



¿Qué tanto por ciento de clientes ocuparon sus asientos 32 minutos o más?



¿Qué tanto por ciento de los clientes ocuparon sus asientos entre 28 y menos de 36 minutos? 50

Solución

1.

45%

2.

60%

51

Representación Gráfica 1.

Histograma

. Consiste

en un conjunto de rectángulos con: bases en el eje x, centros en las marcas de clases y longitudes iguales a los tamaños de los intervalos de clases.

. Si

los intervalos de clases tienen todos la misma amplitud, las alturas de los rectángulos son proporcionales a las frecuencias de clase.

52

Representación Gráfica

53

Ejemplo 

Dada la siguiente tabla de distribución, graficar histograma.

54

Representación Gráfica 2.

Polígono de Frecuencia

. Es

un gráfico de trazos de la frecuencia de clase con relación a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectángulos del histograma.

. Ejemplo:

Realizar el polígono de frecuencia de la tabla anterior.

55

Representación Gráfica

56

Representación Gráfica 3.

Ojiva:

.

Al igual que el histograma y el polígono de frecuencias es representar distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias acumuladas.

.

En el eje horizontal se considera los limites de clase. Limites inferiores  Ojiva mayor Limites superiores  Ojiva menor 57

Representación Gráfica

Ojiva Mayor

Ojiva Menor 58

Representaciones Gráficas

59

Tabla de Contingencia 2 x 2 

Sirve para analizar la relación de dependencia o independencia entre dos variables cualitativas o una cualitativa y otra cuantitativa, es necesario estudiar su distribución conjunta o tabla de contingencia.

1.

Permite organizar la información contenida en un experimento cuando ésta es de carácter bidimensional, es decir, cuando está referida a dos factores.

2.

A partir de la tabla de contingencia se puede además analizar si existe alguna relación de dependencia o independencia entre los niveles de las variables objeto de estudio. 60

Tabla de Contingencia 2 x 2 

Para identificar relaciones de dependencia entre variables cualitativas se utiliza un contraste estadístico basado en el estadístico X2 (Chi-cuadrado), cuyo cálculo nos permitirá afirmar con un nivel de confianza estadístico determinado si los niveles de una variable cualitativa influyen en los niveles de la otra variable nominal analizada.

61

Tabla de Contingencia 2 x 2 

Considerando un grado de confianza del 95%, esto implica un  = 0,05.



Ho: El sexo de la persona no es un facto determinante en que la persona fume. Son independientes.



H1: El sexo de la persona es un facto determinante en que la persona fume. Son dependientes.



Obtención del grado de libertad para X2 (Chi-cuadrado): Grados de libertad: (r-1)*(c-1), 

Grados de libertad: (2-1)*(2-1)=1



Valor tabla = 3,84

r: filas; c: columnas

62

Tabla de Contingencia 2 x 2



Si el resultado es menor a 3,84 no se rechaza Ho



Si el resultado es mayor a 3,84 se rechaza Ho 63