Teoria y Practica ESTADISTICA

INSTITUTO MARIA AUXILIADORA LA PLATA CURSO: SEGUNDO AÑO EDUCACIÓN SECUNDARIA. DOCENTES: MARTÍNEZ ROSANA - FERNANDEZ PER

Views 125 Downloads 0 File size 278KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

INSTITUTO MARIA AUXILIADORA LA PLATA CURSO: SEGUNDO AÑO EDUCACIÓN SECUNDARIA.

DOCENTES: MARTÍNEZ ROSANA - FERNANDEZ PEREIRA RAÚL.

ASIGNATURA: MATEMÁTICA.

TEMA: ESTADÍSTICA DESCRIPTIVA.

Trabajo práctico destinado a: 1. Poder elaborar encuestas, con la finalidad de interpretar gráficos estadísticos. 2. Contar con herramientas teóricas, tendientes a discriminar la calidad de la información estadística. 3. Reconocer la potencialidad de dichas herramientas.

(...) Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un electrón en un instante determinado. Pero, personalmente, no creo que Dios juegue a los dados. Albert Einstein (1879 – 1955)

ESTADISTICA DESCRIPTIVA. BREVE RESEÑA HISTORICA. Desde los comienzos de la civilización, han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas. Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la población y la renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros bíblicos de números y crónicas incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías. En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba para cobrar impuestos hacia el 594 a.C. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a valores numéricos para evitar la ambigüedad de las descripciones verbales. En nuestros días, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. DEFINICION:

La enciclopedia Británica define la estadística como la ciencia encargada de recolectar, analizar, presentar e interpretar datos. La estadística pasa a ser una ciencia básica cuyo objetivo principal es el procesamiento y análisis de grandes volúmenes de datos, resumiéndolos en tablas, gráficos e indicadores (estadísticos), que permiten la fácil compresión de las características concernientes al fenómeno estudiado. CLASIFICACION: ESTADISTICA DESCRIPTIVA: Se emplea para resumir de forma numérica o gráfica un conjunto de datos. Se restringe a describir los datos que se analizan. ESTADISTICA INFERENCIAL: Permite realizar conclusiones o predicciones, basándose en los datos simplificados y analizados de una muestra hacia la población o universo. ETAPAS A CUMPLIR: 1. Recuento, relevamiento y compilación de datos. 2. Presentación en tablas y agrupamiento de los datos obtenidos. 3. Medición de los datos: Se puede ver que los datos tienden a centrarse en torno de ciertos valores llamados parámetros o medidas de posición (MEDIA, MEDIANA y MODA), para luego analizar la dispersión de los datos respecto a los valores centrales, definiéndose los parámetros o medidas de dispersión. 4. Inferencia estadística, encargada de resolver las predicciones. DEFINICIONES GENERALES: Establecemos a continuación algunas definiciones de conceptos básicos y fundamentales como son: elemento, población, muestra, tamaño, caracteres y variables, a las cuales haremos referencia a lo largo del trabajo práctico. Individuos o elementos: Personas u objetos que contienen cierta información que se desea estudiar. Población: Conjunto de individuos o elementos que cumplen ciertas propiedades comunes. Muestra: Subconjunto representativo de una población. Dato: Cada valor observado de la variable. Si representamos por X a la variable, representaremos por xi cada dato diferente observado en la muestra, el subíndice “i” indica el lugar que ocupa si los ordenamos de menor a mayor. Tamaño de la población: Es el número de elementos que la componen. Esta puede ser: * Finita, como es el caso del número de personas que llegan al servicio de urgencia de un hospital en un día; * Infinita, si por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de caras y secas obtenidas en el lanzamiento repetido de una moneda al aire. Caracteres de una población: Son las propiedades que poseen los elementos de una población. Dichos caracteres se dividen en dos grupos:

1 - Cuantitativos o variables: Se describen con números (P/ej: Estatura, edad, peso, etc.) 2 - Cualitativos o atributos: No las podemos representar con números (no son medibles). Se las nombra con palabras (P/ej: Sexo, raza, religión, etc.) Variables: Las clasificamos como continuas y discretas: * Contínuas: Constituida por todos los valores comprendidos en un cierto intervalo (P/ej: temperatura, presión, peso, estatura, etc.) * Discretas: Se toman solamente determinados valores en la forma de números enteros (P/ej: Habitantes de una casa, cantidad de alumnos en una escuela, etc.) DISTRIBUCION DE FRECUENCIA EN SERIE SIMPLE. Comencemos por ver un ejemplo de aplicación: Medimos la altura de los niños de una clase y obtenemos los siguientes resultados (cm): Alumno Alumno 1 Alumno 2 Alumno 3 Alumno 4 Alumno 5 Alumno 6 Alumno 7 Alumno 8 Alumno 9 Alumno 10

Estatura 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Alumno Alumno 11 Alumno 12 Alumno 13 Alumno 14 Alumno 15 Alumno 16 Alumno 17 Alumno 18 Alumno 19 Alumno 20

Estatura 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28

Alumno Alumno 21 Alumno 22 Alumno 23 Alumno 24 Alumno 25 Alumno 26 Alumno 27 Alumno 28 Alumno 29 Alumno 30

Estatura 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21

Si presentamos esta información ordenada obtendríamos la siguiente tabla de frecuencia:

ESTATURA

1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30

FRECUENCIA FRECUENCIA FRECUENCIA ABSOLUTA ACUMULADA RELATIVA

1 4 4 2 1 2 3 3 4 3 3

1 5 9 11 12 14 17 20 24 27

30

0.033 0.133 0.133 0.066 0.033 0.066 0.1 0.1 0.133 0.1 0.1

La tabla que vemos recibe el nombre de distribución de frecuencia en serie simple, siendo ella la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre una variable que se estudie. Frecuencia Absoluta: Es la cantidad de veces que se repite cada valor de la variable en estudio. Si sumamos los valores de dicha columna, obtenemos el número total de observaciones. Frecuencia Relativa: Es el cociente (división) obtenido de dividir cada frecuencia absoluta por el número total de datos. (En el caso de nuestro ejemplo, dividir cada frecuencia absoluta por la cantidad de alumnos, es decir F.Abs. / 30). Frecuencia Acumulada: Es la suma de las frecuencias absolutas. Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis. Se recurre en estos casos a agrupar a los datos en INTERVALOS DE CLASE. DISTRIBUCION DE FRECUENCIA POR INTERVALOS DE CLASE: Cuando se cuenta con un gran número de datos CUANTITATIVOS, nos conviene organizarlos de tal forma que nos resulte más rápida la lectura de los mismos. Para ello contamos con la distribución de frecuencias agrupadas por INTERVALOS DE CLASE, las cuales cumplen con lo siguiente:  Cada dato debe pertenecer a una sola clase.  Todas las clases deben tener la misma AMPLITUD.  No es conveniente dejar clases vacías. Para poder confeccionar los intervalos de clase, debemos identificar el mayor y el menor de los datos obtenidos, para así poder establecer la cantidad de intervalos deseados.

AMPLITUD DEL INTERVALO = (DATO MAYOR – DATO MENOR) / Nº DE INTERVALOS Vamos a aplicar lo visto a través de un ejemplo: Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la misma categoría de esta ciudad. Los datos obtenidos (en pesos) fueron: 330 420 450

330 430 470

370 430 470

380 430 470

390 430 470

390 440 480

390 440 490

400 450 500

410 450 500

420 450 510

510

530

530

540

560

580

580

600

610

630

Calculamos la amplitud que debe tener cada intervalo, tomamos por ejemplo una cantidad de intervalos igual a 6: Amplitud de cada Intervalo =

630 – 330_ = 50 6

Por lo tanto tendremos 6 intervalos de amplitud 50. Ahora, tomando el valor más chico de los datos obtenidos (en nuestro ejemplo 330), vamos obteniendo los distintos intervalos (en nuestro caso sumando de a 50), obteniendo la siguiente tabla: FRECUEN FRECUEN FRECUEN INTERVA CIA CIA CIA LO DE ABSOLUT ACUMULA RELATIV CLASE A DA A

[330 380) [380 430) [430 480) [480 530) [530 580) [580 630)

3

3

0,075

8

11

0,2

14

25

0,35

6

31

0,15

4

35

0,1

5

40

0,125

Los intervalos obtenidos son SEMI – ABIERTOS, esto quiere decir que el valor más pequeño es el incluido en el intervalo (se lo representa con un corchete) y el mayor no queda incluido en el intervalo (se lo representa con un paréntesis). MÉTODOS GRÁFICOS: La forma de la distribución de frecuencias se percibe más rápidamente si la representamos gráficamente. Se resume la información de la muestra de forma gráfica con fines clarificadores, o para enfatizar y descubrir determinadas características que de otra manera seria muy difícil de apreciar. Un grafico siempre es más inmediato de comprender que un conjunto de datos estadísticos. Las representaciones graficas varían según el tipo de caracteres de la población estudiada. Para ello será conveniente, en caracteres de tipo CUALITATIVO utilizar diagramas del tipo CIRCULAR o de TORTA; o el diagrama de BARRAS. Para caracteres de tipo CUANTITATIVO recurriremos al llamado HISTOGRAMA (Se puede utilizar también el diagrama de BARRAS). Pasaremos a estudiar cada uno de ellos:

DIAGRAMA DE BARRAS: Es la representación gráfica para variables cuantitativas (pocos valores) o para variables cualitativas. En el eje de ordenadas representamos los diferentes valores de la variable (x i). Sobre cada valor levantamos una barra de altura igual a la frecuencia, ya sea absoluta o relativa. Suponemos una distribución formada por 100 alumnos de 6° de Primaria, en la que estudiamos la nota media a final de curso redondeada a enteros. La tabla de frecuencia de esa distribución podría ser la siguiente:

DIAGRAMA DE BARRAS. DIAGRAMA DE SECTORES O DE PASTEL: Es el más usual en variables cualitativas. Se representan mediante círculos. A cada valor de la variable se le asocia el sector circular proporcional a su frecuencia. Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones locales de un partido político: xi fi A favor 50% En contra 40% Abstención 10% Para construir el diagrama de sectores partimos del hecho de que un círculo encierra un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos sectores, de acuerdo con cada porcentaje; tenemos así que para determinar el sector correspondiente al 50%, resolvemos la ecuación:

X = 50 . 360_ = 180 100 Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuación, con ayuda de un transportador, señalaremos el sector circular de medida 180 grados. Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representación grafica: HISTOGRAMA: Se trata de un gráfico de barras que se utiliza para representar intervalos de clase. Sobre el eje de las abscisas (eje horizontal), se representan los intervalos de clase, y sobre el eje de las ordenadas (eje vertical) las frecuencias de los intervalos. Como se puede ver el gráfico consiste en una serie de rectángulos adyacentes, cuya base representa la amplitud de cada intervalo, y su altura la frecuencia de cada clase. Ejemplo: Los datos que se muestran a continuación representan el costo de la energía eléctrica durante el mes de julio del 2006 para una muestra aleatoria de 50 departamentos con dos recamaras en una ciudad grande. Costo de energía eléctrica en pesos. 96 157 141 95 108

171 185 149 163 119

202 90 206 206 150

178 116 175 175 154

147 172 123 130 114

102 111 128 143 135

153 148 144 187 191

197 213 168 166 137

127 130 109 139 129

82 165 167 149 158

Determinar la tabla de frecuencias para 7 intervalos de clase (k = 7) K 1 2 3 4 5 6 7

LIMITES DE F Absoluta CLASE [80;100) 4 [100;120) 8 [120;140) 12 [140;160) 8 [160;180) 10 [180;200) 4 [200;220) 4

F Acumulada

F Relativa

4 12 24 32 42 46 50

0.08 0.32 0.8 1.44 2.28 3.2 4.2

MEDIDAS DE POSICIÓN O TENDENCIA CENTRAL: Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de calcular un número único, que represente o resuma todos los datos. Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas. Una medida de posición es un número que se toma como orientación para referirnos a un conjunto de datos. Las Principales Medidas de Posición son: La Media Aritmética, la Mediana y la Moda. Veamos cada una de ellas a través de un ejemplo: La tabla siguiente muestra las notas obtenidas por los alumnos de un 2do. Año en una evaluación de Matemática. NOT AS

1 2 3 4 5 6 7

Frecuen Frecuen cia cia Absolut Acumul a ada

2 3 1 3 6 8 4

2 5 6 9 15 23 27

La media aritmética (X). Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. La media es el valor más representativo de la serie de valores, siendo éste el punto de equilibrio, el centro de gravedad de la serie de datos. La media aritmética de una serie de n valores de una variable X1, X2, X3; X4,.........Xn, es el cociente de dividir la suma de todos los valores que toma la variable (Xi) multiplicada por su correspondiente frecuencia absoluta, dividió el número total de variables. La formula se puede expresar así:

8 9 10

7 4 2

34 38 40

En nuestro ejercicio, reemplazando los valores de las variables y sus correspondientes frecuencias absolutas, nos queda: _ X = 1.2 + 2.3 + 3.1 + 4.3 + 5.6 + 6.8 + 7.4 + 8.7 + 9.4 + 10.2_ = 241_ = 6,025 40 40

No siempre podemos utilizar la media aritmética, por ejemplo, en los casos en que las variables no son numéricas; o en aquellas muestras en que existe un valor muy distinto al de los del conjunto (por ejemplo, si tengo valores de temperatura que están entre valores de 0º a 20º C, y contamos con un valor muy elevado de 43º C, pudiendo descartar este último si deseamos calcular la media aritmética). En estos casos, se utilizan otros valores como la MEDIANA y la MODA. Mediana (Me): Es el valor que divide a una muestra en dos partes iguales, es decir, es el valor de la variable que ocupa la posición central. Lo dicho es válido si la cantidad de variables es IMPAR.Si tenemos un número PAR de variables, la mediana será el valor de obtener el promedio de los dos valores centrales. En nuestro ejemplo tenemos un número PAR de variables (de 1 a 10). Los valores centrales son 5 y 6, teniendo como valor promedio de ellos 5,5, siendo éste el valor de la mediana (Me = 5,5). Moda (Mo): Se obtiene de aquella variable que tiene el MAYOR valor de frecuencia ABSOLUTA. En nuestro ejemplo, Mo = 6. El ejemplo visto es válido para el caso de una distribución de frecuencia en serie simple. Veremos un ejemplo de aplicación para una distribución de frecuencia por intervalos de clase. Dada la siguiente distribución de frecuencia referida a las horas extras realizadas por un grupo de 132 obreros. Calcula la media aritmética, la mediana y la moda. K

LIMITES DE CLASE

MARCA DE CLASE

F Absoluta

F Acumulada

1

[55;59)

57

6

6

2

[60;64)

62

20

26

3

[65;69)

67

18

44

4

[70;74)

72

50

94

5

[75;79)

77

17

111

6

[80;84)

82

16

127

7

[85;89)

87

5

132

Para calcular la media aritmética, tomamos un valor representativo de cada uno de los intervalos, el que recibe el nombre de MARCA DE CLASE, obteniéndolo con la fórmula:

Xn =

_límite inferior de la clase + límite superior de la clase _ 2 La media aritmética, la obtenemos con la formula ya vista:

= 57.6 + 62.20 + 67.18 + 72.50 + 77.17 + 82.16 + 87.5 = _9444_ = 71,54 132

132

Para calcular la mediana y la moda para datos dados en intervalos de clase, existen fórmulas, pero para poder efectuar cálculos con mayor rapidez. En el caso de la mediana, tomamos la marca de clase donde cae la mediana. En el ejemplo, como tenemos un número IMPAR de intervalos de clase, la mediana será el valor medio de todos los intervalos (en el ejemplo, [70;74) ). Tomamos el valor de la marca de clase como valor de la mediana. Por lo tanto: Me = 72 Para la moda se habla de CLASE o INTERVALO MODAL, siendo éste aquel que tiene la mayor frecuencia absoluta. En nuestro ejemplo 4

Por lo tanto, Mo = 72

[70;74)

72

50

94

TRABAJO PRÁCTICO – ESTADISTICA DESCRIPTIVA Objetivo del presente trabajo práctico:  Elaboración de encuestas de temas cotidianos.  Recolección de la información.  Poder interpretar los datos obtenidos con la utilización de las herramientas vistas en el presente documento.  Realizar gráficos estadísticos sencillos.  Calcular valores representativos estadísticos tales como media aritmética, mediana y moda. Tareas a cumplir para su realización: 1. El trabajo puede ser realizado de manera grupal, no pudiendo tener el mismo más de 3 (tres) miembros.

2. Elegir un tema de los que se proponen a continuación: a) Consumo de alcohol. b) Consumo de tabaco. c) Práctica de un deporte determinado. d) Horas de uso de Internet. 3. Con el fin de obtener los datos sobre el tema elegido, tomar una muestra de alumnos del Instituto, donde la cantidad de encuestados debe ser un número no menor a 14 alumnos ni mayor a 24 alumnos. 4. Con los datos obtenidos, agruparlos en una tabla y proceder a ordenarlos. 5. Realizar un gráfico representativo de los datos obtenidos. 6. Calcular las Medidas de Tendencia Central (Media aritmética, mediana y moda). 7. Plantea conclusiones simples sobre el trabajo realizado.

Para finalizar dos cuestiones: 1) El trabajo a presentar debe ser LEGIBLE, recomendando sean prolijos, presentando lo solicitado de manera ordenada y clara. 2) FECHA LIMITE DE ENTREGA DEL TRABAJO: …………………………………………….