Silabo Estadistica

ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO PROFESIONAL HÉROE NACIONAL CAPITÁN PNP “ALIPIO PONCE VASQUEZ” PUENTE PIEDRA – LIMA

Views 113 Downloads 1 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO PROFESIONAL HÉROE NACIONAL CAPITÁN PNP “ALIPIO PONCE VASQUEZ” PUENTE PIEDRA – LIMA

SILABUS DESARROLLADO DE LA ASIGNATURA “ ESTADISTICA ” PROMOCION 2019 – II “INTEGRIDAD ”

2020

1

SILABUS ESTADISTICA I. DATOS GENERALES ASIGNATURA : ESTADISTICA EJE CURRICULAR : Formación Técnico Profesional Policial AREA COGNITIVA : Formación Académica del Programa Regular HORAS SEMESTRALES: 48 horas académicas HORAS SEMANALES : 03 Horas DIA Y HORA : LUNES 10.40– 13.20 PERIDO ACADEMICO : II PERIODO ACADEMICO PROMOCION 2019 – II “INTEGRIDAD ” II. PRESENTACION La presente asignatura aporta al perfil del Técnico Profesional en el curso de ESTADISTICA como recopilación, organización, presentación, análisis e interpretación de datos y su utilización, análisis interpretación de datos y su utilización en la toma de decisiones. Calculo de las medidas de tendencia central y de dispersión y una Introducción a probabilidades aplicados a la función policial. Nociones de análisis combinatorio. III. OBJETIVOS GENERALES:    

Proporcionar los métodos y procedimientos para el análisis de datos. Proporcionar los conocimientos básicos del diseño de experimentos Usar los métodos estadísticos en la toma de decisiones Aplicaciones a la función Policial.

III . OBJETIVOS ESPECIFICOS: Al finalizar el curso los alumnos de la Promoción “INTEGRIDAD “ deben conocer:   

Recopilar organizar y presentar datos. Calcular las medidas de tendencia central y de dispersión y aplicar a la función Policial. Analizar e interpretar resultados a problemas de aplicación a ala función Policial.

IV METODOLOGIA : El desarrollo del curso se basa en la participación activa de los alumnos mediante el desarrollo de problemas aplicados a la 2

actividad policial.. Las clases teóricas se complementaran con las prácticas y talleres dirigidas.

V. CONTENIDOS. CONTENIDOS

I UNIDAD CONCEPTOS BASICO DE LA ESTADISTICA DEFINICION DE VARIABLES

SESIÓN 1 PRIMERA SEMANA

 

Presentación de la Asignatura. Conceptos básicos Estadística Descriptiva Estadística Inferencial, Población, muestra

(03 hrs) 18MAY2020

SESIÓN 2 SEGUNDA SEMANA (03 hrs) 25MAY2020

    

Definición de variables clasificación de variables Variables Cualitativa. Variables Cuantitativa. Valor Estadístico. Sumatorias simples

COMPETENCIA Comprender los conceptos básicos de la Estadística descriptiva como inferencial, población, muestra, definición de variables, tanto cualitativas como cuantitativas.  Reconoce, describe, analiza, expresa, clasifica y formaliza los conceptos de la estadística tanto descriptiva como inferencial.  Identifica el contenido del curso Diferencia los conceptos y teorías Estadísticas.  Reconoce que es una población y una muestra.

 Clasifica los distintos tipos de variables, así como clasifica las nomenclaturas Estadísticas.  Muestra interés en conocer los tipos y clases de variables.  Discrimina los distintos tipos de variables, así como clasifica las nomenclaturas estadísticas

3



SESIÓN 3 

TERCERA SEMANA



Práctica calificada de recopilación, tabulación de datos Presentación de datos

 

Toma de datos primarios y Secundarios. Interpreta los datos como fuentes de proyección. Utiliza sus datos para su análisis.

(03 hrs) 01JUN2020 

SESIÓN 4 

CUARTA SEMANA

Tabla de distribución de frecuencias para una variable cualitativa.

 

(03 hrs)

Utiliza agrupación de frecuencias absolutas y relativas simples. Prepara cuadro de distribución de frecuencias Ordena califica los datos y su periodicidad.

08JUN2020

II UNIDAD DISTRIBUCIÓN DE FRECUENCIAS, REPRESENTACIONES GRÁFICAS. SESIÓN 5 QUINTA SEMANA

 

Recopilación, tabulación de datos Presentación de datos

COMPETENCIA Prepara cuadro de distribución de frecuencias.

 Conoce y utiliza sus datos para su análisis.  Infiere datos sobre medidas tendencia central para datos agrupados y no agrupados

(03 hrs) 0106JUN20

4

SEXTA SEMANA

SESIÓN 6 

(03 hrs)

Práctica dirigida de Distribución de frecuencias para una variable cuantitativa y cualitativa

05-20JUN20

SEPTIMA SEMANA

 Conoce y comprende la agrupación de frecuencias absolutas y relativas simples y acumuladas  Prepara cuadro de distribución de frecuencias.  Ordena, clasifica los datos y su periodicidad.

SESIÓN 7 

1ER EXAMEN PARCIAL

(03 hrs) 29JUN2020

OCTAVA SEMANA (03 hrs) 06JUL2020

OCTAVA 8  

Estadística gráfica de barras. Estadística grafica de histogramas de frecuencia y polígonos de frecuencia.

 Conoce gráficos estadísticos y su clasificación.  Uso de cuadros estadísticos.  Realiza y describe con precisión cuadros estadísticos.

NOVENA SEMANA (03 hrs)

NOVENA 9 

Práctica calificada Taller de Repaso.

13JUL2020

5

III UNIDAD MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN

DECIMA SEMANA

  

Media aritmética propiedades. Mediana propiedades. Datos originales

(03 hrs)

COMPETENCIA Organizar los graficos estadígrafos de tendencia central en la presentación de de diversos datos frente a la realidad del campo policial, manifestando confianza y perseverancia en su aprendizaje.  Conoce y aplicar y resolver con claridad ejercicios.  Identifica las propiedades de media aritmética y mediana.  Interpreta el valor central

20 JUL 20

DÉCIMA PRIMERA SEMANA

SESIÓN 11  

Moda propiedades. Práctica Calificada.

(03 hrs)

 Aplica y resuelve con claridad ejercicios  Resuelve problema propuestos de cálculo con precisión. 

27JUL20 SEGUNDA EVALUACION PARCIAL DÉCIMA SEGUNDA SEMANA (03hrs) 03AGO20

6

DÉCIMA TERCERA SEMANA

SESIÓN 13   

Cuantiles Deciles y percentiles Datos no agrupados y agrupados

 Identifica la diferencia de datos originales y agrupados

(04 hrs) 10AGO20

DÉCIMA CUARTA SEMANA (04 hrs)

SESIÓN 14    

La Varianza Desviación media. Definiciones y propiedades Coeficiente de variación

17AGO20

DÉCIMA

SESIÓN 15

QUINTA

SUSTENTACION DE TRABAJOS APLICATIVOS

SEMANA

 Identifica y contrasta las formulas con los resultados.  Analiza e interpreta la separación de datos.  Resuelve con precisión en sus cálculos.  Resuelve casos y relaciona y decide la variación de datos.

(04 hrs) 24AGO20 DÉCIMA SEXTA

SESIÓN 16 EVALUACION FINAL

SEMANA (04 hrs) 31AGO AL 05SET2020

7

VII. EVALUACIÓN La asistencia a las sesiones es obligatoria en un 100%, salvo situación de servicio, lo que se informará al Departamento Académico (DACA). El proceso de evaluación del aprendizaje será permanente, comprenderá: A. Evaluación Diagnóstica o de Entrada para valorar el nivel de conocimiento de la asignatura. B. Evaluación Formativa Interactiva, en relación a la participación activa del Alumno (a) en el aula. El promedio de las intervenciones orales constituirá Nota de Paso Oral. C. Evaluación Formativa o de Proceso para comprobar el rendimiento académico, pronosticar posibilidades de desarrollo de los Alumnos (a) y reorientar la metodología, para lo cual se aplicará: 1. Prácticas Calificadas, pruebas orales 2. Dos exámenes escritos parciales (7º y 12º semana), enmarcados en los modelos de las Pruebas que son propias de la naturaleza de la Asignatura. 3. Un examen final (16º semana), B. Evaluación Sumativa para comprobar el nivel de desarrollo cognitivo, reflexivo y del pensamiento lógico, para lo cual se aplicará un examen final (16º semana), de similar característica empleada en los exámenes parciales. C. El Promedio General se calculará en concordancia con las disposiciones establecidas en el Manual de Régimen de Educación de las Escuelas de Formación de la PNP y con la naturaleza de la asignatura, conforme se detalla a continuación: Promedio General: PG = [(PEP (3) + PO (1) + TA (2) +EF (4) ] /10 PEP PO TA EF

VI.    

= = = =

Promedio de Exámenes Parciales Prueba Oral Trabajo aplicativo Examen Final

BIBLIOGRAFIA ESTADISTICA : M.R. Spiegel ESTADIST5ICA ELEMENTAL : Jhnson - Kuby ESTADISTICA APLICADA : C Martinez ESTASDISTICA EDITORIAL SAN MARCOS

8

CAPITULO 1 INTRODUCCION. Este primer capítulo tiene por objetivo presentar algunos conceptos básicos de estadística, así como de sumatorias simples y dobles los cuales se van a utilizar con frecuencia para una mejor comprensión de los capítulos siguientes. 1.1 ESTADISTICA Es una ciencia que proporciona métodos para el análisis de datos, cuando Estos por su naturaleza presentan incertidumbre en la toma de decisión. Otra definición es: Es una matemática aplicada para el análisis de datos. Es el estudio de los fenómenos aleatorios. 1.2 RAMAS DE LA ESTADISTICA La estadística se divide en dos ramas:  ESTADISTICA DESCRIPTIVA Es la parte de la estadística que consiste en la recolección, organización, presentación y el análisis de datos . 

ESTADISTICA INFERENCIAL Es la parte de la estadística que consiste en tomar decisiones sobre el comportamiento de una variable de interés de una población estadística en estudio; utilizando para tal objetivo una muestra al azar. Es decir a partir de los resultados obtenidos al procesar los datos de una muestra se generaliza el resultado de dicha variable en la población, con un cierto riesgo que es cuantificado por la teoría de la probabilidad. La estadística inferencial proporciona métodos para el análisis de datos. 1.3 CONCEPTOS BASICOS 1.3.1 Población Es la totalidad de unidades elementales (personas o cosas) sujeto a estudio y que poseen una característica común, al tamaño de la población (número de unidades elementales) se simboliza con la letra mayúscula “N” Una población en estudio puede ser finita (Se puede enumerar sus Elementos) o infinita (no se pueden enumerar sus elementos) Ejemplos: a.- Todas las tiendas que se dedican a la venta de gas en el distrito de la Molina en el año 2019 (N= 850) b.- Todos los establos de ganado vacuno en el departamento de Cajamarca en el I semestre del 2019 ( N= 2350 ) c.- Todos los alumnos matriculados en el semestre 2019 –I d.- Todos los Cadetes de la Escuela de Oficiales de la PNP, en el proceso de formación en el año 2015. (N= 788) e.- Todas las multas impuesta por la PNP por infringir al Reglamento Nacional de Transito durante el mes de setiembre del año 2019 (N= 1 679) f.- Todos los usuarios que concurren a la Biblioteca de letras y Ciencias Humanas de la UNMSM, un día cualquiera (N= 1742) 9

1.3.2 Unidad Elemental Es cada uno de los elementos que conforman la población en estudios, de la cual se requiere información . De una unidad elemental se define muchas variables de interés para el investigador ejemplo: a) Una población que se dedica a la venta de gas en el distrito de la molina Dato u observación.Es el valor (atributo, conteo o medición) que forma la variable de interés en la unidad elemental. Los valores que se toma una variable en particular x, se representa con letras minúsculas acompañadas por subíndice, es decir , X = ( X 1 , X2 , X 3 ………………… X n ) X i = valor que toma la variable x en la i-esima observación 1.3.4 Variable Es una característica de interés que se desea analizar de una unidad Elemental. La variable en estudios la fija el investigador, el valor que toma la variable ( dato u Observación ) cambia de unidad elemental a otra. A una variable se le simboliza universalmente con las ultimas letras del Abecedario, tales como x, y, z , o también letras mayúsculas acompañada con subíndice, tales como : x1 , x2 , …….. x k Ejemplo de variables en estudio: a.- X= Montos ( s/ ) por venta diaria de balones de gas b.- Y= Cantidad de ganado vacuno en un establo c.- z= Color de ojos de los Cadetes de la EO- PNP d.- W= Volumen (cm 3) del contenido de botella de gaseosa e.- T= Tiempo (minutos) que permanece un usuario en un cajero Automático. 1.3.5 Tipos de variables: De acuerdo a los valores que toma la variable en estudio, se clasifican en:  Variable Cualitativa.Cuando los valores que toma la variable en estudio provienen de una cualidad o atributo, se divide a su vez en nominal y jerárquica (ordinal). 

*

Variable Cualitativa Nominal.Una variable se considera cualitativa nominal cuando con los valores que Forma esta variable no es posible establecer un orden de acuerdo a su importancia. Ejemplos: a. X= color de los ojos de los alumnos – PNP b. Y= Preferencias a determinadas marcas de jabones de tocados por las alumnas femeninas. c. Z= Sexo de los alumnos –PNP Variable Cualitativa Jerárquica.Una variable se considera cualitativa jerárquica cuando los valores cuando los valores que toma la variable en estudio es posible establecer un orden 10

de acuerdo a su importancia (ascendentemente o descendentemente) Ejemplos: a.- X= Grados Académicos de los Docentes de la Facultad de Ingeniería de Sistema de la Universidad Mayor de San Marcos, bachiller, magister b- Y= Grados del personal de Oficiales de la Policía Nacional del Perú Teniente General, General, Coronel, Comandante, Mayor, Capitán, Teniente, Alférez. c.- Z= Clase social: alta, media, baja. * Variable Cuantitativa Los valores que toma la variable provienen de un conteo o de una medición instrumento de medida, metro, balanza, cronometro, termómetro etc) . Se divide a su vez:  Variable Cuantitativa Discreta Una variable se considera cuantitativa discreta cuando los valores que toma la variable provienen de un conteo . También se dice que los valores que toma esta variable están asociados a los números enteros. Ejemplos: a. X = Numero de gusanos por hoja b. Y = Número de hijos por familia c. Z = Número de accidentes diarios de transito registrados durante un mes determinado. d. T= Numero de artículos de las revistas científicas.

* Variable Cuantitativa Continua.Una variable se considera cuantitativa continua cuando los valores que toma la variable provienen de una medición, es decir, los valores que toma se encuentran en un intervalo. También se dice que los valores que toma esta variable están asociados a los números reales. Ejemplos: a. X= Tiempo de vida (hora) de baterías para automóviles b. Y= Edad (años) de los alumnos matriculados en el presente año Académico . c. Z = Estatura (mts) de los alumnos –PNP. 1.3.6 Muestra Es una parte representativa de la población estadística en estudio o también se dice que es un subconjunto de unidades elementales de la población . Al tamaño de la muestra se le representa con la letra minúscula “n” Se dice que una muestra es aleatoria o al azar , cuando todos los Elementos de la población tienen la misma probabilidad de ser parte de la muestra.

11

Muestreo.- Es el procedimiento para obtener una muestra representativa de la población en estudio . 1.3.7 Parámetro.Es un valor fijo que caracteriza a la variable de interés en la población en estudio. Para conocer este valor se requiere tener Todos los datos de la variable en la población por lo general este valor casi nunca se conoce el objetivo de investigador es estimarlo a través de una muestra aleatoria .Los parámetros más usados son 1. La media aritmética 2. La mediana 3. La Moda 4. La media Geométrica 5. La media Armónica 6. La varianza 7. La Desviación Estándar 8. Coeficiente de variación 1.3.8 Valor Estadístico o estimado Es un valor calculado con los datos de la muestra aleatoria y se Supone estima al valor del parámetro de la variable en estudio en la Población .Este valor cambia de una muestra a otra muestra. La formula permite calcular el valor estadístico, recibe el nombre de Estimador o estadística . Los valores estadísticos más utilizados son: a. La media aritmética b. La mediana c . La Moda d. La media Geométrica e. La media Armónica f. La varianza g. La Desviación Estándar h. Coeficiente de variación 1.4 Ejercicios resueltos Ejemplo -1 En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que se dedican a la venta de combustible de un día determinado, se obtiene en siguiente resultado, el monto de venta diaria promedio de s/ 12 600.50 con esta información identificar población estadística, unidad elemental, variable en estudio, tipo de variable, un posible dato, tamaño de la muestra, parámetro y estimado o valor estadístico. Solución: Población estadística

: Todos los grifos de Lima Metropolitana, que se 12

dedican a la venta de combustible . Unidad elemental : Un grifo de Lima Metropolitana, que se dedican a la venta de combustible. Variable en estudio : Monto por venta ( s / ) diaria de combustible Tipo de variable : Variable cuantitativa continua Dato u observación : s/ 12 600.50 Tamaño de la muestra : 30 grifos Parámetro : No se conoce el monto promedio por venta diaria en la población . Dato estadístico : s/ 12 600.50. Ejemplo -2 De una población de 2 042 revistas científicas de biología, el 41,63% están escritas en idioma inglés, Una muestra aleatoria de 50 revistas arroja que el 42.12% están escritas en inglés, el promedio de artículos por revistas es de 12,4 .Con esta información identificar, población unidad elemental, variables, en estudios, tipos de variables, posibles datos, tamaño de la muestra, parámetro y estimado o valor estadístico. Solución: Población estadística: Todas las revistas científicas de biología N=2 042 Unidad elemental : Una revista científica de biología Tamaño de la muestra:50 revista científicas de biología

Variable estudio

en Tipos variables

Idioma de la revista Número de artículos

de Datos u Parámetro observaciones

Cualitativa Nominal Cuantitativa Discreta

Español Ingles Portugués 12,16, 8, 9 etc

41,63% Se desconoce

Estimador o valor estadístico 42,12% 12, artículos

4

1.5 Ejercicios Propuestos.En cada uno de los siguientes enunciados identificar de ser posible , la población ,unidad elemental, variables en estudio, tipos de variables, tamaño de la muestra , valores estadísticos, parámetros, y un ejemplo de dato en cada caso : 1. De una población de 1000 alumnos PNP, se elige una Muestra aleatoria de 25 cadetes, arrojando la siguiente información : el 98.4% son varones , la estatura promedio es d 1,69 mts, el gasto semanal promedio por cafetería es de s/ 35.8 el 30% se encuentran en el 5to año de estudio2. Una muestra aleatoria de 30 recién nacidos en la Maternidad de Lima Arroja un peso promedio de 3.50 Kg. 13

3. Una muestra aleatoria de 550 peruanos mayores de 18 años arroja que el 30% está de acuerdo con las medidas económicas anunciados por el gobierno hace uno días . 4. Para analizar la posibilidad de lanzar al mercado una nueva marca de cigarrillos, se efectuó una encuesta entre fumadores que transitan por la quinta cuadra de la av. Canadá entre las 5 P.m. y 8 P.m. del día 14 de febrero, para ello se seleccionó en forma aleatoria a 80 fumadores obteniéndose los siguientes resultados : el 65% prefiere los cigarrillos importados que los nacionales y el precio promedio que pagan al comprador una cajetilla es de s/ 7.40. 1.6 SUMATORIAS SIMPLES DOBLES Y NOTACION PUNTUAL 1,7,1 SUMATORIAS SIMPLES. Sea x, una variable en estudio que toma valores x 1 x 1 ……..xn , la Suma de los valores x 1 + x 2 +……….+xn , se representa mediante el n

operador matemático ∑ xi ; que significa sumar todos los valores x i i=1

para “ i ” que toma valores enteros positivos consecutivos desde 1 hasta n, es decir : n

X 1 + x 2+ ……. x n

∑ xi ; i=1

Ejemplos : 1.Desarrollar las siguientes sumatorias 5

∑ x 2i + 1 = x 3 + x 5 + …… x11 i=1

6

2

2

2

2

∑ x2 = x 2 + x 4 + ……+ x12 i=1 4

∑ 2x i +1 = 2x 2 + 2x3+ ……… 2x 5 y5 y9 i=1 y 2i+1 y 3 2.- Supongamos que una variable X toma los siguientes valores X1 = 7 x 2= 9 x3 = 5 x 4 = 6 Calcular : 4

14

∑ 2x 2 i + 3 = 2( 7 )2 +3 + 2 (9) 2 + 3 ( 5) 2 +3 + 2 ( 6)2 +3 7-2 9-2 5-2 6-2 i=1 x i – 2 4

∑ 2x 2 i + 3 = 20.2 + 23.57 +17.67 + 18.75 = 80.19 i=1 x i – 2

CAPITULO 2 ORGANIZACIÓN DE DATOS INTRODUCCION Tiene por objetivo presentar los datos obtenidos de una población o muestra para una o más variables en estudio, en tablas de distribución de frecuencias y sus correspondientes gráficos .Con la finalidad de resumir la información para que sea de fácil interpretación y análisis. 2.1 ORGANIZACIÓN DE DATOS Los datos obtenidos de una población o muestra, para el estudio de una Variable de interés, conducen muchas veces a una gran cantidad de números o atributos , los cuales al intentar analizarlos en su forma original presentan dificultad en cuanto a su interpretación y análisis .Existe muchas interrogantes sobre la estructura de los datos tales como : a. Que categoría se presenta con mayor o menor frecuencia. b. Cuál es la distribución empírica de estos datos con respecto a la población (simétrica o asimétrica) c. Qué medidas resumen al conjunto de datos. Estas interrogantes se resuelven si los datos son organizados y Representados en tablas de distribución de frecuencias (inivariadas bivariadas) . Una tabla de distribución de frecuencias es un arreglo rectangular en filas y columnas en la cual los datos de una muestra o población son resumidos. En la primera fila de la tabla se colocan, el nombre de las variables en estudio , la frecuencia absoluta, frecuencia relativa , la frecuencia absoluta acumulada , frecuencia relativa acumulada y la marca de clase solo para variables cuantitativa continuas.

15

TITULO

Variable en estudio Clas -1 Clas-2

Frecuencia absoluta

Frecuencia relativa

Frecuencia absoluta acumulada

Frecuencia relativa acumulada

Marca clase

de

Clas-k Total LEYENDA: FUENTE :

2,2 ELEMENTOS DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS.  

 

TITULO Se coloca en la parte superior central de la tabla, el titulo debe ser, claro preciso, y conciso y guarde relación con la variable que se estudia. FUENTE Se coloca en la parte inferior de la tabla y corresponde al nombre de la entidad o literatura de donde se obtuvo la información, debe incluir la fecha si es posible, si el mismo investigador es autor de dicha información, debe colocar fuente propia . LEYENDA Se coloca delante de la fuente y corresponde a una nota o aclaración con respecto al contenido de la tabla. CLASE Se considera clase a una cualidad, un numero o intervalo, las clases para una tabla de distribución de frecuencia , deben ser mutuamente excluyentes, es decir . un dato solo puede pertenecer a una determinada clase. Al Numero de clases de una tabla se le representa por la letra “K” Si existe una gran cantidad de datos discretos o continuos, el número de Clase debe encontrarse entre 5 y 15 . Un número pequeño de clases puede ocultar la distribución real del conjunto de datos, mientras que un Número muy grande puede dejar sin observaciones algunas de las clases Limitando de esta forma su uso.



FRECUENCIA ABSOLUTA Su valor indica el número de veces que los datos de la muestra caen en una determinada clase .se representa por fi Para una muestra de tamaño “n” y con

16

“ k “ clase se cumple que la sumatoria de todas las frecuencias absolutas es igual a “n” es decir :

k

∑ fi =n i=1

Siendo f i = valor que toma la frecuencia absoluta en la i-esima clase n = tamaño de la muestra k= número de clase  FRECUENCIA RELATIVA Su valor indica la proporción o porcentaje de la muestra contenida en la clase. Se representa por h i y se obtiene al dividir la frecuencia absoluta por el tamaño de la muestra, es decir : h i = f i ( en proporción ) n

h i = f i x 100 % ( en porcentaje ) n En ambos casos se cumple que : Nota

k

∑ f i = h i = 1 o 100% i=1



FRECUENCIA ABSOLUTA ACUMULADA Se obtiene al acumular los valores de las frecuencias absolutas para cada clase. Un valor cualquiera indica que parte de la muestra , tiene valores menores o iguales al valor que toma la variable en estudio .Se presenta por F i y se obtiene por k

F= ∑ f i =

i=

1 ,2,…….K

i=1

k

Nota

F= ∑ f i = n i=1



El valor de F k nos indica la cantidad de datos menores o iguales al valor de iesima clase. FRECUENCIA RELATIVA ACUMULADA

17

Se obtiene al acumular los valores de las frecuencias relativas para cada clase.Su valor indica la proporción o porcentaje de la muestra que tiene valores menores o iguales al valor de la variable. Se representa por H i. También se obtiene dividiendo cada valor de la frecuencia acumulada absoluta por el tamaño de la muestra, es decir:



2.3

H = F i = 1,2,……….. k n Nota: H k = 1 o 100% El valor de H K nos indica la proporción o porcentaje de datos , menores o iguales al valor de la i- esima clase MARCA DE CLASE El concepto de marca de clase solo se usa cuando se elabora una tabla de distribución de frecuencias para una variable cuantitativa continua , y su interpretación matemática corresponde al punto medio para una determinada clase . Estadísticamente corresponde al valor representativo para todos los datos que caen en esa clase .Se calcula usando la formula

X i = Límite inferior + límite superior 2 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA. Cuando los datos corresponde a una variable cualitativa ( Nominal o jerárquica ) la tabla de distribución de frecuencia tiene la siguiente forma TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO 1 Variable fi hi 2 C1 f1 h1 3 C2 f2 h2 k

C TOTAL

fk N

hk 1

FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C i corresponde a los valores que toma la variable ( clase) , Si la variable es nominal no existe un orden entre sus valores, en cambio si la variable en estudios es jerárquica debe tomarse en cuenta el orden de sus valores, ya sea en forma ascendente y descendente. Para esta variable se presentan algunos tipos de gráficos, pero los más frecuentes es el grafico de barras verticales u horizontales , grafico circular gráfico de líneas y graficas pictóricos . Ejemplo: Con la finalidad de estudiar la variable x= Preferencia a determinados Marcas de jabones de tocador por los alumnos -PNP, se toma una muestra aleatoria conformada por 30 alumnos , los resultados son : Rexona Palmolive rexona camay Palmolive lux Camay lux lux rexona camay lux 18

Camay rexona camay lux lux camay Lux camay rexona rexona camay lux lux camay Palmolive lux luz FUENTE PACOCHA S.A Para este ejemplo la tabla de distribución de frecuencias es : DISTRIBUCION DE FRECUENCIAS SOBRE PREFERENCIA A MARCAS DE JABONES DE TOCADOR POR LOS 30 alumnos -PNP i

Jabones de F h h% tocador 1 rexona 6 0.2 20% 2 camay 9 0,3 30% 3 lux 12 0,4 40% 4 palmolive 3 0,1 10% total 30 1.0 100% FUENTE : PACOCHA S.A Calcular e interpretar: f 2 : 9 alumnos encuestados prefieren el jabón de tocador camay h 2 : 30% de los alumnos encuestados prefieren el jabón de tocador Camay

GRAFICA DE BARRAS PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS alumnas FEMENINAS PNP

frecuencia absoluta f 12 9

6 3

rexona

camay

lux

palmolive

FUENTE PACOCHA S.A.

19

GRAFICA DE CIRCULAR PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ALUMNAS FEMENINAS -PNP

frecuencia absoluta 3 6

10%

20% rexona camay lux

12

9

40%

palmolive

30%

2.4 TABLA DE DISTRIBUCION DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA DISCRETA. Cuando los datos corresponden a una variable cuantitativa discreta la tabla de distribución de frecuencias tiene la siguiente forma : TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO Variable f h F H 1 C1 f1 h1 F1 H1 2 C2 f2 h2 F2 H2 K

Ck fk hk Fk Hk total n 1 FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C1 corresponden a valores que toma las variables ( clase ) Ejemplo : Los siguientes datos corresponden a una muestra aleatoria de 50 tiendas Que se dedican a la venta de gas con la finalidad de analizar la variable Y= Número de balones de gas vendidos en un día determinado, los Resultados son : 21 21

23 22

24 24

23 22

24 24

21 25

24 26

23 25

24 24

22 23

22 23

24 21 20

23 23 22 24 26 26 22 23 22 24 21 22 23 25 26 24 22 25 24 25 21 26 25 24 Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos DISTRIBUCION DE FRECUENCIAS DEL NUMERO DE BALONES DE GAS VENDIDOS POR 5O TIENDAS

1 2 3 4 5 6

Variable 21 22 23 24 25 26

f 6 9 10 13 7 5 50

h 0,12 0,18 0,20 0,26 0,14 0,10 1.00

F 6 15 25 38 45 50

25 23

H 12 30 50 76 90 100

FUENTE: SOL GAS S.A Hallar e interpretar: f 3 = 10 significa que 10 tiendas , tienen una venta de 23 balones de gas h 3 = 20% significa que el 20% , de las tiendas tienen una venta de 23 balones de gas.

GRAFICA DE BASTONES 1º13 10 9 9

5 6

0 21

22

9

23

7

24

25

5

26

Fuente sol de gas

21

GRAFICA DE BARRAS

frecuencia Variable

26

25

24

23

22

21

f

13 10

9

7

6

1

2

3

4

5

5

6

2.5 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUANTITATIVA CONTINUA Cuando los datos corresponden a una variable cuantitativa continua la tabla de distribución de frecuencias tiene la siguiente forma : TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO Variable f h F H 1 C1 f1 h1 F1 H1 2 C2 f2 h2 F2 H2 K

Ck total

fk n

hk 1

Fk

Hk

FUENTE : ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C 1 corresponde a valores que toma la variable ( clases ) Ejemplo : Una muestra aleatoria de tamaño n= 34, es tomada con la finalidad de estudiar La variable W = peso del recién nacido en la Maternidad de Lima .Los resultados en kg. Se presentan a continuación. 1.5 1.5 1,9 2.0 2,1 2,1 2.3 2.4 2,5 2,5 2,6 4.1 2.7 2.8 2.9 3,0 3,1 3,1 3,2 3,2 3,2 3,2 3.3 3,3 3.3 3.4 3.4 3,5 3,6 3,6 3,7 3,7 3,9 4.1 FUENTE : Maternidad de Lima 22

Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos Cuando los datos pertenece a una variable cuantitativa continua, las clases C I Corresponde a intervalos de la forma [ a ; b > llamados intervalos de clases siendo a y b el límite inferior y superior respectivamente del intervalo de clase PROCEDIMIENTO PARA ELABORAR UNA TABLA DE FRECUENCIA PARA UNA MUESTRA DE TAMAÑO “n” a. Calculo de Rango “R” R = dato mayor – Datos Menor Para el cálculo de datos se tiene R= 4.1 – 1.5 = 2,6 b. Calculo del número de clase Para el cálculo del número de clase para una tabla de distribución de frecuencias se hará usando la regla de STURGES K = 1 +3.3 Log (n) K= 1 +3,.3 log 34 = 6.053 como el valor que toma K debe ser un numero entero , se usa el redondeo Simple k = 6 Observación.El redondeo simple significa, que si un numero tiene como primer decimal un número mayor o igual a 5 . Entonces la cifra entera del número se incrementa en una unidad. Ejemplo Si, k= 6.7 usando el redondeo simple k= 7 Si k = 6.4 usando el redondeo simple k = 6

c.-. CALCULO DEL ANCHO DEL INTERVALO DE CLASE ( C ) C= R K C= 2.6 = 0,4333 6 El valor que toma el (C ) debe de tener el mismo número de decimales de los datos originales y a la vez su valor debe tener un redondeo por exceso (incrementar en la unidad al último decimal ). Para determinar los intervalos de clase es como sigue:  El dato menor corresponde al límite inferior de la primera clase y para obtener el límite superior de esta primera clase se suma al límite inferior el valor del ( C )  El límite inferior del segundo, intervalo de clase , corresponde al límite superior del primer intervalo de clase y para obtener su límite superior , al límite inferior de esta clase se le añade el (C) y así sucesivamente hasta completar las “k” clases

23

Tabla de distribución de pesos (kg de recién nacidos registrados en la Maternidad de Lima . i 1 2 3 4 5 6

Pesos (kg) [1,5 -2,0 > [2,0 -2,5> [2,5-3,0> [3.0-3,5> [3,5-4,0> [4,0-4,5]

fi 3 5 6 12 6 2 34

hi 0,088 0,147 0,176 0,35 0,176 0,058 1.00

Fi 3 8 14 26 32 34

Hi 0,08 0,235 0,411 0,761 0,931 0,989

Xi 1,75 2,25 2,75 3,25 3,75 4,25

Hallar e interprete los siguientes valores : f3=6 (Significa que hay 6 recién nacidos que tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) h3=17.6% (Significa que el 17.6% de los recién nacidos tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) F3= 14 (Significa que hay 14 recién nacidos tienen un peso igual o mayor a 1.5 kg , pero menor a 3.0 kg) H3=41.10% (Significa que el 41.10% de los recién nacidos que tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) H3 – H2= 52.9% (Significa que el 52.9% de los recién nacidos que tienen un peso igual o mayor a 2.5 kg , pero menor a 3.5 kg) X´2=2.25 (Significa que 2.25 kg es el peso representativo para los recién nacidos que tienen un peso mayor o igual 2.0 kg , pero menor a 2.5 kg) 2. ¿Cuántos recién nacidos aproximadamente tienen un peso menor a 2.8 kg? Por interpolación lineal (utilizando la columna de las frecuencias absolutas Acumuladas) Límite superior Frecuencias acumuladas de los pesos absolutas (menor que) 2.5 2.8 3.0

8 (un peso menor a 2.5 kg se encuentran 8 recién nacidos x (un peso menor a 2.8kg se encuentran x recién nacidos) 14 (un peso menor que 3.0 kg se encuentran 14 recién nacidos

Utilizando la interpolación lineal (semejanza de triangulo) se tiene: 3.0 – 2.5 = 14 - 8 → x= 11.6 ≈12 (usando redondeo simple) 2.8 – 2.5 x – 8 Aproximadamente 12 recién nacidos tiene un peso menor a 2.8 kg 3. ¿Qué porcentaje de los recién nacidos tiene un peso inferior a 2.8 kg 24

Como 11.6 recién nacidos tienen un peso inferior a 2.8 kg, entonces → x = 11.6 → 11. 6 x 100% = 34.12% 34 Graficas Tiempo (min) fi hi Fi

F*i

Hi

2-4

3

0,10

3

30

0,10

4–6

6

0,20

9

27

0,30

6–8

12

0,40

21

21

0,70

8 – 10

7

0,23

28

9

0,93

10 – 12

2

0,07

30

2

1,00

Total

30

1,00

35 GRAFICA DE BARRAS 12 12 10

7

8 6

fi

6 4

3 2

2 0 02-Abr

4–6

6–8

8 – 10

10 – 12

GRAFICA DE LA OJIVA Para construir la Ojiva en el eje de la abscisa se colocan los intervalos de clase y en eje de la ordenada las frecuencias acumuladas absolutas o frecuencias acumuladas relativas. Por ejemplo la gráfica de la Ojiva para los pesos de los recién nacidos se obtiene de la siguiente manera , cero recién nacidos tiene un peso menor a 1.5 kg, 3 recién nacidos tiene un peso menor a 2 kg, 8 recién nacidos tienen un peso menor a 2.5kg , 14 recién nacidos tienen un peso menor a 3.0 kg, 26 recién nacidos tienen un peso menor a 3.5 kg, 32 recién nacidos tiene un peso menor a 4.0 kg. y 34 recién nacido tienen un peso

25

menor a 4,5 kg uniendo estos puntos se obtiene la curva creciente a la derecha llamada la Ojiva ( “Menor que “)

30 25

20

15

10

5 0 0

2

4

6

8

10

12

14

GRAFICA DE LA OJIVA ( “ MENOR QUE ” ) Supongamos que la variable en estudio es el tiempo ( minutos) que utiliza un usuario en realizar una transacción bancaria. Tiempo (min)

fi

hi

Fi

F*i

Hi

2-4

3

0,10

3

30

0,10

4–6

6

0,20

9

27

0,30

6–8

12

0,40

21

21

0,70

8 – 10

7

0,23

28

9

0,93

10 – 12

2

0,07

30

2

1,00

Total

30

1,00

26

30 25

20

15

10

5 0

0

2

4

6

8

10

12

14

GRAFICA DE LA CURVA ( MAYOR QUE)

27

TABLA QUE PROPORCIONA EL NUMERO DE CLASES PARA UN TAMAÑO DE MUESTRA DADO Tamaño de la

Numero de clases

muestra

K=1+3.3 Log (n)

20 a 23

5

24 a 46

6

47 a 93 94 a 187

7 8

188 a 376 377 a 756

9 10

757 a 1519

11

1520 a 3053

12

3054 a 6135

13

6136 a 12328

14

12329 a 24770

15

Nota-5 Otra metodología para determinar el ancho del intervalo de clase ( C ). 1. Determinación de rango R R= dato máximo-dato mínimo 2. Determinación de numero de clases K K= 1+ 3.3 log (n) 3. Determinación de ancho del intervalo de clase ( C ) C= R → Debe redondearse por defecto K El mismo número de decimales de los datos C redondearse por defecto casi siempre se comete error

i) 0 → El dato de arranque para la tabla= dato mínimo E= ( C) k-R ii) > 0 → El dato de arranque para la tabla =Dato mínimo _ E 2 iii) < 0 →El número de clases se incrementa en 1 y se sigue (i o ii)

28

Ejemplo La mayor y menor estatura de 50 personas es respectivamente 1.72 mts y 1.55 mts. Calcular el número de clases y su ancho para construir la tabla de distribución de frecuencias 1. Determinación de rango R= 1.72-1.55=0.17 2- Determinación de número de clases K= 1+3.3 log (50)= 6.6= 7 Redondeo por simple 3.-Determinacion de ancho de clase C= 0.17 = 0,0242 = 0.02 7 Al redondearse se comete error E= 0.02 * 7 – 0.17 = -0.03 Agregamos una nueva clase k= 8 C= 0.17 = 0.0212 = 0.02 E= 0,02 * 8 – 0,17 = - 0 , 01 Agregamos una nueva marca de clase k= 9 C= 0,17 = 0,0188 = 0,02 9 E = 0.02 * 9 -0.17 = 0.01 Dato de arranque =1.55 – 0.01 = 1.545 = 1.55 2 Los intervalos de clases para esta tabla son : Estaturas ( mts ) fi 1,55-1,57 1.57-1,59 1.59-1.61 1.61-1.63 1,63-1,65 1.65-1.67 1.67-1,69 1,69-1,71 1,71-1,73 Total 50 Si usamos la metodología anterior , los intervalos de clase para la tabla seria Estaturas ( mts ) 1,55-1,57 1.57-1,59 1.59-1.61 1.61-1.63 1,63-1,65 1.65-1.67 1.67-1,69

fi

29

1,69-1,71 1,71-1,73 Total

50

Se observa que las seis primeras clases contienen los datos , la 7ma clase carece de datos. Nota -6 No existe una formula única para determinar el número de clase (k) en la construcción de una tabla de distribución de frecuencias. Un número muy pequeño de clases tiende a ocultar la distribución real del conjunto de datos, mientras que un número muy grande puede dejar sin observaciones algunas de Las clases, limitando de esta forma su uso. La idea es tener un numero de clases de tal forma que todos los datos se encuentren en las clases formadas y además nos permite conocer la distribución empírica de los datos , Se sugiere que el número de ellos debe variar entre 5 y 15. NOTA-7 Para determinar el número de clases ( k) también se pueden usar otras fórmulas tales como : K= Log 2 ( n) K=√n NOTA-8 Para determinar el número de clases para la tabla el investigador puede utilizar algún criterio sostenido. 2.6 Ejercicios propuestos 1. Usando la tabla de distribución de frecuencia de los pesos de los recién nacidos a. ¿ Cuantos recién nacidos aproximadamente tienen un peso superior a 2.8 kg. b. ¿Cuántos recién nacidos aproximadamente tienen un peso entre 2.2kg y 3.4 kg c. ¿Cuál es el mínimo peso para que un recién nacido se encuentre considerado dentro del 20% de los que tienen pesos altos ? d. ¿ Cuál es el máximo peso para que un recién nacido se encuentre considerado dentro del 20% de los que tienen pesos bajos ? e. ¿ Qué porcentaje de los recién nacidos tienen un peso superior a 3.2 kg.? f. ¿ Qué pesos encierran al 80% central de los pesos de los recién nacidos ? g. Hallar el mínimo peso, para que un recién nacido este considerado dentro del 25% de los que tiene mayores pesos . h. Entre que valores se encuentra el 50% central de los pesos de los recién nacidos. i. Calcular el peso total aproximado de todos los recién nacidos j. Después de cierto tiempo, los que tenían un peso menor a 3 kg incrementan su peso en un 25% mas ¼ de kg. y los que tenían un peso mayor o igual a 3 kg. Se incrementan en un 5%. mas ¼ kg. Hallar el nuevo peso total aproximado de todos los recién nacidos . k. Suponiendo que los datos de la tabla presentan las siguientes transformaciones, los datos con un peso menor a 3 kg. Incrementándose en 30

un 12% y los datos con pesos superiores o iguales a 3 kg. Se incrementan en un 20% ambos con respecto a los pesos iniciales. ¿ Hallar el peso total después del incremento . 2.Una serie de 50 datos tiene como variable en estudio , los montos por venta en miles de nuevos soles, siendo el monto mínimo 85 y el monto mayor 129 Establecer las clases para la tabla. 3. Un conjunto de 50 datos, tiene como variable en estudios los pesos de cajas, Siendo el peso mínimo 43.43 Kg. y el peso máximo 68.15 kg. Establecer las Clases para la tabla. 4. Los datos que a continuación se presentan, corresponden a una muestra Aleatoria de 40 frascos conteniendo mermeladas de fresa , el objetivo es Estudiar su peso ( grs) 149 156 157 158 162

164 165 165 168 170

171 172 174 175 175

176 176 176 180 180

181 182 183 183 184

185 186 186 187 187

187 187 188 188 189

190 194 196 198 202

a. Elaborar la tabla de distribución de frecuencias y hacer los gráficos Correspondiente, histograma, polígono de frecuencia, y ojiva use la regla de STURGES. b. Hallar e interprete: H 5 – H 3 c. Usando la tabla de distribución de frecuencias, cual es el peso mínimo que debe tener un frasco, para estar considerado dentro del 15% de los de mayor peso. CAPITULO 3 INTRODUCCION En este capítulo se estudia las principales medidas de tendencia central o de posición, las cuales se definen como aquellos valores que representan al conjunto de datos de una variable en estudio. Se presenta el cálculo de las medidas de tendencia central para datos agrupados, y datos no agrupados , así como también sus propiedades 3.1 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION Son valores estadísticos calculados con los datos de la muestra o de la población y que tienden a ubicarse en el centro de la distribución de los datos. A estas medidas se les considera como valores representativos para el conjunto de datos Si estos valores son calculados usando todos los datos de la muestra, se les llama valores estadísticos, estadígrafos o estimados; en cambio sí son calculados usando todos los datos de la población, se les llama parámetros. Las medidas de tendencia central más usadas son: 1. La media aritmética, media o promedio 2. La media ponderada 3. La mediana 4, La moda 31

5. La media geométrica 6. La media armónica 3.2 LA MEDIA ARITMETICA Es un valor que tiende a ubicarse en el centro de la distribución de los datos, y es considerado un valor representativo para el conjunto de datos, cuando su distribución es simétrica o los datos presentan poca variabilidad. Su valor se calcula tanto para la muestra (valor estadístico) como para la población (parámetro) Cuando la medida aritmética se calcula utilizando datos que no se encuentran en una tabla de distribución de frecuencias, se dice que la media aritmética se obtuvo para datos sin agrupar, en caso contrario la media aritmética se obtuvo para datos agrupados. LA MEDIA ARIMÉTICA PARA LA POBLACION Sea X una variable en estudio que toma valores x1, x2, x3,….., xN , la media aritmética para la población se simboliza universalmente con la letra griega µ(se lee “mu”) y es igual a la sumatoria de todos los datos de la población divididos por el total de ellos N

x µ=

i 1

i

N

NOTA: El valor de la media aritmética para la población (parámetro) casi nunca se conoce, el objetivo es estimar su valor, a través de la media aritmética muestral. Ejemplo: Supongamos que se tienen todos los pesos en kg de 3.546 varones adultos de una empresa minera, siendo estos: 65.5 70.5 69.5 70.0 71.0 ……………68.5 Hallar su peso promedio e interprete 3546

x

µ=

i 1

i

3546

=

65.5  70.5  69.5  70  71  ...  68.5 = 68.2 kg 3.546

68.2 kg Es el peso promedio para todos los trabajadores de la empresa (parámetro) LA MEDIA ARIMÉTICA PARA LA MUESTRA Se X una variable en estudio que toma valores x 1, x2, x3,….., xn, la media aritmética para una muestra se simboliza universalmente con la letra x ( se lee x-barra) y su valor es igual a la sumatoria de todos los datos de la muestra divididos por el total de ellos n ∑ xi X = i=1 n Es la media aritmética para datos sin agrupar. Al valor de la media aritmética, también se le conoce como la media aritmética muestral) Ejemplo Los siguientes datos corresponden a los pesos (kg) , de 8 personas adultas de sexo varón: 60.5 68.5 58.5 70.5 70.0 68.5 72.0 71.0 Calcular e interpretar la media aritmética 32

n

x=

x

60.5  68.5  58.5  70.5  70  68.5  72  71 = 67.4 kg 6

i

i 1

=

6

Interpretación 67.4 kg es el peso promedio de 8 varones adultos, este valor representa a los pesos de los 8 varones; supongamos que los 8 varones adultos son elegidos al azar de una población de varones adultos, entonces se puede concluir que el peso promedio de los varones adultos en la población es de 67.4 kg PROPIEDADES DE LA MEDIA ARIMÉTICA MUESTRAL La media aritmética para la muestra, tiene las siguientes propiedades: 1. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética definimos a una desviación como la diferencia entre un dato x i de la muestra y su media aritmética x ; es decir: d i = xi - x Entonces la sumatoria de todos los valores d i es igual a cero; esto es n

d

2 i

i 1



n

=

 ( x  x)  0 i 1

i

2. La suma de los cuadrados de las desviaciones con respecto a la media aritmética, es siempre un valor mínimo; es decir n

d i 1

2 i



n

=  ( xi  x)2 es siempre un valor mínimo i 1

3. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética, sea la combinación lineal yi = axi ± b; entonces la media aritmética para variable Y es: Y =a

x

±b

4. Sea una muestra de tamaño “n” , dividida en “k” submuestra de tamaño n 1, n2…nk , y X1, X2,…,Xk , la media aritmética de cada submuestra; entonces la media aritmética de la muestra se calcula por: k

x=

 x f i 1

i

i

n A esta medida se le conoce como la media ponderada LA MEDIA ARIMETICA PARA DATOS AGRUPADOS Cuando los datos se encuentran en una tabla de distribución de frecuencias la media aritmética se calcula de la siguiente fórmula n

x =  xi fi , i 1

Donde: K= número de clases

xi = Marca de clase i-ésima clase (corresponde a la ponderación)

fi= Frecuencia absoluta de la i-ésima clase 33

Otra fórmula que se puede utilizar para calcular la media arimetica para datos agrupados, es en función de las frecuencias relativas n

x =  xi fi i 1

Nota: Las propiedades de la media aritmética para datos sin agrupar, se cumplen también para datos agrupados. Ejemplo Sea la tabla para los datos agrupados de los pesos (kg) de los recién nacido. Hallar e interpretar la media aritmética: i pesos fi hi Fi Hi i

x

1

[1.5 -2.0

3

0.08

3

8.80%

1.75

2

[2.0-2.5

5

0.14

8

23.50%

2.25

3

[2.5-3.0

6

0.18

14

41.10%

2.75

4

[3.0-3.5

12

0.35

26

76.40%

3.25

5

[3.5-4.0

6

0.18

32

94.00%

3.75

6

[4.0-4.5]

2

0.05

34

100.0%

4.25

TOTAL

34

k

x=

 x f i 1

i

i

=

1.75*3  2.25*5  ...  4.25* 2 103   3.029kg 34 34

n Interpretación: 3.029kg es el peso promedio representativo para los recién nacidos de la maternidad de Lima VENTAJAS Y DESVENTAJAS DE LA MEDIA ARIMÉTICA VENTAJAS a. Es fácil de calcular e interpretar su valor b. La suma de las desviaciones es cero c. La suma de las desviaciones al cuadrado siempre es mínima DESVENTAJAS a. Su valor se encuentra afectado por datos extremos (datos muy altos o datos muy bajo de lo común); es decir estos datos tienden a alterar su valor b. Deja de ser un valor representativo para la muestra cuando los datos presentan mucha variabilidad. c. No se puede calcular en tabla con extremos abiertos d. Para datos con distribución asimétrica, no debe usarse como medida 34

representativa 3.3 LA MEDIA PONDERADA Sea X una variable en estudio que toma los valores x 1, x2, ,….., xn y sea los pesos o ponderaciones asociada a cada valor de la variable w 1, w2, ,….., wn: la media ponderada es definida como: n

xp 

w x i 1 n

i i

w i 1

1

Ejemplo: En una empresa compuesta por 300 trabajadores, el ingreso mensual es como sigue: 250 de ellos son obreros y ganan S/. 850.00; 40 trabajan en la administración y ganan /. 950.00 y el resto son profesionales y ganan S/. 1,500.00 . Hallar e interpretar el ingreso promedio para los trabajadores de la empresa el enunciado presentado en la tabla; i

Trabajadores

Sueldo (xi)

Obreros

Ponderación (wi) 250

1 2

Administrativos

40

950.00

3

Profesionales

10

1500.00

total

300

850.00

3

xp 

w x i 1 3

i i

w i 1

=

1

250(850.00)  40(950.00)  10(1500) = S/. 885.00 250  40  10 Interpretación: S/. 885.00, es el ingreso promedio para los trabajadores de la empresa. 3.4 LA MEDIANA Es una medida de tendencia central que divide al conjunto de datos en dos partes iguales; es decir el 50% de los datos tendrán valores menores o iguales al valor de la mediana y el otro 50% de los datos con valores superiores al valor de la mediana. Al igual que la media aritmética el valor de la mediana se calcula para datos sin agrupar y para datos agrupados en tabla de distribución de frecuencias CALCULO DE LA MEDIANA PARA DATOS SIN AGRUPAR Sea X una variable en estudio que toma los valores X 1, X2 , ….; Xn, para calcular el valor de la mediana se ordenan los datos en magnitud en forma ascendente o 35

descendente, para calcular la mediana debemos tener en cuenta si el número de datos es par o impar; es decir: Si es impar la mediana es el termino central después de ordenar de menor a mayor Ejemplo 1.3 ; 2; 9; 5; 6 Solución 2, 3, 5 , 6. 9 La Me = 5 Si es par . ordenamos de menor a mayor y es la semisuma de los datos centrales Ejemplo 2.5; 3; 1; 6; 7; 2; 9, 8 Solución 1, 2, 3 ,5 ,6, 7, 8, 9, Me= 5 + 6 = 5.5 2 Donde: X(j)= valor que toma la variable X en la posición “j” El valor de la mediana es útil como medida representativa para el conjunto de datos, cuando estos no tienen un comportamiento homogéneo Ejemplo-3 La cantidad de usuarios que concurren a un centro de información durante la semana es: 230 220 250 228 240 1200 Hallar el valor de la mediana de la concurrencia de usuarios Ordenando los datos en forma ascendente 220 228 230 240 250 1200 Me = 230+240 = 235 2 Interpretación: El 50% de las cantidades de usuarios que concurren al centro de información durante los días de la semana es menor o igual a 235, y el otro 50% de las cantidades es superior a 235 usuarios Ejemplo-4 Sea la serie de datos: 5, 3, 2, 1, 2, 5, 4, 3, Hallar la mediana Ordenando los datos en forma ascendente: 1, 2, 2, 3, 3, 4, 5, 5 x4  x5

Como n=8 (número de datos par), entonces: me = 2  2  3 Interpretación: El 50% de los datos son menores o iguales a 3 y el otro 50% son superiores a 3 Ejemplo-5 Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 personas adultas 1.71 1.69 1.72 1.69 1.68 1.70 1.73 Ordenando las estaturas: 1.68 1.69 1.69 1.70 1.71 1.72 1.73 33

36

me  x( 71 ) = x4  1.70 2

Como n=7, entonces:

Interpretación: El 50% de los Cadetes tienen estaturas menor o iguales a 1.70 mts. Y el otro 50% de los Cadetes tienen estaturas superiores a 1.70 mts CALCULO DE LA MEDIANA PARALOS DATOS AGRUPADOS PARA UNA VARIABLE CUANTITATIVA DISCRETA Y CONTINUA PARA UNA VARIABLE CUANTITATIVA DISCRETA Ejemplo: En la siguiente tabla de distribución de frecuencias, la variable en estudio X corresponde al número de balones de gas vendidos diariamente por 50 tiendas. Hallar el valor de la mediana del número de balones de gas vendidos diariamente i

X

fi

1

22

9

2

23

10

3

21

6

4

25

7

5

26

5

6

24 TOTAL

13 50

Ordenando los valores que toma la variable X, y obtenemos el valor de las frecuencias absolutas acumuladas

i

X

fi

Fi

1

21

6

6

2

22

9

15

3

23

10

4

24

13

38  x26  x38 

5

25

7

45

6

26

5 50

50

TOTAL

38  x26  x38 

n= 50 ( par) me = x 25 + x 26 = 23 + 24 = 23.5 37

2

2

Interpretación : El 50% de las tiendas tienen una venta diaria menor o igual a 23,5 balones de gas, y el otro 50% de las tiendas tienen una venta diaria mayor a 23,5 balones de gas.

PARA UNA VARIABLE CUANTITATIVA CONTINUA Cuando los datos se presentan en un tabla de distribución de frecuencias, para una variable continua, el valor de la mediana se calcula haciendo uso de la fórmula : N - F i-1 Me = Li + 2 x C fi Donde : Li = Límite inferior de la clase que contiene al valor de la mediana F i-1 = Frecuencia acumulada absoluta de la clase anterior a la clase que Contiene a la mediana f i = Frecuencia absoluta de la clase que contiene a la mediana C = Ancho del intervalo de clase . Para ubicar la clase que contiene el valor de la mediana se busca en la columna de la frecuencias acumuladas absolutas o frecuencias acumuladas relativas ( F i o Hi ) el primer valor que supera a la mitad del número de datos 0 el 50% de los mismos , es decir, F i ≥ n 0 Hi ≥ 0.5 2 Ejemplo -6 Hallar e interprete el valor de la mediana para la tabla de datos agrupados de los recién nacidos . i 1 2 3 4 5 6

pesos [1.5 -2.0> [2.0-2.5> [2.5-3.0> [3.0-3.5> [3.5-4.0> [4.0-4.5]

fi 3 5 6 12 6 2 34

hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00

Fi 3 8 14 26 32 34

Hi 0.088 0,235 0,411 0,763 0,939 0,997 100%

Xi 1,75 2.25 2,75 3,25 3,75 4,25

n= 34 → n = 17 ≤ F i → i = 4 2

N - F i-1 Me = Li + 2

xC 38

fi Me = 3 + 17-14 x 0,5 = 3,125 Kg. 12 Interpretación : El 50% de los recién nacidos tienen pesos menores a iguales a 3,125 kg. y el otro 50% de los recién nacidos tienen pesos superiores a 3,125 kg

VENTAJAS Y DESVENTAJAS DE LA MEDIANA VENTAJAS .1. Es fácil de calcular e interprete su valor 2. Se realizan manipulaciones algebraicas 3. Su valor no se encuentra afectado por datos extremos 4. Se puede calcular en tablas de distribución de frecuencias con extremos abiertos DESVENTAJAS La suma de los cuadrados de las desviación es con respecto a la mediana no es mínima, en comparación con la media aritmética. PROPIEDADPES DE LA MEDIANA PARA UN CONJUNTO DE DATOS TRANSFORMADOS Sea x x 2 x3 ……..xn una muestra de tamaño “n” y me, el valor de la mediana , sea la combinación lineal yi = ax i+ b , entonces el nuevo valor de la mediana para la variable Y es : m ey = am ex + b siendo : a y b constante

Ejemplo -1 Un conjunto de 20 datos tiene por median 24 , si al conjunto de datos se le incrementa en un 15% mas 3 unidades Hallar el nuevo valor de la mediana . Sea el x, valor del i-esimo dato, por el enunciado del problema el valor del iesimo dato transformado es y k= 1,15x k + 3 y por la propiedad de la mediana su nuevo valor es : Me ey = 1.15(24) + 3 = 30.6

39

Ejemplo-2 Sea la tabla de distribución de frecuencias EDAD [18-22> [22-26> [26-30> [30-34> [34-38] TOTAL

fi 4 13 19 12 5 53

Fi 4 17 36 48 53

Yi 20 24 28 32 36

De la tabla, si las edades de las 53 personas se incrementan en un 12% mas 2 años , calcular el nuevo valor de la mediana . De la tabla calculamos el valor de la mediana

Me = 26 + 26.5 – 17 x 4 = 28 19 Sea el x I valor de la i-esima marca de clase para la tabla, por el enunciado del problema el valor de la i-esima marca de clase transformada es y i= 1.12 x i + 2 y por la propiedad de la mediana, su Nuevo valor es : Me = 1.1 m + 2 = 1.12(28) + 2 = 33.36 3.5 LA MODA Sea x una variable en estudio que toma los valores x 1 , x2 ………xn la moda, es aquel valor de la variable que se presenta con mayor frecuencia, se representa por ( Mo ) = es decir : mO = valor que toma la variable para la máxima frequencia ( f i ) El valor de la moda se interpreta, como el valor más frecuente para el conjunto de datos de una muestra o población .

El valor de la moda puede o no existir, Si un conjunto de datos tiene una sola moda a su distribución se le llama unimodal, si tiene dos modas se le llama bimodal y para más modas multimodal DATOS NO AGRUPADOS Ejemplo-1 Hallar la moda para el conjunto de datos : 12 , 16, 18, 18, 18, 20, 20, 20, 20, 20 , 20 , 24

40

El dato que se repite con mayor frecuencia es el valor 20, luego la moda es 20 . Ejemplo -2 Calcular la moda para la serie de datos 1, 1, 2, 3, 3, 4, 7 Los datos que se repiten con igual frecuencia son el 1, y 3 , luego la distribución tiene dos modas 1, y 3 bimodal Ejemplo -3 Calcular la moda para el conjunto de datos : 4 , 2, 3, 7, 5, 9 Como no existe ningún dato que se repite más de una vez, luego el conjunto de datos no tiene moda . ( amodal ) Ejemplo – 4 Una tienda vende durante el día tres tipos de conservas, 120 frascos con fresa, 40 frasco con mango y 50 frasco con piña, calcular la moda. En este ejemplo la variable en estudio es tipo de conservas vendidas, luego los frascos con fresa registraron la mayor venta, por lo tanto el frasco con fresa corresponden a la moda . CALCULO DE LA MODA PARA DATOS AGRUPADOS Cuando los datos se encuentran en una tabla de distribución de frecuencias la fórmula para calcular la moda es :

Mo = Li +

d1 x C d1 + d2

Donde : Li = Límite inferior de la clase que contiene al valor de la moda d 1 = f i– f i - 1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior . d 2= f i– f i + 1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente. La clase modal corresponde a la clase de mayor frecuencia absoluta Ejemplo

41

De la tabla de distribución de frecuencia, en la cual se analiza los pesos de los recién nacidos, Hallar e interprete el valor de la moda .

i 1 2 3 4 5 6

pesos 1.5 2.0 2.0-2.5 2.4-3.0 3.0-3.5 3.5-4.0 4.0-4.5

fi 3 5 6 12 6 2 34

hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00

Fi 3 8 14 26 32 34

Hi 0.088 0,235 0,411 0,763 0,939 0,997

Xi 1,75 2.25 2,75 3,25 3,75 4,25

El valor de la moda se encuentra en la 4ta clase, por presentar la máxima frecuencia absoluta, en este caso las distribución es unimodal para esta muestra, luego i = 4

d 1 = f i– f i - 1 = f 4– f 5 = 12 – 6 = 6 d 2= f i– f i + 1 = f4 – f 5 = 12- 6 = 6

Mo = Li +

d1 x A = M 0 = 3 + 6 , 05 = 3.25 kg d1 + d2 6+6

Interpretación : 3.25 kg. Es el peso más frecuente para los recién nacidos. PROPIEDADES DE LA MODA PARA DATOS TRANSFORMADOS Sea x1 x 2 x 3 …………….x una muestra de tamaño “n” y m 0 , el valor de la moda, sea la combinación lineal y i = ax i + b ,entonces el nuevo valor de la moda para la variable Y es : M0 = am0 + b Siendo a y b constantes. 3. LA MEDIA ARMONICA Se utiliza para promediar razones que tienen dimensiones físicas, tales como km/hora promediar el costo medio de artículos comprados con una cantidad fija de dinero, La media armónica para n valores mayor a cero y positivos , se define como el reciproco de la media aritmética de los reciproco de los datos.

Xa =

n 1 + 1 + ….. + 1 42

X1 x2

xn

Para datos agrupados Xa =

n f 1 f 2 + ………+f k x1 x2 xk

Siendo : x I = valor de la i-esima marca de clase f i = valor de la frecuencia absoluta de la i-esima clase k

n= ∑ f i i=1 Ejemplo – 1 Tres vehículos recorren cierto tramo de una autopista con las siguientes velocidades : 90 km/hora , 110 km/ hora y 140 km/hora .Hallar la velocidad media.

Xa =

3 = 109.7097 km/hora 1 + 1 + 1 90 110 140

Ejemplo – 2 Una persona concurre a tres mercados para consultar el precio de un artículo “M” llevando consigo la suma 24 nuevos soles. En el primer mercado pude comprar 4 artículos ”M” , 5 artículos ”M” en el segundo y 6 artículos “M” en el tercero .Hallar el precio promedio del artículo “M” en los tres mercados .

Xa=

3 1 + 1 + 6 4.8

= s/ 4.8 1 4

Ejemplo -3 Un representante del INEI , con la misma cantidad de dinero, compra en diferentes establecimientos cantidades de un mismo artículo , tal como se muestra en la tabla siguiente. Hallar el precio promedio del artículo en los diferentes lugares

43

Dinero

Cantidad de Articulo comprado 10 8 14

20 20 20

X a=

Precio unitario por articulo 2 2.5 1.42857

3 = 1. 875 1 + 1 + 1 2 2.5 1,42857

3.8 Ejercicios Propuestos 1. Los siguientes datos corresponden a pesos ( kg) de 20 alumnos 50.5 54.5 52.4 51.4 52.5 62.5

54.5 55.0 61.5 61.0 60.0 50.5 50.0 50.5 52.5 58.5

62.0 64.2

58.5 50.5

a. Hallar e interpretar la media aritmética, mediana y moda b. Si los pesos de los alumnos , se incrementan en un 15% mas ¾ kg Hallar el nuevo peso promedio y el peso mediano. 2. La siguiente tabla de distribución de frecuencia proporciona los montos por venta en cientos de nuevos soles de un grifo.

Montos por ventas f1

[10-15>

[15-20>

[20-25>

[25-30>

[30-35>

[35-40

12

15

20

25

12

8

a. Hallar e interprete la media aritmética, mediana y moda b. Si los montos por venta se incrementan en 12% Hallar el monto promedio y el monto mediano 3.- La tabla de distribución de frecuencias, tiene como variable en estudio las estaturas ( mts) de 50 alumnos .

Estatura (mts) 1.67-1.69 1.69-1.71 1.71-1.73 1.73-1.75

fi

hi

Fi

Hi

Xi

5 9 12 10 44

1.75-1.77 1.77-1.79 total

9 5 50

Calcula e interprete : a. f 3 , h 5 , F 3 , H 5 , H 5 – H 2 x i b. Qué porcentaje de alumnos, tienen una estatura inferior a 1.73 mts c. Qué porcentaje de alumnos, tienen una estatura superior a 1.75 mts d. Qué porcentaje de alumnos , tienen una estatura entre 1.69 y 1.77 mts e. La estatura media , mediana y modal de los alumnos f. Qué porcentaje de alumnos, tienen una estatura entre 1.70 y 1.76 mt g. Qué porcentaje de alumnos , tienen una estatura menor al promedio h. Que cantidad aproximadamente de alumnos , tienen una estatura superior a 1.74 mts i. Que cantidad aproximadamente de alumnos , tienen una estatura inferior a 1.74 mts j. Cuál es la máxima estatura para que un alumnos , se encuentre considerado dentro de 20% de los que tienen estaturas menores k. Cuál es la mínima estatura para que un alumno , se encuentre considerado dentro de 20% de los que tienen estaturas mayores 4. El promedio de 10 calificaciones del curso de estadística en un salón de clase es de 9.8 , pero al ingresar los datos a la computadora en lugar de digitar, 14 dígitos se digita 4, y en lugar de digitar 8 dígitos se digita 12 Calcular la nueva nota promedio con esta corrección.

3.9 OTRAS MEDIAS DE POSICION PERCENTIL PARA DATOS NO AGRUPADOS Son valores que divide al conjunto de datos ordenados ascendentemente en 100 partes iguales, la fórmula para calcular los percentiles es : P j = X ( n+1) = X i + a( x i+1 – x I ) 0 < j < 1

( a)

J= 0.01 . 0,02 . 0,03, 0,04 , …….. 0,99 Siendo P j = valor que divide a un conjunto ”n” datos, ordenados de tal manera que el 100 j % son menores o iguales que el valor del percentil PJ y 100 ( 1- J ) % mayores que el percentil P j. X i = valor del dato en la posición del entero menor ( n+1) j “a” = decimal del número ( n+1) j

45

CUARTILES Q j PARA DATOS SIN AGRUPÀR Son valores que divide al conjunto de datos ordenados ascendente en 4 partes Iguales , en la formula ( a) j forma los siguientes valores . J= 0.25 ; 0.5 ; 0.75

DECILES ( D j) PARA DATOS SIN AGRUPAR Son los valores que divide al conjunto de datos ordenados ascendentemente en 10 partes iguales , en la formula ( a ) , j toma los siguientes valores. J = 0,1 , 0,2 , 0,3 .0,4 , 0,5 , 0,6 , 0, 7, 0,8 , 0,9

Ejemplo:

1 2 3 4

569 01134556789 011222233344566779 11

Siendo la unidad de hoja = 0.1 n= 34

CALCULO DE PERCEN TILES P J PARA DATOS AGRUPADOS La fórmula es : nj – Fi-1 x C PJ =Li+ fi

J= 0,,01 , 0,02,0,03, 0,04 …….. 0,99

Nota: La primera frecuencia acumulada absoluta o frecuencia acumulada relativa que sea superior a nj o j % será la clase que contiene al percentil Pj L i = Límite inferior de la clase que contiene al percentil P j = Valor del percentil que acumula el j % C = Ancho de clase 46

F I-1 = Frecuencia absoluta acumulada de la clase anterior a la clase que contiene al valor del percentil f i = Frecuencia absoluta de la clase que contienen al valor del percentil

para los Cuartiles será:

Q = L i+

nj – F i-1 x C fi

J= 0.25. 0.5 . 0.75

Para los deciles será : Dj = L i + nj- F i-1 x C fi

J= 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8 , 0,9

Ejemplo La tabla de distribución de frecuencias agrupan las edades ( años) de los usuarios que concurren a un centro de información : Calcular el 1er cuartil, 3er cuartil , 4to cuartil y el 65 avo percentil Edades de usuarios [18.5-22.5> [22.5-26.5> [26.5-30.5> [30.5-34.5> [34.5-38.5> [38.5-42.5> [42.5-47.5] Total

fi

Fi

5 9 12 20 13 10 4 73

5 14 26 46 59 69 73

Calculo del 1er cuartil nj = 73 * 0,25 = 18.25 → Fi > 18.25 → i =3 clase Q 0.25 = L 3 nj – F 3-1 x C = 26.5 + 18.25-14 x 4 = 27.92 años f3 12 47

Calculo del 3er cuartil Nj = 73 * 0.75 = 54.75 → Fi > 54.75 →i = 5 clase Q 0.75 = L 5 + nj – F 5-1 f5

xC

= 34.5+ 54.75 – 46 x 4 = 37.19 años 13

Interpretación : El 75% de los usuarios tienen edades menores o iguales a 37.19 años y el otro 25% de los usuarios tienen edades superiores a 37.192 años

Calculo del 4to decil

nj = 73 * 0.40 = 29.2 → F I > 29.2 → i = 4 clase D 0.4 = L 4 + nj – F 4-1 x C = 30.5 + 29.2-26 x 4 = 31.14 años f4 20 Interpretación El 10% de los usuarios tienen edades menores o iguales a 31.14 años y el otro 60% de los usuarios tienen edades superiores a 31.14 años

Calculo del 65 avo percentil nj = 73 * 0.65 = 47.45 → F I > 47.45 →i = 5 clase

P 0.65 = L 5 + nj – F 5-1 x C = 34.5 + 47.45 -46 X 4 = 34.95 años f5 13 Interpretación El 65% de los usuarios tienen edades menores o iguales a 34.95 años y el otro 35% de los usuarios tienen edades superiores a 34.95 años .

48

CAPITULO 4 MEDIDAS DE VARIABILIDAD o DISPERSION INTRODUCCION En este capítulo se estudiaran las medias estadísticas de variabilidad o dispersión para un conjunto de datos. Son valores que miden que tan homogéneas o heterogéneas son los datos, si los datos fuesen iguales, se dice que no existe variabilidad o dispersión entre ellos, en caso contrario se dice que los datos presentan dispersión o variabilidad. El estudio de la variabilidad de un conjunto de datos es de suma importancia en todo análisis estadístico ya que esto depende el grado de confiabilidad de las estadísticas que se formulen. Las medidas de variabilidad o dispersión se clasifican en : MEDIAS DE VARIABILIDAD ABSOLUTAS Cuando el valor de esta medias esta expresado en la misma unida de media de los datos originales. Ejemplo: 1. Rango 2. Varianza 3. Desviación estándar MEDIDAS DE VARIABILIDAD RELATIVA Cuando el valor de estas medidas carece de unida de media coeficiente de variación o variabilidad. 4.1 EL RANGO El rango es una medida ( distancia ) a través de la cual se distribuyen todos los datos de la muestra o población .Se calcula por la diferencia entre el dato mayor y dato menor. Para datos sin agrupar: Rango = dato mayor – dato menor Para datos agrupados: Rango = LS –Li Dónde:

LS = límite superior de la última clase LI = límite inferior de la primer clase Ejemplo Sean los montos por ventas de una tienda comercial expresada en nuevos 49

soles

1500 2300

2300 1000

1800 2000 1500 2400 1200 2400 2500 1800

De acuerdo a la definición el rango es: Rango = R= 2500 -1000 = 1500 Nos indica que a una distancia de 1500 se distribuyen los montos por ventas, el rango es una medida de dispersión de primera vista para la variabilidad de los datos, pero no evalúa el grado de variabilidad de los datos intermedios. NOTA Si todos los datos fuesen iguales el rango es cero, nos indica que todos los datos se concentran en un mismo punto .Si el rango es diferente de cero nos indica que los datos no se concentran en un mismo punto, es decir existe variabilidad o dispersión. El rango puede ser positivo, negativo o cero El rango posee unidad de medida, que es la misma de los datos originales El rango es bien sensible a la presencia de datos extremos ( datos muy altos o datos muy bajo de lo normal ) MEDIDAS DE DISPERSION.- Son estadígrafos que cuantifican el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio de la distribución y son necesarias para verificar la confiabilidad de los promedios . Que sirven como base para el control de la variación de la misma CARACTERISTICAS.- Si se desea exactitud estadística en un estudio se debe aplicar los estadígrafos de acuerdo al siguiente orden : 1º Desviación estándar 2º Desviación Media 3º Rango La desviación estándar.- Es el más importante y de mayor uso, un valor grande de ella significa que la mayoría de los datos están concentrados en la proximidad de la Media Aritmética.

4.2.-DESVIACION MEDIA ( DM) Se define como el promedio de las desviaciones o diferencias de cada observación con respecto a la media . Estas diferencias son formadas en valor absoluto para que al sumarlas no se eliminen entre si. La suma obtenida se divide entre el número de 50

elementos de la distribución 4.2.1 DESVIACION MEDIA PARA DATOS NO AGRUPADOS DM= ∑ │ x i - x │ N 4.2.2 DESVIACION MEDIA PARA DATOS AGRUPADOS DM= ∑ │ x i - x │ f i N a) Desviación Media (DM) = │ x i – x │ n PROCESO: 1. Se obtiene la Media Aritmética para datos simples o no agrupados. X=∑ xi n

= 23+20+21+19+18 = 20.2 años 5 2. Construimos la siguiente tabla : Edad ( x ) X -x x-x 23 20 21 19 18 ∑

23-20.2=2.8 20-20.2=-0.2 21-20.2=0.8 19-20.2=-1.2 18-20.2=-2.2

2.8 0.2 0,8 1.2 2.2 7.2

3. Calculamos la Desviación Media :DM = 7.2 = 1. 44 años 5 INTERPRETACION: La edad de los alumnos de Integridad –PNP con respecto a su Media aritmética tiene una dispersión de 1.44 años.

PROCESO : 1) Se calcula la Media aritmética que en este caso es igual a 20.2 años 2) ∑xi2 = 232 +20 2 + 21 2 + 19 2 +18 2 = 529 +400+441 +361 +324 = 2055 3) La varianza será: S 2 = ∑ x i 2 – n ( x) 2 = 2055 -5 (20.2)2 =2055-2040.2 =3.7 años n-1 4 4 NO TIENE INTERPRETACION PRACTICA , solo se calcula para poder 51

determinar la desviación estándar. 5. VARIANZA ( s 2 ) .- Su valor corresponde al promedio de las desviaciones al cuadrado de los datos con respecto a la media aritmética . Es decir su valor da una idea del grado de dispersión de los datos con respecto a la media aritmética . La varianza para un conjunto de datos esta expresada en unidades Cuadráticas. Por ejemplo , si la unidad de medida de los datos es kilogramos, la varianza será expresada en kilogramos al cuadrado .Este hecho dificulta la interpretación de la varianza . VARIANZA PARA DATOS NO AGRUPADOS S 2 = ∑ │ x i - x │2 n- 1 VARIANZA PARA DATOS AGRUPADOS

S 2 = ∑ fi ( x i - x )2 f i n-1 nota.- 1 Si los datos fuesen todos iguales la varianza es cero, esto nos indica que todos los datos están concentrados en la media, en otras palabras no existe variabilidad con respecto a la media aritmética . Si los datos son diferentes de acuerdo a la definición el valor de la varianza Será mayor que cero, en otras palabras existe variabilidad entre los datos con respecto a la media aritmética nota.- 2 Es riesgoso usar el valor de la varianza para concluir que los datos de la muestra son muy o poco variable .Su uso es más que todo para comparar la variabilidad entre dos o más conjuntos de datos que analiza la misma variable

Ejemplo -1 Sea una muestra aleatoria de los pesos kg de 15 alumnos de un salón de Clase Hallar la varianza

52

35.5 36.0

37.5 35.0

38.0 35.0

38.0 36.5

39.0 38.5

37.0 38.0

36.8 38.0

35.8

X = 518.8 = 36,9 14 S 2 = 1.96+0.36+1,21+4,41+0,01+0,01+1,21+0,81+3,61+3,61+0,16+2,56+1,21+1,21 = 22.3 14 14 S2 = 22.3 = 1.592857 Kg. 14 1,592857 este valor nos indica la presencia de variabilidad de los pesos de los alumnos con respecto al peso promedio. Ejemplo -2 fy 5,25 11.25 16,5 39 22.5 8,5 103

(x-x)2 .f (1,75-3.02)2,3 = 4.8 (2.25-3.02 )2 .5= 2,96 (2,75-3.02)2 . 6= 0.437 (3,25-3.02)2 12=0,63 (3,75-3.02)2 6= 3.19 (4,25-3.02)2 2= 3.02 15.037

pesos 1.5 2.0 2.0-2.5 2.4-3.0 3.0-3.5 3.5-4.0 4.0-4.5

fi 3 5 6 12 6 2 34

hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00

Fi 3 8 14 26 32 34

Hi 0.088 0,235 0,411 0,763 0,939 0,997 100%

Yi 1,75 2.25 2,75 3,25 3,75 4,25

X= 103 = 3.029 34

S2

= 15,037 = 0.442264 34

S2 = 0.44 kg. 0.44 kg. es la desviación promedio en kg 2 con respecto al peso promedio , este valor nos indica la presencia de variabilidad entre los pesos con respecto al peso promedio en kg 2 . 5.2 PROPIEDADES DE LA VARIANZA 1. Si los datos de la muestra son iguales , es decir los valores que toma los 53

datos es constante, entonces su varianza o variabilidad es igual a cero, es decir : x 1 = x 2 = ……….x 4 = ….= x n = m → S 2 = 0 2. Cuando a todos los datos de la muestra , se le multiplica por una constante “a” y además se le suma o resta otra constante “b” , entonces la varianza de los datos transformados, es igual a la primera constante al cuadrado multiplicado por la varianza de los datos originales . x 1 = x 2 = ……….x 4 = x → S 2 , sea la transformación y i = ax +b , luego se cumple que la varianza de los datos trasformados es igual a : S2 =a2 S2 y

x

5.3 DESVIACION ESTANDAR Su valor, se define como la raíz cuadrada positiva de la varianza , es decir S x= Varianza El valor de la desviación estándar para un conjunto de datos esta expresado en la mismas unidades de la variable en estudio. Características: 1. Cuando mayor es la dispersión alrededor de la media, tanto mayor es el valor de la D.S. 2. Las desviaciones extremas con respecto a la media pesan mucho más en Cuanto a determinar el valor de la D.S. Ejemplo : De los ejemplos anteriores se tiene : Para datos sin agrupar : S x=

1.67638 kg2 = 1.29475 kg

Para datos agrupados :

S x=

0,45744 kg = 0.676344 kg 2

54

Interpretación 1.29475 kg, es la desviación promedio con respecto a la media aritmética 0.676344 kg. es la desviación promedio con respecto a la media aritmética ambos valores obtenidos nos indica la presencia de variabilidad de los datos con respecto a la media. NOTA -1 La desviación estándar al igual que la variancia, se utiliza para comparar la variabilidad o el grado de dispersión de dos o más conjunto de datos que poseen la misma unidad de medida y tienen sus promedios similares; es decir si se tiene dos o más conjunto de datos que poseen la misma unidad de medida y promedio similares, tendrá mayor dispersión o mayor variabilidad con respecto a la media aritmética aquel conjunto de datos que tienen la mayor variancia o desviación estándar Ejemplo De la tabla que conjunto de datos son más variables o están más dispersos Muestras

Datos

Media Aritmética

Variancia

Desviación estándar

1 2

4, 5, 6 1, 5, 9

5 5

1 16

1 4

DESVIACION ESTANDAR ( DS o S) = ( S 2 ) S=

√S2 =

√ 3.7 = 1.92 = 2 años

INTERPRETACION.- La edad de los alumnos de Integridad -PNP, se dispersan respecto al valor central en aproximadamente 2 años . 5.4 COEFICIENTE DE VARIACION Es una medida de variación relativa no tiene unidad de medida se calcula haciendo uso se la siguiente fórmula El coeficiente de la Desviación Estándar y la Media Aritmética, expresado en porcentaje. Se calcula │ S CV=

x100% 55

X El CV ; indica el número de veces que la desviación estándar contiene a la media aritmética. Su valor se usa para comparar la variabilidad entre dos o más conjuntos de datos que poseen diferentes unidades de medidas y medias aritméticas diferentes Sean A y B dos conjuntos de datos si el coeficiente de variación para el conjunto A es mayor a el coeficiente de variación para B, entonces los datos de A presentan mayor variabilidad o dispersión relativa que los datos de B. INTERPRETACION.- Como el coeficiente de variación porcentual CV% si es menor que el 30% , entonces la media es una medida representativa del conjunto de datos . Ejemplo para DATOS AGRUPADOS: Considerando el ejemplo anterior sobre el peso de los alumnos calcularemos las medias de dispersión y para ello se tiene la tabla antes construida I.C Xi fi Fi hi Hi L.R. [53.0-58.0> 55.5 4 4 0.17 0.17 (52.95-58.05) [58.1-63.1> 60.6 4 8 0.17 0.34 (58.05-63.15) [63.2-68.2> 65.7 2 10 0.09 0.43 (63.15-68.25) [68.3-73.3> 70.8 10 20 0.44 0.87 (68.25-73.35) [73.4-78.4] 75.9 3 23 0.13 1. (73.35-78.45) ∑ 23 1.00 De la tabla vamos a tomar las partes que necesitamos para nuestros cálculos y agregamos tres columnas adicionales fi(xi-x)2 4(23.21)=49284

I.C 53.-58.0

xi 55,5

fi 4

xi.fi 222.0

4(36) = 144.00

58.1-63.1

60.6

4

242.4

2(0.8 )= 1.62

63.2-68.2

65.7

2

131.4

10(17.69)=176.4 0 3(86,44)=259.47

68.3-73.3

70.8

10

708.0

73.4-78.4

75.9

3

227.7

23

1531. 5

Xi 2 3080.2 5 3672.3 6 4316.4 9 5012.6 4 5760.8 1

fi.xi 2 12321.00

(xi-x)fi 11.1.4=44.4

f(x-x)2 4(-11-1)2

14689.44

6.0x4=24.0

4(-6) 2

8632.98

0.9x2=1.8

2(-0.9)2

50126.40

4.2x10=42.0

10(4.2)2

17282.43

9.3x3=27.9

3(93)2

103052.25

140.1

PROCESO 1. Se calcula el producto fi.xi= ( 55,5) ( 4) = 222 etc . Para con la suma hallar la Media Aritmética .Este valor ya lo tenemos calculado y es 66,6 4 = 15.31.5 23 2 2. Se eleva al cuadrado la marca de clase : x i = ( 55.5) ( 55.5) = 3080.25. etc 3. Se calcula el producto fixi 2 = ( 4) ( 3080.25) = 12321 , etc. 56

Los datos de la muestra 2 están mas dispersos que la muestra 1 Ejemplo-1 Sean los siguientes datos 1, 2, 3, 4, 5 Hallar e interprete el coeficiente de variación

x 3

S

S

2

 2.5

S

 1.5811

CV  1.5877 3 x100%  52.70% (nos indica que la desviación estándar para este conjunto de datos representa el 52.70% de su media aritmética) Ejemplo-2 La siguiente información corresponden a los montos (S/ )por ventas de dos tiendas comerciales A y B Valores estadísticos Venta promedio Desviación estándar

Tienda comercial A 22,000 2,640

Tienda comercial B 18,500 3,145

¿Qué montos por ventas están más dispersos? Para la tienda comercial (A) CV = 2640 x 100% = 12.0% 22000 Para la tienda comercial (B)

CV = 3145 x 100% = 17.0% 18500 Por lo tanto los montos por ventas de la tienda comercial B son más variables o más dispersos que los montos por ventas de A Ejemplo : CV = 6,99 X 100 = 10.5% 57

66.6 El coeficiente de variación es útil cuando la intersección es comparar dos distribuciones numéricas medidas en escalas diferentes. 5.5 EJERCICIOS PROPUESTOS

1. Los siguientes datos corresponden a estaturas (mts) de los alumnos de cierta universidad

1.71

1.78

1.85

1.58

1.68

1.66

1.72

1.67

1.68

1.65

1.68

1.65

1.68

1.67

1.70

1.70

1.68

1.65

1.66

1.68

Hallar e interprete las medidas de dispersión absoluta y relativa 2 Los siguientes datos corresponden a una muestra al azar de 40 frascos conteniendo mermelada de piña los pesos (grs) se presentan a continuación 149 156 157 158 162

164 165 165 168 170

171 172 174 175 175

176 176 178 180 180

181 182 183 183 184

185 186 186 188 187

187 187 188 188 189

190 194 196 198 202

a. Elaborar la tabla de distribución de frecuencias b. Calcular las medidas de dispersión o variabilidad

3. Se eligen al azar a 70 trabajadores de una empresa, la distribución de los ingresos mensuales se presentan en la tabla siguiente

i 1 2 3 4 5 6

Ingresos [400 600) [600 800) [800 1000) [1000 1200) [1200 1400) [1400 1600) Total

fi 6 12 18 15 12 7 70 58

Usando la información de la tabla, calcular a. El rango b. La variancia c. La desviación estándar d. El coeficiente de variación e. La variancia y desviación estándar f. La variancia y desviación estándar, si la empresa decide aumentar los ingresos de sus trabajadores en un 7% mas 45 nuevos soles

59

ORGANIZACIÓN DE LA INFORMACION 2.1. RECOPILACIÓN DE DATOS La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para recopilar los datos de interés, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observación, registros de denuncias etc. 2.2. ORGANIZACIÓN DE DATOS Una vez recopilada la información, es necesario revisarla cuidadosamente luego resumirla y presentarla convenientemente por ejemplo en tablas de frecuencias, gráficos etc., posteriormente analizarla e interpretarla y tomar decisiones convenientes. 2.3. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE CUADROS O TABLAS Después de la revisión y corrección de los datos recopilados, conviene estructurar y ordenar estos datos de acuerdo a algún sistema de clasificación a fin de describirlos o analizarlos en cuadros o tablas. A continuación, se señalan algunos conceptos y procedimientos comunes para la presentación de los datos en cuadros o tablas. DISTRIBUCIÓN DE FRECUENCIAS O TABLAS DE FRECUENCIAS DE UNA VARIABLE DISCRETA Una distribución de frecuencias es un arreglo de los valores observados x i,…,xk de la variable X con sus respectivas frecuencias en una tabla de la forma. Valor de Xi x₁ x₂ . . . xk

fi f1 f2 . . . fk k

Total

 i 1

n xi fi Fi hi Hi

: : : : : :

fi  n

Fi F₁ F₂ . . . FK=n

hi h₁ h2 . . . hk

Hi H1 H2 . . . Hk = 1

k

h 1 i 1

i

Donde: número de observaciones variable o clase frecuencia absoluta frecuencia absoluta acumulada frecuencia relativa frecuencia relativa acumulada

60

TABLAS DE DISTRIBUCIÓN DE FRECUENCIA DE DATOS CUALITATIVOS En este caso como la variable cualitativa indica cualidades, propiedades, etc., se agrupa de acuerdo a cada categoría que se diferencia en la variable cualitativa. (Sin un orden establecido). Ejemplo Sea la empresa “dieta SA” cuyo gerente de producción está interesado en estudiar las preferencias del público sobre diferentes tipos de mermeladas que pueden ser de pera, manzana, durazno y fresa, toma una muestra de la preferencia de 20 personas siendo los resultados los que se presentan. Datos recopilados Pera Durazno Fresa Fresa Pera

Manzana Pera Durazno Manzana Manzana

Manzana Fresa Fresa Fresa Pera

Pera Fresa Fresa Durazno Durazno

Pasos para la elaboración de las tablas de frecuencias 1. Identificar las clases o nombre de la variable (Xi) Xᵢ = tipo de mermelada x1 = Pera

x2 = Durazno

x3 = Fresa

x4 = Manzana

2. Organizar la información de acuerdo al tipo de clase Xi 3. Hallar la frecuencia absoluta (fi) 4. Hallar la frecuencia absoluta acumulada (Fi) 5. Hallar la frecuencia relativa (hi) 6. Hallar la frecuencia relativa acumulada (Hi) Con esto se termina de construir la tabla Clase Xᵢ Pera Durazno Fresa Manzana

fi 5 4 7 4 20

Fi 5 9 16 20

hi 0.25 0.2 0.35 0.2 1

Hi 0.25 0.45 0.8 1

PROPIEDADES DE LA TABLA DE FRECUENCIAS 61

 La suma de las frecuencias absolutas es igual al número de observaciones k

f1  f 2  ...  f k   fi  n i 1

 La primera frecuencia acumulada es igual a la primera frecuencia absoluta F1= f1  La frecuencia absoluta acumulada de cualquier clase será igual a la frecuencia absoluta acumulada anterior más la frecuencia absoluta de la clase. Fi  Fi 1  fi  La última frecuencia acumulada es igual al nuero de observaciones Fk=n  La suma de las frecuencias relativas es igual a la unidad k

h1  h2  ...  hk   hi  1 i 1

 La primera frecuencia relativa acumulada es igual a la primera frecuencia relativa. H1  h1  La frecuencia relativa acumulada de cualquier clase será igual a la frecuencia relativa acumulada anterior más la frecuencia relativa de la clase H i  H i 1  hi  La última frecuencia relativa acumulada es igual a la unidad Hk  1 EJERCICIOS: 1. Al elaborar una tabla de frecuencias donde se evaluó la opinión de 40 personas sobre la calidad como, excelente (E), bueno (B), regular (R), malo (M) de una nueva conserva. Se perdió información de dicha tabla recuperándose solo lo siguiente: 1. La primera clase está definida como excelente 2. La frecuencia relativa de la primera clase es igual al 30% de la muestra 3. f3  f 4  f1 4.

f3  f 4  2

2. Elaborar una tabla de frecuencias con los datos a continuación señalados

62

Sol. clase Xi Narrativa Biografía Poesía Cuento Teatro

fi 23 15 20 5 7 70

Fi 23 38 58 63 70

hi 0.33 0.21 0.29 0.07 0.10 1.00

Hi 0.33 0.54 0.83 0.90 1.00

3. Completar la tabla de frecuencias con los resultados de las notas finales de un curso de ESTADÍSTICA

Sol. clase Xi No presente Suspenso Aprobado Notable Sobresaliente

fi 17 16 29 24 2 88

Fi 17 33 62 86 88

hi 0.19 0.18 0.33 0.27 0.02 1.00

Hi 0.19 0.38 0.70 0.98 1.00

4. Ejemplo: Las calificaciones de un examen de Matemáticas de 18 alumnos son las siguientes: Sobresaliente, Notable, Notable, Insuficiente, Sobresaliente, Suficiente, Suficiente, Insuficiente, Notable, Notable, Suficiente, Suficiente, 63

Suficiente, Notable, Suficiente, Sobresaliente, Notable, Notable Sabemos el orden que mantiene, la nota más baja es el Insuficiente, le siguen el Suficiente y Notable y la más alta es Sobresaliente, construir la tabla de frecuencias Sol. clase Xi Sobresaliente Notable Suficiente Insuficiente

fi 3 7 6 2 18

Fi 3 10 16 18

hi 0.17 0.39 0.33 0.11 1.00

Hi 0.17 0.56 0.89 1.00

5. Ejercicio: Con la escena anterior contesta a las siguientes preguntas. a) ¿Cuántos alumnos sacaron una nota inferior a Notable? R. 8 alumnos b) ¿Qué porcentaje de alumnos aprueba el examen? R. 11% c) ¿Cuántos alumnos aprobados no sacaron la nota más alta? R. 13 alumnos 6. Ejercicio El color de lo coches que circulan por una calle céntrica es el siguiente: NEGRO NEGRO ROJO AZUL ROJO VERDE VERDE BLANCO BLANCO BLANCO NEGRO NEGRO BLANCO NEGRO ROJO ROJO BLANCO BLA NCO NEGRO BLANCO AZUL ROJO NEGRO AZUL NEGRO BLANCO BLANCO VERDE VERDE ROJO Construye, una tabla con estos datos. Sol. clase Xi Negro Rojo Azul Verde Blanco

fi 8 6 3 4 9 30

Fi 8 14 17 21 30

hi 0.27 0.20 0.10 0.13 0.30 1.00

Hi 0.27 0.47 0.57 0.70 1.00

7. Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados: Considerando los siguientes datos elaborar la tabla correspondiente negro azul rojo negro

azul rojo amarillo azul

amarillo negro amarillo rojo

rojo amarillo azul negro

azul rojo rojo amarillo

64

8. Indica que variables son cualitativas y cuales cuantitativas 1. Comida Favorita. Var. Cualitativa 2. Profesión que te gusta. Var. Cualitativa 3. Número de goles marcados por la U. Var. Cuantitativa 4. Número de alumnos de tu Instituto. Var. Cuantitativa 5. El color de los ojos de tus compañeros de clase. Var. Cualitativa 6. Coeficiente intelectual de tus compañeros de clase. Var. Cuantitativa 9. Después de verificar en el cuaderno de denuncias de la comisaria de una localidad de Huancavelica, se verificó que las violaciones durante el año están registradas como sigue: clase Xi Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

fi 8 6 3 4 9 5 7 2 5 4 3 8

Elabore la tabla de frecuencias correspondiente Sol. clase Xi Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre

fi 8 6 3 4 9 5 7 2 5 4 3 8 64

Fi 8 14 17 21 30 35 42 44 49 53 56 64

hi 0.13 0.09 0.05 0.06 0.14 0.08 0.11 0.03 0.08 0.06 0.05 0.13 1.00

Hi 0.13 0.22 0.27 0.33 0.47 0.55 0.66 0.69 0.77 0.83 0.88 1.00

65

10. La siguiente información corresponde a una tabla de frecuencias sobre la preferencia de 80 fanáticos del cine, deteriorada por un accidente en el trabajo, se pide completar los datos de la tabla con os datos recuperados.

Clase Xi Drama Terror Comedia Aventura Guerra

fi 12 48

Fi

hi

Hi

60 0.125 0.075

80 Sol. Clase Xi Drama Terror Comedia Aventura Guerra

fi 12 48 10 6 4 80

Fi 12 60 70 76 80

hi 0.15 0.6 0.125 0.075 0.05 1

Hi 0.15 0.75 0.875 0.95 1

EJERCICIOS SOBRE VARIABLES CUANTITATIVAS DISCRETAS

Este tipo de variables cumple una cantidad de números exacta. Solo se maneja con valores enteros.

1. Número de alumnos de las aulas de un colegio de la región Ucayali 22 – 22 – 24 – 21 – 28 – 30 – 26 – 31 – 22 – 26 – 32 – 28 – 30 – 24 – 30 – 32 – 20 – 24 – 35 – 22 – 24 – 24 – 26 – 24 – 26 – 30 – 24 – 28 – 27 – 23 – 35 – 24 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 35 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 20 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 35 − 20 = 15 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 66

𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3

clases [20 − 23[ [23 − 26[ [26 − 29[ [29 − 32[ [32 − 35]

𝑓𝑖 6 9 8 5 4 32

𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 6 0,19 15 0,28 23 0,25 28 0,16 32 0,12 --1

𝐻𝑖 0,19 0,47 0,72 0,88 1 ---

X 21,5 24,5 27,5 30,5 33,5

ℎ𝑖 % 𝐻𝑖 % 19 % 19 % 28 % 47 % 25 % 72 % 16 % 88 % 12 % 100 % 100 % ---

2. Número de Uvas de un racimo 18 - 16 - 20 – 22 - 25 – 24 – 30 – 28 – 27 – 42 – 28 – 20 – 22 – 33 – 32 – 26 – 25 - 20 – 24 – 38 – 35 – 16 – 16 – 30 – 30 – 26 – 27 – 28 – 30 – 16 – 24 - 32 – 38 – 40 – 24 – 25 – 40 – 42 - 35 - 40 – 29 – 34 – 32 - 35 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 40 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 42 − 16 = 26 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 26: 5 = 5,2 ≈ 5

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [16 − 21[ 8 8 0,18 [21 − 26[ 10 18 0,22 [26 − 31[ 11 29 0,25 [31 − 36[ 8 37 0,18 [36 − 42] 7 44 0,17 44 --1

𝐻𝑖 0,18 0,40 0,65 0,83 1 ---

X ℎ𝑖 % 𝐻𝑖 % 18,5 18 % 18 % 23,5 22 % 40 % 28,5 25 % 65 % 33,5 18% 83 % 38,5 17 % 100 % --- 100 % ---

3. Número de hijos por familia en un vecindario del Distrito de Villa el salvador 5–4–3–0–1–7–6–4–3–2–5–4–8–6–5–4–3–6–6–4–2–1 1–4–5–6–4–3–5–6–4–3–8–6–2–2–1–1–2–4–6–4–4–5 5 – 4 – 2 – 1 -7 - 2 Desarrollo: 67

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 8 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 0 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 8 − 0 = 8 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [0 − 2[ 7 7 0,14 [2 − 4[ 12 19 0,24 [4 − 6[ 19 38 0,38 [6 − 8[ 10 48 0,20 [8 − 10] 2 50 0,04 50 --1

𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,14 1 14 % 14 % 0,38 3 24 % 38 % 0,76 5 38 % 76 % 0,96 7 20 % 96 % 1 9 4 % 100 % --- --- 100 % ---

4. Edades de los postulantes a la escuela de SOPNP en el primer día. 20 - 24 – 18 – 23 – 22 – 18 – 20 – 22 – 22 – 20 – 19 – 24 – 20 – 21 – 19 – 24 18 – 21 – 22 – 17 – 22 – 24 – 18 – 20 – 20 – 20 – 21 – 21 – 20 – 20 – 24 – 24 24 – 22 – 18 – 20 – 20 – 20 – 22 – 21 – 20 – 17 – 24 – 20 – 20 – 21 – 22 – 23 18 – 19 – 20 – 17 – 20 – 16 – 21 – 24 – 24 – 23 – 22 – 23 – 20 – 21 - 22 – 24 20 – 20 – 21 – 20 - 20 – 22 – 23 – 19 – 19 – 20 – 23 – 24 – 24 – 22 – 23 – 22 21 – 22 – 23 – 24 – 20 - 24 – 20 – 22 – 21 – 22 – 23 – 24 – 23 – 19 – 18 – 20 20 – 22 – 24 - 23

Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 24 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 24 − 16 = 8 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2

clases [16 − 18[ [18 − 20[ [20 − 22[ [22 − 24[ [24 − 26]

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 4 4 0,04 13 17 0,13 39 56 0,39 27 83 0,27 17 100 0,17 100 --1

𝐻𝑖 0,04 0,17 0,56 0,83 1 ---

X ℎ𝑖 % 𝐻𝑖 % 17 4 % 4% 19 13 % 17 % 21 39 % 56 % 23 27 % 83 % 25 17 % 100 % --- 100 % --68

5. Calificaciones exactas de los parciales de Estadística en las aulas 01 y 02 ESOPNP 08 – 12 – 14 – 10 – 12 – 11 – 10 – 12 – 09 – 12 – 13 – 14 – 16 – 17 – 11 – 12 – 14 – 15 – 12 – 11 – 14 – 10 – 12 – 14 – 16 – 18 – 12 – 14 – 05 – 12 – 15 – 10 – 12 – 10 – 11 – 13 – 15 – 17 – 17 – 13 – 18 – 09 – 12 – 11 – 07 – 06 – 14 – 12 05 – 15 – 13 – 11 – 10 – 10 – 09 – 07 – 16 – 14 – 12 – 10 – 08 – 07 – 12 – 09 17 – 15 – 08 – 06 – 14 - 15 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 18 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 05 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 18 − 05 = 13 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 13: 5 = 2,6 ≈ 3

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [04 − 07[ 4 4 0,06 [07 − 10[ 10 14 0,14 [10 − 13[ 28 42 0,40 [13 − 16[ 19 61 0,27 [16 − 19] 9 70 0,13 70 --1

𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,06 5,5 6% 6% 0,20 8,5 14 % 20 % 0,60 11,5 40 % 60 % 0,87 14,5 27 % 87 % 1 17,5 13 % 100 % ----- 100 % ---

EJERCICIOS SOBRE VARIABLES CUANTITATIVAS CONTINUAS Estas pueden ser expresadas con decimales, toman cualquier valor dentro de un intervalo. 1. Peso del primer grupo de los postulantes a la ESOPNP. 62 – 62,3 – 70,2 – 63- 68,4 – 72 – 72,5 – 74 – 68,8 – 66,8 – 72 – 72, 4 – 82,4 78,4 - 64,6 – 82,4 – 68,8 - 72,2 – 74,6 – 68,8 – 65,8 – 64,8 – 78,6 – 82,6 – 78 68,8 – 68,2 – 78,4 – 86,6 – 70 – 72 – 72,6, 78, 8 – 65 – 65,4 – 65,8 – 84 67 – 62,8 -74,4 – 74 – 72,4 – 72,8 – 68,8 – 64,8 - 72,4 – 74 – 72,8 – 74,4 – 76,8

69

Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 84 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 62 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 84 − 62 = 22 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 22: 5 = 4,5 ≈ 5

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 clases X ℎ𝑖 % 𝐻𝑖 % [61 − 66[ 10 10 0,2 0,2 63,5 20 % 20 % [66 − 71[ 12 22 0,24 0,44 68,5 24 % 44 % [71 − 76[ 17 39 0,34 0,78 73,5 34 % 78 % [76 − 81[ 6 45 0,12 0,90 78,5 12 % 90 % [81 − 86] 5 50 0,1 1 83,5 10 % 100 % 50 --1 ----- 100 % -2. Velocidad que llevan las combis que circulan en la panamericana norte en una determinada hora 82 – 84,4 – 90,4 -96,8 – 79,6 – 84,4 – 88,2 – 78 – 86,4 – 94,2 – 96,2 – 98,2 – 100 – 96,8 – 86,4 – 87,1 – 88,2 – 86,4 – 82,4 – 88,8 – 79,8 – 78,8 – 86,8 – 94 – 96,4 – 87,6 – 84,8 – 98,8 – 84,6 – 88,7 – 80 – 82,8- 102 – 100,4 – 98,8 – 96,6 – 82 – 82,6 – 92,5 – 96 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 102 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 78 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 102 − 78 = 24 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 24: 5 = 4,8 ≈ 5

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [78 − 83[ 9 9 0,22 [83 − 88[ 11 20 0,28 [88 − 93[ 6 26 0,15 [93 − 98[ 8 34 0,2 [98 − 103] 6 40 0,15 40 --1

𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,22 80,5 22 % 22 % 0,50 85,5 28 % 50 % 0,65 90,5 15 % 65 % 0,85 95,5 20 % 85 % 1 100,5 15 % 100 % ----100 % ---

3. Estatura (en cm) de los postulantes a la ESOPNP 2019 165 – 166 – 168 – 176 – 168 – 166 – 173 – 173 – 174 – 173 – 175 – 172 – 180 – 171 – 171 – 166 – 165 – 167 – 165 – 177 – 176 – 170 – 172 – 172 – 174 – 178 – 165 – 169 – 166 – 167 – 165 – 175 – 174 – 174 – 168 – 173 – 174 – 173 – 170 – 165 – 167 – 168 – 170 – 174 – 178 – 172 – 174 – 168 – 169 - 171 – 173 – 17270

169 – 170 – 169 – 169 – 168 – 168 - 170 - 169 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 180 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 165 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 180 − 165 = 15 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3

clases [165 − 168[ [168 − 171[ [171 − 174[ [174 − 177[ [177 − 180]

𝑓𝑖 15 16 14 11 4 60

𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 15 0,25 31 0,27 45 0,23 56 0,18 60 0,07 --1

𝐻𝑖 0,25 0,52 0,75 0,93 1 ---

X ℎ𝑖 % 𝐻𝑖 % 166,5 25 % 25 % 169,5 27 % 52 % 172,5 23 % 75 % 175,5 18 % 93 % 178,5 7 % 100 % --100 % ---

4. Tiempo (en segundos) que demoran en recorrer los 100 metros planos los postulantes a la ESOPNP 67 – 70 - 72 – 74 – 68 – 69 – 73 – 70 – 74 – 72 – 74 – 71 – 66 – 64 – 66 – 70 – 69- 65 – 66 – 68 – 69 – 65 – 69 – 65 – 64 – 72 – 74 – 69 – 68 – 69 – 71 – 70 – 72 – 69 – 64 – 66 – 65 – 66 – 67 – 68 – 69 – 70 – 68 – 64 – 65 – 71 – 73 – 66 – 64 – 68

Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 74 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 64 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 74 − 64 = 10 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 10: 5 = 2

𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [64 − 66[ 10 10 0,20 [66 − 68[ 8 18 0,16 [68 − 70[ 14 32 0,28 [70 − 72[ 7 39 0,14 [72 − 74] 11 50 0,22

𝐻𝑖 0,20 0,36 0,64 0,78 1

X ℎ𝑖 % 65 20 % 67 16 % 69 28 % 71 14 % 73 22 %

𝐻𝑖 % 20 % 36 % 64 % 78 % 100 % 71

50 ---

1

---

--- 100 %

---

5. Un club de básquet realizo una convocatoria para niños de 12 años. Se sabe que el primer día se presentaron 200 niños cuyas estaturas se agrupan en intervalos y se registra en una tabla. ¿Cuántos miden menos de 165 cm? clases [150 − 155[ [155 − 160[ [160 − 165[ [165 − 170[ [170 − 175]

𝑓𝑖 40 80 50 20 10 200

𝐹𝑖 40 120 170 190 200 ---

Rpta: Se necesitan 170 niños

Experimentos (o fenómenos) aleatorios.- Son aquellos en los que no se puede predecir el resultado. Experimento determinista.- Aquellos experimentos que si se puede predecir el resultado Ejemplos: a) Lanzar una moneda es un experimento aleatorio ya que no sabemos si obtendremos cara o cruz. b) Calentar agua a altas temperaturas es un experimento determinista ya que sabemos, con toda seguridad, que el agua hervirá a partir de determinada temperatura. c) Lanzar un dado es un experimento aleatorio ya que no podemos predecir el número que obtendremos. d) Extraer una bola de una urna que sólo contiene bolas rojas es un experimento determinista ya que podemos predecir que la bola extraída será roja. El espacio muestral .- Es el conjunto de los resultados posibles de un experimento aleatorio. Denotaremos el espacio muestral de un experimento con E o Ω. Ejemplo: a). El espacio muestral del lanzamiento de una moneda es; E={cara, cruz}E={cara, cruz} ya que éstas son las dos únicas posibilidades. b). El espacio muestral del lanzamiento de un dado es; E={1,2,3,4,5,6} pero también puede ser. E={par, impar} Un suceso aleatorio.- Es un elemento del espacio muestral. Es decir, cada uno de los posibles resultados de un experimento aleatorio es un suceso aleatorio. 72

Ejemplo 1: En el lanzamiento de una moneda, los sucesos aleatorios son: sale cara, sale cruz Decimos que un suceso aleatorio es un suceso imposible si nunca puede ocurrir. Ejemplo 2: En el lanzamiento de un dado, los siguientes sucesos son imposibles: sacar un 8, sacar un número mayor que 6. En contraposición, Decimos que un suceso aleatorio es un suceso seguro si siempre ocurre. Ejemplo 3: En el lanzamiento de un dado, los siguientes sucesos son seguros: sacar un número mayor que 0, sacar un número menor que 7. EJERCICIOS DE APLICACIÓN. 1) Si lanzamos al aire una moneda, entonces. Responder la opción correcta a) El espacio muestral es E = {Sacar cara}. b) El espacio muestral es E = {Sacar cara, Sacar cruz}. c) El espacio muestral es E = {Sacar cruz}. 2) Lanzamos un dado y nos interesa el número que sale, Responder la opción correcta: a) El espacio muestral es, E = {1,2,3,4,5,6} b) El espacio muestral es, E = {Sale un número par, Sale un número impar}. c) El espacio muestral es E = {Sale cara, Sale cruz}. d) Todas son falsas 3) Extraemos una carta de una baraja española y nos fijamos sólo en el palo de la carta extraída. a). No se trata de un experimento aleatorio. b). El espacio muestral es E = {1,2,3,4,5,6,7,8,9,10,11,12}. c). El espacio muestral es E = {Bastos, Copas, Oros, Espadas}. d). Todas las opciones son verdaderas. 4). Lanzamos al aire una moneda. Buscar la opción correcta: a). El suceso "Sacar cara" es más probable que el suceso "Sacar cruz". b). Los sucesos "Sacar cara" y "Sacar cruz" son sucesos contrarios. c). El espacio muestral es E = {Sacar cruz}. d). Todas la anteriores son falsas. 5) Lanzamos un dado. Indicar la opción correcta a) "Sacar un número impar" y "Sacar un número mayor que 3" son sucesos incompatibles.

73

b) "Sacar un número par" y "Sacar un número mayor que 3" son sucesos incompatibles. c) "Sacar un número impar" y "Sacar un número mayor que 5" son sucesos

incompatibles. d) Todas la anteriores son verdaderas.

Los sucesos incompatibles son los que no pueden darse al mismo tiempo. 6) En un bombo con 50 bolas numeradas del 1 al 50, se extrae una bola. a) Los sucesos "Sacar un número par" y "Sacar un número mayor que 38" son incompatibles. b) El espacio muestral es E={10,20,,30,40,50}E={10,20,,30,40,50} c) Se trata de un experimento determinista. d) Todas las opciones son falsas. 7) Se ha lanzado 5 veces una moneda y en todas las ocasiones se ha obtenido cara. a) En el siguiente lanzamiento es más probable que salga cara. b) En el siguiente lanzamiento es más probable que salga cruz. c) Es igual de probable que salga cara y que salga cruz. d) Todas las opciones son falsas. 8) En una urna hay 10 bolas numeradas del 1 al 10 y realizamos una extracción. Consideramos los sucesos A = "Sacar una bola con un número par" y B = "Sacar una bola menor que 2". a) La intersección de los sucesos A y B es igual al espacio muestral, E. Es decir, A∩B=EA∩B=E b) La intersección de los sucesos A y B es un suceso imposible. c) Los sucesos A y B son el mismo suceso. d) Todas las opciones son falsas. EJERCICIOS DE PERCENTILES 1. Dadas las series estadísticas:  3, 5, 2, 7, 6, 4, 9.  3, 5, 2, 7, 6, 4, 9, 1.

74

Calcular para la primera serie los percentiles 32 y 85. Para la segunda, hallar los percentiles 20 y 70. Solución 

3, 5, 2, 7, 6, 4, 9. La serie en orden es: 2, 3, 4, 5, 6, 7, 9. Al calcular los percentiles tenemos: P32 = 4 P85 = 7



3, 5, 2, 7, 6, 4, 9, 1. La serie en orden es: 1, 2, 3, 4, 5, 6, 7, 9. Al calcular los percentiles obtenemos: P20 = 2 P70 = 6

2. Una distribución estadística viene dada por la siguiente tabla: fi [10, 15)

3

[15, 20)

5

[20, 25)

7

[25, 30)

4

[30, 35)

2

Hallar el percentil 70. Solución: -Completamos la tabla con la frecuencia acumulada: xi

fi

Fi

[10, 15)

12.5

3

3

[15, 20)

17.5

5

8

[20, 25)

22.5

7

15 75

[25, 30)

27.5

4

19

[30, 35)

32.5

2

21

21 -Buscamos el intervalo donde se encuentra el percentil 70 Multiplicamos 70 por N, en este caso 21, y dividimos por 100

En la columna de las frecuencias acumuladas contiene a 14.7

, identificamos el intervalo que

La clase de P70 es: [20, 25) -Aplicamos la fórmula para el cálculo de percentiles de datos agrupados Extrayendo los siguientes datos:

Concluimos que:

3. Calcular el percentil 35 y 60 de la distribución de la tabla: fi [50, 60) 8 [60, 70) 10 [70, 80) 16 [80, 90) 14 [90, 100) 10 [100, 110) 5 [110, 120) 2

Fi 8 18 34 48 58 63 65

65 Solución: Cálculo del percentil 35 76

-Buscamos el intervalo donde se encuentra el percentil 35 Multiplicamos 35 por N, en este caso 65, y dividimos por 100

En la columna de las frecuencias acumuladas contiene a 22.75

identificamos el intervalo que

La clase de P35 es: [70, 80) -Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados Extraemos los siguientes datos:

Concluimos que:

Cálculo del percentil 60 -Buscamos el intervalo donde se encuentra el percentil 60 Multiplicamos 60 por N, en este caso 65, y dividimos por 100

Buscamos en la columna de las frecuencias acumuladas a 39

el intervalo que contiene

La clase de P60 es: [80, 90) -Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados Extraemos los siguientes datos:

77

Concluímos que:

EJERCICIOS DE CUARTILES 4. Calcular los cuartiles las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 1

2

3 26/4 = 6.5 Q1 = 7 Q2 = Me = 10 (26 · 3)/4 = 19.5 Q3 = 14

5. Una distribución estadística viene dada por la siguiente tabla:

78

fi [10, 15)

3

[15, 20)

5

[20, 25)

7

[25, 30)

4

[30, 35)

2

Hallar los cuartiles 1º y 3º.

xi

fi

Fi

[10, 15)

12.5

3

3

[15, 20)

17.5

5

8

[20, 25)

22.5

7

15

[25, 30)

27.5

4

19

[30, 35)

32.5

2

21

21 Cálculo del primer cuartil Buscamos el intervalo donde se encuentra el primer cuartil, multiplicando 1 por N (21) y dividiendo por 4

Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 5.25 La clase de Q1 es: [15, 20) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 15 Fi–1= 3 fi = 5 ai = 5 79

Cálculo del tercer cuartil Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (21) y dividiendo por 4

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 18.75 La clase de Q1 es: [25, 30) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 25 Fi–1= 15 fi = 4 ai = 5

6. Dada la distribución estadística: fi [0, 5)

3

[5, 10)

5

[10, 15)

7

[15, 20)

8

[20, 25)

2

[25, ∞)

6

Calcular los Cuartiles 1º y 3º. Ampliamos la tabla con otra columna donde disponemos la frecuencia acumulada (F i): En la primera casilla colocamos la primera frecuencia absoluta. En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta correspondiente y así sucesivamente hasta la última, que tiene que se igual a N (31)

80

xi

fi

Fi

[0, 5)

2.5

3

3

[5, 10)

7.5

5

8

[10, 15)

12.5

7

15

[15, 20)

17.5

8

23

[20, 25)

22.5

2

25

6

31

[25, ∞)

31 Cálculo del primer cuartil Buscamos el intervalo donde se encuentra el primer cuartil, multiplicando 1 por N (31) y dividiendo por 4

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 7.75 La clase de Q1 es: [5, 10) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 5 Fi–1= 3 fi = 5 ai = 5

Cálculo del tercer cuartil Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (31) y dividiendo por 4

Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 23.25 La clase de Q1 es: [20, 25) 81

Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 20 Fi–1= 23 fi = 2 ai = 5

7. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:

¿A partir de que valores se encuentran el 25% de los alumnos más pesados? Construimos la tabla: xi

fi

Fi

[60,63)

61.5

5

5

[63, 66)

64.5

18

23

[66, 69)

67.5

42

65

[69, 72)

70.5

27

92

[72, 75)

73.5

8

100

100 Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (100) y dividiendo por 4

82

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 75 La clase de Q3 es: [69, 72) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 69 Fi–1= 65 fi = 27 ai = 3

EJERCICIOS DE DECILES 8. Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: Los deciles 2º y 7º. 3, 5, 2, 7, 6, 4, 9. 8 · (2/10) = 1.6 D2 = 2 8 · (7/10) = 5.6 D7 = 6 3, 5, 2, 7, 6, 4, 9, 1. 8 · (2/10) = 1.6 D2 = 2 8 · (7/10) = 5.6 D7 = 6 9. Calcular los deciles de la distribución de la tabla: fi

Fi

[50, 60)

8

8

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

83

[100, 110)

5

63

[110, 120)

2

65

65 Cálculo del primer decil Buscamos el intervalo donde se encuentra el primer decil, multiplicando 1 por N (65) y dividiendo por 10

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.5 La clase de D1 es: [50, 60) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 50 Fi–1= 0 fi = 8 ai = 10

Cálculo del segundo decil Buscamos el intervalo donde se encuentra el segundo decil, multiplicando 2 por N (65) y dividiendo por 10

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 13 La clase de D2 es: [60, 70) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 60 Fi–1= 8 fi = 10 84

ai = 10

Cálculo del tercer decil

Cálculo del cuarto decil

Cálculo del quinto decil

Cálculo del sexto decil

Cálculo del séptimo decil

Cálculo del octavo decil

85

Cálculo del noveno decil

10.

Una distribución estadística viene dada por la siguiente tabla: fi [10, 15)

3

[15, 20)

5

[20, 25)

7

[25, 30)

4

[30, 35)

2

Hallar los deciles 3º y 6º. Completamos la tabla con a frecuencia acumulada: xi

fi

Fi

[10, 15)

12.5

3

3

[15, 20)

17.5

5

8

[20, 25)

22.5

7

15

[25, 30)

27.5

4

19

[30, 35)

32.5

2

21

21 Cálculo del tercer decil Buscamos el intervalo donde se encuentra el tercer decil, multiplicando 3 por N (21) y dividiendo por 10

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.3 La clase de D3 es: [15, 20) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: 86

Li = 15 Fi–1= 3 fi = 5 ai = 5

Cálculo del sexto decil Buscamos el intervalo donde se encuentra el sexto decil, multiplicando 6 por N (21) y dividiendo por 10

Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.3 La clase de D6 es: [20, 250) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 20 Fi–1= 8 fi = 7 ai = 5

87

EJEMPLOS DE VARIABLES N° 1

CUALITATIVA Mujer y hombre

2

Colores de un grupo de automóviles resguardados en un depósito. Nacionalidad de un grupo de detenidos en una comisaria. Tipos de drogas

3 4 5

CUANTITATIVA Edades de los funcionarios y funcionarias en una estación policial Cantidad de armas asignadas a un policía.

Número de personas que conforman una determinada división. Salario de los y las Oficiales policiales en Soles. Velocidad de algún automóvil al pasar un punto de control.

Color de los ojos de los detenidos en un procedimiento.

EJERCICIOS DE MEDIDAS DE DISPERSION 1. En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y cantidades se especifican en el siguiente cuadro:

EDADES

FRECUENCIA

[ 20; 25 >

2

[ 25; 30 >

5

[ 30; 35 >

2

[ 35; 40 ]

1

a) Hallar las medidas de tendencia central b) Hallar el Q1; D4; P16 c) Hallar la varianza, la desviación típica y el coeficiente de variación.

2. En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos en el cuadro dado.

INTERVALOS FRECUENCIA [ 20; 40 >

10

[ 40; 60 >

30

[ 60; 80 >

20 88

[ 80; 100 >

20

[ 100; 120 ]

20

3. Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la eo. 0 3 0 1 0 1 1 1 2 1 1 4 2 3 3 2 2 1 1 2 1 Calcula las medidas de dispersión. 4. Los siguientes datos representan el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. Calcular la varianza y la desviación típica. 5. Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias: Intervalo frecuencia 6.

0 a 10 8

10 a 20 34

20 a 30 76

30 a 40 60

40 a 50 31

50 a 60 28

60 a 70 13

Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando: Policías

0

1

2

3

4

5

6

7

8

frecuencias

5

19

29

30

22

16

14

9

6

Determine la desviación típica y la media de las desviaciones medias.

7. La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de cadetes: Estatura frecuencia

60 a 62

63 a 65

66 a 68

69 a 71

72 a 74

5

18

42

27

8

Determine el rango, la media de las desviaciones absolutas, la desviación típica y el coeficiente de variación.

89

8. Dada la siguiente tabla de frecuencias, para datos sin agrupar: Valor

0

1

2

3

4

5

6

7

frecuencia

8

14

25

13

20

12

6

2

Calcule su varianza, la desviación típica, el coeficiente de variación, el rango, la media de las desviaciones absolutas.

9. Si se tienen dos conjuntos de datos expresados en las mismas unidades, ¿puede decirse que el que tenga mayor varianza presenta una mayor dispersión?

10. Si en un conjunto de datos todos los valores son negativos, ¿puede alguna de las medidas absolutas de dispersión ser negativa?

11. ¿Cuál es la diferencia entre las medidas absolutas y las medidas relativas de dispersión?. ¿Cuál de las dos mide mejor la variabilidad?

90

SOLUCION DE MEDIDAS DE DISPERSION

1.-En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y cantidades se especifican en el siguiente cuadro: Hallar la varianza y la desviación típica.

Edades [20 - 25> [25 - 30> [30 - 35> [35 - 40]

Frecuencia fi 2 5 2 1 10

Marca de clase Xi 22.5 27.5 32.5 37.5

Media =

fi*Xi 45.00 137.50 65.00 37.50 285.00

Frecuencia Acumulada 2 7 9 10

_

_

_

Xi  X

(X i  X )2

( X i  X )2 * fi

-6 -1 4 9

36 1 16 81

72 5 32 81 190

28.5

Varianza =

19

Desviación típica =

4.36

2.- En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos en el cuadro dado.

Frecuencia fi

Marca de clase Xi

[ 20; 40 >

10

[ 40; 60 >

30

[ 60; 80 > [ 80; 100 >

INTERVALOS

[ 100; 120 ]

fi*Xi

Frecuencia Acumulada

Xi  X

(X i  X )2

( X i  X )2 * fi

30

300

10

-42

1764

17640

420

50

1500

40

-22

484

14520

660

20

70

1400

60

-2

4

80

40

20

90

1800

80

18

324

6480

360

20

110

2200

100

38

1444

28880

760

67600

2240

100

_

_

7200

Media =

_

_

| X

i

 X | * fi

72

Varianza =

676

Desviación típica =

26.00

Media de las desviaciones medias =

22.40

3.- Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP. 0 3 0 1 0 1 1 1 2 1 1 4 2 3 3 2 2 1 1 2 1 Calcula las medidas de dispersión. Frecuencia Acumulada

Xi  X

(X i  X )2

( X i  X )2 * fi

0

3

-1.52

2.3220

6.9660

4.57

9

12

-0.52

0.2744

2.4694

4.71

2

10

17

0.48

0.2268

1.1338

2.38

3

3

9

20

1.48

2.1791

6.5374

4.43

1

4

4

21

2.48

6.1315

6.1315

2.48

23.2381

18.57

Frecuencia fi

Xi

fi*Xi

0

3

0

1

9

1

2

5

3 4

# de Libros

21

_

_

32

Media =

_

_

| X

i

 X | * fi

1.52

Varianza =

1.1066

Desviación típica =

1.05

Media de las desviaciones medias =

0.88435

4.- Los siguientes datos representan el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. Calcular la varianza y la desviación típica.

Capitan

Frecuencia fi

Peso Xi

fi*Xi

Frecuencia Acumulada

Xi  X

(X i  X )2

( X i  X )2 * fi

A

1

64

64

1

-6

36

36

B

1

70

70

2

0

0

0

C

1

66

66

3

-4

16

16

D

1

80

80

4

10

100

100

4

_

280

Media =

70

Varianza =

38

Desviación típica =

_

_

152

91

6.16

5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:

Frecuencia

Marca de

Frecuencia

_

_

_ 2

2

EJERCICIOS N° 01 Se le pidió a un grupo de personas que marque la imagen de su bebida preferida, y los resultados fueron:

Cocacola Cocacola Pepsi Sprite fanta

Pepsi sprite fanta Pepsi

fanta Pepsi sprite fanta

sprite

cocola Cocacola

Pepsi Cocacola Cocacola sprite

Con los resultados obtenidos, elaborar una tabla de frecuencias. SOLUCION:

variable

Frecuenci a Absoluta

FANTA SPRITE PEPSI COCACOLA TOTAL

4 5 5 6 N = 20

Frecuencia Frecuencia Frec. acumulad relativa Relativa a acumulad a 4 0,20 0,20 9 0,25 0,45 14 0,25 0,70 20 0,30 1 1

La bebida elegida por la mayor cantidad de personas fue la Cocacola, mientras que la fanta fue elegida por la menor cantidad de personas

GRAFICO INCOMPLETO variable

Frecuencia absoluta

Frecuencia acumulada

Frecuencia Frec. Relativa relativa acumulada

DUFF SPRITE PEPSI COCACOLA

4

4 9 14 20

0,20

5

0,25 0,30

0,20 0,45 1 92

TOTAL

N = 20

1

GRAFICO DE BARRAS - POLIGONO DE FRECUENCIA

7 6 5 4

3 2 1 0 FANTA

SPRITE

PEPSI

COCACOLA

EJERCICIOS N° 02 Elaborar una tabla de frecuencias a partir de las temperaturas máximas registradas en el mes de agosto en la ciudad de Lima: Temperaturas: 17 18 20 16 19 17 16 20 20 15 18 16 19

15 18 15 18 19 17

16 17 16 17 18 15

19 18 19 18 20 19

Elaboramos una tabla de frecuencias, agregando la frecuencia porcentual y la frecuencia porcentual acumulada. SOLUCION: Tempera tura (°C)

Frecuencia Frecuenci Absoluta a acumulad a

Frecuen cia relativa

Frec. Relativa acumulada

Frec. porcentu al

Frec. % acumulad a

93

15 16 17 18 19 20 TOTAL

4 5 5 7 6 4 N =31

4 9 14 21 27 31 ---------

0,129 0,161 0,161 0,226 0,194 0,129 1

0,129 0,290 0,451 0,677 0,871 1 ----------

12,9 % 16,1% 16,1% 22,6% 19,4% 12,9% 100%

12,9% 29,0% 45,1% 67,7% 87,1% 100% --------

La Temperatura que se registró en una mayor cantidad de días es la T° de 18 grados que se registró en 22,6% de días, mientras que las T° menos evidenciadas fueron las de 15 grados y 20 grados, que se evidenciaron en un 12,9% de los dias

GRAFICO INCOMPLETO T° (°C)

15 16 17 18 19 20 TOTAL

Frecuencia Frecuencia Frecuencia Frec. Absoluta acumulad relativa Relativa a acumulad a 4 4 0,129 0,129 5 9 0,290 14 0,161 0,451 7 21 0,226 6 0,194 0,871 4 31 0,129 1 N =31 --------1 ----------

Frec. porcentual

Frec. % acumulad a

12,9 %

12,9% 29,0% 45,1%

16,1% 22,6% 19,4% 100%

87,1% 100% --------

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

8 7 6 5 4 3 2 1 0 15

16

17 fi

18

19

20

fi

94

EJERCICIOS N° 03 Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados: negro azul rojo negro

azul rojo amarillo azul

amarillo negro amarillo rojo

rojo amarillo azul negro

azul rojo rojo amarillo

Con los resultados obtenidos, elaborar una tabla de frecuencias. SOLUCION: variable color

Frecuencia Frecuencia Frecuencia Absoluta acumulad relativa a

Frec. Relativa acumulad a 0,20 0,45 0,70 1

NEGRO 4 4 0,20 AZUL 5 9 0,25 AMARILLO 5 14 0,25 ROJO 6 20 0,30 TOTAL N = 20 1 El color elegido por la mayor cantidad de personas fue el Rojo, mientras que el color negro fue elegido por la menor cantidad de personas. GRAFICO INCOMPLETO variable color

Frecuenci a absoluta

NEGRO AZUL AMARILLO ROJO TOTAL

4 5 5 N = 20

Frecuencia Frecuencia Frec. acumulad relativa Relativa a acumulad a 4 0,20 0,20 0,25 14 0,25 0,70 20 1 1

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

95

7 6 5 4 3 2 1 0 NEGRO

AZUL

AMARILLO

ROJO

EJERCICIOS N° 04 En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del mes de Setiembre. 0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3

Con los datos obtenidos, elaborar una tabla de frecuencias. Frecuencia Frecuencia Frecuencia Frec. Autos absoluta acumulada relativa Relativa vendidos acumulada 0 8 8 0,267 0,267 1 7 15 0,233 0,500 2 7 22 0,233 0,733 3 5 27 0,167 0,900 4 3 30 0,100 1 TOTAL N =30 1

Frecuencia Frecuencia porcentual porcentual acumulada 26,7 % 26,7 % 23,3 % 50,0% 23,3 % 73,3% 16,7 % 90,0% 10,0 % 100% 100 %

n =30 GRAFICO INCOMPLETO 96

Frecuencia Frecuencia Frecuencia Frec. Autos absoluta acumulada relativa Relativa vendidos acumulada 0 8 8 0,267 1 7 0,233 0,500 2 7 22 0,233 3 27 0,167 0,900 4 3 30 0,100 1 TOTAL N =30 1

Frecuencia Frecuencia porcentual porcentual acumulada 26,7 % 26,7 % 23,3 % 23,3 % 73,3% 16,7 % 90,0% 100% 100 %

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA 9 8 7 6 5 4 3 2 1 0 0

1

2 fi

3

4

fi

EJERCICIOS N° 05 Se recogen las hojas caídas de un árbol, y se registran sus longitudes en centímetros. Elaboramos una tabla de frecuencias con 4clases o Intervalo 1 4 8 11 16

1 5 8 12 16

2 6 9 12 18

3 6 10 13 18

3 6 10 15 20

SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 20 - 1=19 2. hallando n° de intervalos = K 97

El problema ya nos está dando el número de clase o intervalo = 4 3. hallando amplitud o tamaño de intervalo = A A= R/k = 19/4 =4,75 REDONDEANDO = 5

variable longitudes

Marcas de clase

Frecuencia Frecuencia absoluta acumulada

[0-5) [5-10) [10-15) [15-20] TOTAL

2,5 7,5 12,5 17,5

6 7 6 6 25

6 13 19 25

Frecuencia Frec. relativa Relativa acumulad a 0,24 0,24 0,28 0,52 0,24 0,76 0,24 1 1

n=25 Podemos ver que la Clase o Intervalo con un mayor de cantidad de valores es la segunda clase o intervalo [5-10),en donde tenemos una mayor cantidad de hojas caídas del árbol.

GRAFICO INCOMPLETO variable longitudes

Marcas de clase

Frecuencia Frecuencia absoluta acumulada

[0-5) [5-10) [10-15) [15-20] TOTAL

2,5 7,5

6

17,5

6 6 25

6 13 25

Frecuencia Frec. relativa Relativa acumulad a 0,24 0,24 0,28 0,52 0,24 0,24 1 1

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

98

7.2 7 6.8 6.6 6.4 6.2 6 5.8 5.6 5.4 2,5

7,5

12,5

17,5

EJERCICIOS N° 06 Una compañía telefónica registra la duración (en minutos) de las llamadas que recibe en su call center. Elabore una tabla de frecuencia con los resultados

Duración de las llamadas : 0,1 3,4 5,1 7,2

0,4 3,9 5,3 8,1

1,6 4,5 5,5 9,4

2,6 4,8 5,6 9,9

3,3 4,8 5,9 9,9

Elabore una tabla de frecuencias con los resultados obtenidos.

SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 9,9 – 0,1= 9,8 2. hallando n° de intervalos = K Aplicando regla de Strugges: K = 1+3,322logn = 1+3,322.log20 (donde n es igual al número de datos) = 5.32 , para poder trabajar mejor redondeamos y tenemos 5 99

3. hallando amplitud o tamaño de intervalo = A A= R/k = 9,8/5 = 1,96 REDONDEANDO = 2

variable duración

Marcas de clase

[0-2) [2-4) (4-6) (6-8) [8-10] TOTAL

1 3 5 7 9 -------

Frecuencia Frecuencia Frecuencia Frecuencia frecuencia Frecuencia absoluta acumulad relativa relativa porcentual porcentual a acumulad acumul a 3 3 0,15 0,15 15% 15% 4 7 0,20 0,35 20% 35% 8 15 0,40 0,75 40% 75% 1 16 0,05 0,80 5% 80% 4 20 0,20 1 20% 100% 20 -----1 ------100% -------n=20

La clase o categoría con una mayor cantidad de valores fue la [4-6), con 8 valores, con 40% del total de los datos, mientras que la clase o categoría con una menor cantidad de valores fue la [6-8) con solo 1 valor y 0,05 del total de los datos GRAFICO INCOMPLETO variabl e duració n [0-2) [2-4) (4-6) (6-8) [8-10] TOTAL

Marcas de clase

1 3 5 7 9 -------

Frecuencia Frecuencia Frecuencia Frecuencia frecuencia Frecuencia absoluta acumulad relativa relativa porcentual porcentual a acumulad acumul a 3 3 0,15 0,15 15% 15% 7 0,20 20% 8 15 0,40 0,75 40% 75% 1 0,05 0,80 80% 4 20 0,20 1 20% 100% 20 -----1 ------100% --------

100

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

9 8 7 6 5 4 3 2 1 0 1

3

5 fi

7

9

fi

EJERCICIOS N° 07 Las notas de 35 alumnos en el examen final de estadística, calificado del 0 al 10, son las siguientes: 0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8; 8; 8; 9; 10; 10. Con los datos obtenidos, elaborar una tabla de frecuencias con 5 intervalos o clases. SOLUCION:

CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 10-0 =10 2. hallando n° de intervalos = K El enunciado del problema me dice 5 intervalos, entonces K =5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 10/5 = 2 101

Intervalo

Marca de clase

Frecuencia absoluta

Frecuencia acumulada

Frecuencia relativa

[0-2) [2-4) [4-6) [6-8) [8-10) TOTAL

1 3 5 6 9

8 7 8 6 6 35

8 15 23 29 35

0,229 0,200 0,229 0.171 0,171 1

Frec. Relativa acumulada 0,229 0,429 0,658 0,829 1

n =35 GRAFICO INCOMPLETO Intervalo

Marca de clase

Frecuencia absoluta

Frecuencia acumulada

Frecuencia relativa

[0-2) [2-4) [4-6) [6-8) [8-10) TOTAL

1 3 5 6 9

8

8 15 23

0,229 0,200 0,229 0.171

8 6

35 35

Frec. Relativa acumulada 0,229 0,658 0,829 1

1

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

102

9 8 7 6 5 4 3 2 1 0 1

3

5 fi

6

9

fi

EJERCICIOS N° 08 Un grupo de atletas se está preparando para una maratón siguiendo una dieta muy estricta. A continuación, viene el peso en kilogramos que ha logrado bajar cada atleta gracias a la dieta y ejercicios. 0,2 4,6 6,4 12,1

8,4 9,1 15,2 9,6

14,3 4,3 16,1 8,7

6,5 3,5 19,8 12,1

3,4 1,5 5,4 3,2

Elabore una tabla de frecuencias con los resultados obtenidos. SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min =19,8-0,2=19,6 2. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log20 (donde n es igual al número de datos) = 5,32 103

para poder trabajar mejor redondeamos y tenemos 5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 19,6/5 = 3,92 redondeando = 4 Intervalo

Marca de clase

[0-4) 2 [4-8) 6 [8-12) 10 [12-16) 14 [16-20) 18 TOTAL GRAFICO INCOMPLETO

Frecuencia absoluta

Frecuencia acumulada

Frecuencia relativa

5 5 4 4 2 20

5 10 14 18 20

0,25 0,25 0,20 0,20 0,10 1

Intervalo

Marca de clase

Frecuencia absoluta

Frecuencia acumulada

Frecuencia relativa

[0-4) [4-8) [8-12) [12-16) [16-20) TOTAL

2 6 10

5

5 10

0,25 0,25 0,20

4 4

18

18 20

20

0,10 1

Frec. Relativa acumulada 0,25 0,50 0,70 0,90 1

Frec. Relativa acumulada 0,25 0,50 0,90 1

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

104

6 5 4

3 2 1 0 2

6

10 fi

14

18

fi

EJERCICIOS N° 09 Una tienda en línea registra el tiempo que tarda la empresa de correos en hacer llegar su mercadería a los clientes. Los tiempos en días registrados son los siguientes: 2 22 13 20

7 6 32 13

10 25 13 6

16 5 29 12

19 20 18 35

Con los datos obtenidos, elaborar una tabla de frecuencias. SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min =35-2 =33 2. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log20 (donde n es igual al número de datos) = 5,32 para poder trabajar mejor redondeamos y tenemos 5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 33/5 = 6,6 = 7

Intervalo

Marca de

Frecuencia

Frecuencia

Frecuencia

Frec. 105

[0-7) [7-14) [14-21) [21-28) [28-35) TOTAL

clase

absoluta

acumulada

relativa

Relativa acumulada 0.2 0.5 0.75 0.85 1

3.5 10.5 17.5 24.5 31.5

4 6 5 2 3 20

4 10 15 17 20

0.2 0.3 0.25 0.1 0.15 1

Frecuencia absoluta

Frecuencia acumulada

Frecuencia relativa

4 6 5 2 3 20

4 10

0.2 0.3 0.25

GRAFICO INCOMPLETO Intervalo

[0-7) [7-14) [14-21) [21-28) [28-35) TOTAL

Marca de clase

10.5 24.5 31.5

17 20

0.15 1

Frec. Relativa acumulada 0.2 0.75 0.85 1

n=20 GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

7 6 5 4 3 2 1 0 3.5

10.5

17.5 fi

24.5

31.5

fi

106

EJERCICIOS N° 10 Se ha recolectado los pesos en kilos de un grupo de personas. Elaborar una tabla de distribución de frecuencias con intervalos 63 60 58 64

62 62 62 61

60 63 63 56

58 62 60 59

60 61 56 61

62 59 63 59

63 61 62 65

61 62 58 62

60 65 54 61

55 60 63 63

58 60 62 63

58 61 62 63

59 61 62 64

59 61 62 65

59 61 62 65

SOLUCION: Ordenando los datos de menor a mayor 54 60 61 63

55 60 61 63

56 60 62 63

56 60 62 63

58 60 62 63

CONSTRUYENDO INTERVALOS: 4. hallando rango = R R= X max - X min = 65 – 54= 11 5. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log40 (donde n es igual al número de datos) = 6,28679791 para poder trabajar mejor redondeamos y tenemos 6 6. hallando amplitud o tamaño de intervalo = A A= R/k = 11/6 = 1,8333

REDONDEANDO = 2

Interval o

Marca de clase (Xi)

f.absolut a ( fi)

f.relativa (hi)

f.relativa acumulada (Hi)

[54-56) [56-58)

55 57

2 2

0,05 0,05

0,05 0,1

f.relativa porcentual simple (hi %) 5% 5%

f.relativa porcentual acumulado (Hi %) 5% 10 107

[58-60) [60-62) [62-64) [64-66) TOTAL

59 61 63 65 -------

6 12 15 3 40

0,15 0,3 0,375 0,075 1

0,25 0,55 0,925 1 -------

15% 30% 37,5 % 7,5% 100%

25 55 92,5 100 -------

f.relativa porcentual simple (hi %) 5% 5% 15% 30%

f.relativa porcentual acumulado (Hi %) 5%

n=40 GRAFICO INCOMPLETO Interval o [54-56) [56-58) [60-62) [62-64) [64-66) TOTAL

Marca de clase (Xi)

f.absolut a ( fi)

f.relativa (hi)

f.relativa acumulada (Hi)

55 57 59 61 63 65 -------

2 2 6

0,05

0,05 0,1 0,25

0,15 0,3 0,375 0,075 1

15 3 40

0,925 1 -------

25 % 55 % 92,5 % 100 % -------

7,5% 100%

GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA

16 14 12 10

8 6 4 2 0 55

57

59

61

fi

63

65

fi

108