ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO PROFESIONAL HÉROE NACIONAL CAPITÁN PNP “ALIPIO PONCE VASQUEZ” PUENTE PIEDRA – LIMA
Views 113 Downloads 1 File size 1MB
ESCUELA DE EDUCACIÓN SUPERIOR TÉCNICO PROFESIONAL HÉROE NACIONAL CAPITÁN PNP “ALIPIO PONCE VASQUEZ” PUENTE PIEDRA – LIMA
SILABUS DESARROLLADO DE LA ASIGNATURA “ ESTADISTICA ” PROMOCION 2019 – II “INTEGRIDAD ”
2020
1
SILABUS ESTADISTICA I. DATOS GENERALES ASIGNATURA : ESTADISTICA EJE CURRICULAR : Formación Técnico Profesional Policial AREA COGNITIVA : Formación Académica del Programa Regular HORAS SEMESTRALES: 48 horas académicas HORAS SEMANALES : 03 Horas DIA Y HORA : LUNES 10.40– 13.20 PERIDO ACADEMICO : II PERIODO ACADEMICO PROMOCION 2019 – II “INTEGRIDAD ” II. PRESENTACION La presente asignatura aporta al perfil del Técnico Profesional en el curso de ESTADISTICA como recopilación, organización, presentación, análisis e interpretación de datos y su utilización, análisis interpretación de datos y su utilización en la toma de decisiones. Calculo de las medidas de tendencia central y de dispersión y una Introducción a probabilidades aplicados a la función policial. Nociones de análisis combinatorio. III. OBJETIVOS GENERALES:
Proporcionar los métodos y procedimientos para el análisis de datos. Proporcionar los conocimientos básicos del diseño de experimentos Usar los métodos estadísticos en la toma de decisiones Aplicaciones a la función Policial.
III . OBJETIVOS ESPECIFICOS: Al finalizar el curso los alumnos de la Promoción “INTEGRIDAD “ deben conocer:
Recopilar organizar y presentar datos. Calcular las medidas de tendencia central y de dispersión y aplicar a la función Policial. Analizar e interpretar resultados a problemas de aplicación a ala función Policial.
IV METODOLOGIA : El desarrollo del curso se basa en la participación activa de los alumnos mediante el desarrollo de problemas aplicados a la 2
actividad policial.. Las clases teóricas se complementaran con las prácticas y talleres dirigidas.
V. CONTENIDOS. CONTENIDOS
I UNIDAD CONCEPTOS BASICO DE LA ESTADISTICA DEFINICION DE VARIABLES
SESIÓN 1 PRIMERA SEMANA
Presentación de la Asignatura. Conceptos básicos Estadística Descriptiva Estadística Inferencial, Población, muestra
(03 hrs) 18MAY2020
SESIÓN 2 SEGUNDA SEMANA (03 hrs) 25MAY2020
Definición de variables clasificación de variables Variables Cualitativa. Variables Cuantitativa. Valor Estadístico. Sumatorias simples
COMPETENCIA Comprender los conceptos básicos de la Estadística descriptiva como inferencial, población, muestra, definición de variables, tanto cualitativas como cuantitativas. Reconoce, describe, analiza, expresa, clasifica y formaliza los conceptos de la estadística tanto descriptiva como inferencial. Identifica el contenido del curso Diferencia los conceptos y teorías Estadísticas. Reconoce que es una población y una muestra.
Clasifica los distintos tipos de variables, así como clasifica las nomenclaturas Estadísticas. Muestra interés en conocer los tipos y clases de variables. Discrimina los distintos tipos de variables, así como clasifica las nomenclaturas estadísticas
3
SESIÓN 3
TERCERA SEMANA
Práctica calificada de recopilación, tabulación de datos Presentación de datos
Toma de datos primarios y Secundarios. Interpreta los datos como fuentes de proyección. Utiliza sus datos para su análisis.
(03 hrs) 01JUN2020
SESIÓN 4
CUARTA SEMANA
Tabla de distribución de frecuencias para una variable cualitativa.
(03 hrs)
Utiliza agrupación de frecuencias absolutas y relativas simples. Prepara cuadro de distribución de frecuencias Ordena califica los datos y su periodicidad.
08JUN2020
II UNIDAD DISTRIBUCIÓN DE FRECUENCIAS, REPRESENTACIONES GRÁFICAS. SESIÓN 5 QUINTA SEMANA
Recopilación, tabulación de datos Presentación de datos
COMPETENCIA Prepara cuadro de distribución de frecuencias.
Conoce y utiliza sus datos para su análisis. Infiere datos sobre medidas tendencia central para datos agrupados y no agrupados
(03 hrs) 0106JUN20
4
SEXTA SEMANA
SESIÓN 6
(03 hrs)
Práctica dirigida de Distribución de frecuencias para una variable cuantitativa y cualitativa
05-20JUN20
SEPTIMA SEMANA
Conoce y comprende la agrupación de frecuencias absolutas y relativas simples y acumuladas Prepara cuadro de distribución de frecuencias. Ordena, clasifica los datos y su periodicidad.
SESIÓN 7
1ER EXAMEN PARCIAL
(03 hrs) 29JUN2020
OCTAVA SEMANA (03 hrs) 06JUL2020
OCTAVA 8
Estadística gráfica de barras. Estadística grafica de histogramas de frecuencia y polígonos de frecuencia.
Conoce gráficos estadísticos y su clasificación. Uso de cuadros estadísticos. Realiza y describe con precisión cuadros estadísticos.
NOVENA SEMANA (03 hrs)
NOVENA 9
Práctica calificada Taller de Repaso.
13JUL2020
5
III UNIDAD MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN
DECIMA SEMANA
Media aritmética propiedades. Mediana propiedades. Datos originales
(03 hrs)
COMPETENCIA Organizar los graficos estadígrafos de tendencia central en la presentación de de diversos datos frente a la realidad del campo policial, manifestando confianza y perseverancia en su aprendizaje. Conoce y aplicar y resolver con claridad ejercicios. Identifica las propiedades de media aritmética y mediana. Interpreta el valor central
20 JUL 20
DÉCIMA PRIMERA SEMANA
SESIÓN 11
Moda propiedades. Práctica Calificada.
(03 hrs)
Aplica y resuelve con claridad ejercicios Resuelve problema propuestos de cálculo con precisión.
27JUL20 SEGUNDA EVALUACION PARCIAL DÉCIMA SEGUNDA SEMANA (03hrs) 03AGO20
6
DÉCIMA TERCERA SEMANA
SESIÓN 13
Cuantiles Deciles y percentiles Datos no agrupados y agrupados
Identifica la diferencia de datos originales y agrupados
(04 hrs) 10AGO20
DÉCIMA CUARTA SEMANA (04 hrs)
SESIÓN 14
La Varianza Desviación media. Definiciones y propiedades Coeficiente de variación
17AGO20
DÉCIMA
SESIÓN 15
QUINTA
SUSTENTACION DE TRABAJOS APLICATIVOS
SEMANA
Identifica y contrasta las formulas con los resultados. Analiza e interpreta la separación de datos. Resuelve con precisión en sus cálculos. Resuelve casos y relaciona y decide la variación de datos.
(04 hrs) 24AGO20 DÉCIMA SEXTA
SESIÓN 16 EVALUACION FINAL
SEMANA (04 hrs) 31AGO AL 05SET2020
7
VII. EVALUACIÓN La asistencia a las sesiones es obligatoria en un 100%, salvo situación de servicio, lo que se informará al Departamento Académico (DACA). El proceso de evaluación del aprendizaje será permanente, comprenderá: A. Evaluación Diagnóstica o de Entrada para valorar el nivel de conocimiento de la asignatura. B. Evaluación Formativa Interactiva, en relación a la participación activa del Alumno (a) en el aula. El promedio de las intervenciones orales constituirá Nota de Paso Oral. C. Evaluación Formativa o de Proceso para comprobar el rendimiento académico, pronosticar posibilidades de desarrollo de los Alumnos (a) y reorientar la metodología, para lo cual se aplicará: 1. Prácticas Calificadas, pruebas orales 2. Dos exámenes escritos parciales (7º y 12º semana), enmarcados en los modelos de las Pruebas que son propias de la naturaleza de la Asignatura. 3. Un examen final (16º semana), B. Evaluación Sumativa para comprobar el nivel de desarrollo cognitivo, reflexivo y del pensamiento lógico, para lo cual se aplicará un examen final (16º semana), de similar característica empleada en los exámenes parciales. C. El Promedio General se calculará en concordancia con las disposiciones establecidas en el Manual de Régimen de Educación de las Escuelas de Formación de la PNP y con la naturaleza de la asignatura, conforme se detalla a continuación: Promedio General: PG = [(PEP (3) + PO (1) + TA (2) +EF (4) ] /10 PEP PO TA EF
VI.
= = = =
Promedio de Exámenes Parciales Prueba Oral Trabajo aplicativo Examen Final
BIBLIOGRAFIA ESTADISTICA : M.R. Spiegel ESTADIST5ICA ELEMENTAL : Jhnson - Kuby ESTADISTICA APLICADA : C Martinez ESTASDISTICA EDITORIAL SAN MARCOS
8
CAPITULO 1 INTRODUCCION. Este primer capítulo tiene por objetivo presentar algunos conceptos básicos de estadística, así como de sumatorias simples y dobles los cuales se van a utilizar con frecuencia para una mejor comprensión de los capítulos siguientes. 1.1 ESTADISTICA Es una ciencia que proporciona métodos para el análisis de datos, cuando Estos por su naturaleza presentan incertidumbre en la toma de decisión. Otra definición es: Es una matemática aplicada para el análisis de datos. Es el estudio de los fenómenos aleatorios. 1.2 RAMAS DE LA ESTADISTICA La estadística se divide en dos ramas: ESTADISTICA DESCRIPTIVA Es la parte de la estadística que consiste en la recolección, organización, presentación y el análisis de datos .
ESTADISTICA INFERENCIAL Es la parte de la estadística que consiste en tomar decisiones sobre el comportamiento de una variable de interés de una población estadística en estudio; utilizando para tal objetivo una muestra al azar. Es decir a partir de los resultados obtenidos al procesar los datos de una muestra se generaliza el resultado de dicha variable en la población, con un cierto riesgo que es cuantificado por la teoría de la probabilidad. La estadística inferencial proporciona métodos para el análisis de datos. 1.3 CONCEPTOS BASICOS 1.3.1 Población Es la totalidad de unidades elementales (personas o cosas) sujeto a estudio y que poseen una característica común, al tamaño de la población (número de unidades elementales) se simboliza con la letra mayúscula “N” Una población en estudio puede ser finita (Se puede enumerar sus Elementos) o infinita (no se pueden enumerar sus elementos) Ejemplos: a.- Todas las tiendas que se dedican a la venta de gas en el distrito de la Molina en el año 2019 (N= 850) b.- Todos los establos de ganado vacuno en el departamento de Cajamarca en el I semestre del 2019 ( N= 2350 ) c.- Todos los alumnos matriculados en el semestre 2019 –I d.- Todos los Cadetes de la Escuela de Oficiales de la PNP, en el proceso de formación en el año 2015. (N= 788) e.- Todas las multas impuesta por la PNP por infringir al Reglamento Nacional de Transito durante el mes de setiembre del año 2019 (N= 1 679) f.- Todos los usuarios que concurren a la Biblioteca de letras y Ciencias Humanas de la UNMSM, un día cualquiera (N= 1742) 9
1.3.2 Unidad Elemental Es cada uno de los elementos que conforman la población en estudios, de la cual se requiere información . De una unidad elemental se define muchas variables de interés para el investigador ejemplo: a) Una población que se dedica a la venta de gas en el distrito de la molina Dato u observación.Es el valor (atributo, conteo o medición) que forma la variable de interés en la unidad elemental. Los valores que se toma una variable en particular x, se representa con letras minúsculas acompañadas por subíndice, es decir , X = ( X 1 , X2 , X 3 ………………… X n ) X i = valor que toma la variable x en la i-esima observación 1.3.4 Variable Es una característica de interés que se desea analizar de una unidad Elemental. La variable en estudios la fija el investigador, el valor que toma la variable ( dato u Observación ) cambia de unidad elemental a otra. A una variable se le simboliza universalmente con las ultimas letras del Abecedario, tales como x, y, z , o también letras mayúsculas acompañada con subíndice, tales como : x1 , x2 , …….. x k Ejemplo de variables en estudio: a.- X= Montos ( s/ ) por venta diaria de balones de gas b.- Y= Cantidad de ganado vacuno en un establo c.- z= Color de ojos de los Cadetes de la EO- PNP d.- W= Volumen (cm 3) del contenido de botella de gaseosa e.- T= Tiempo (minutos) que permanece un usuario en un cajero Automático. 1.3.5 Tipos de variables: De acuerdo a los valores que toma la variable en estudio, se clasifican en: Variable Cualitativa.Cuando los valores que toma la variable en estudio provienen de una cualidad o atributo, se divide a su vez en nominal y jerárquica (ordinal).
*
Variable Cualitativa Nominal.Una variable se considera cualitativa nominal cuando con los valores que Forma esta variable no es posible establecer un orden de acuerdo a su importancia. Ejemplos: a. X= color de los ojos de los alumnos – PNP b. Y= Preferencias a determinadas marcas de jabones de tocados por las alumnas femeninas. c. Z= Sexo de los alumnos –PNP Variable Cualitativa Jerárquica.Una variable se considera cualitativa jerárquica cuando los valores cuando los valores que toma la variable en estudio es posible establecer un orden 10
de acuerdo a su importancia (ascendentemente o descendentemente) Ejemplos: a.- X= Grados Académicos de los Docentes de la Facultad de Ingeniería de Sistema de la Universidad Mayor de San Marcos, bachiller, magister b- Y= Grados del personal de Oficiales de la Policía Nacional del Perú Teniente General, General, Coronel, Comandante, Mayor, Capitán, Teniente, Alférez. c.- Z= Clase social: alta, media, baja. * Variable Cuantitativa Los valores que toma la variable provienen de un conteo o de una medición instrumento de medida, metro, balanza, cronometro, termómetro etc) . Se divide a su vez: Variable Cuantitativa Discreta Una variable se considera cuantitativa discreta cuando los valores que toma la variable provienen de un conteo . También se dice que los valores que toma esta variable están asociados a los números enteros. Ejemplos: a. X = Numero de gusanos por hoja b. Y = Número de hijos por familia c. Z = Número de accidentes diarios de transito registrados durante un mes determinado. d. T= Numero de artículos de las revistas científicas.
* Variable Cuantitativa Continua.Una variable se considera cuantitativa continua cuando los valores que toma la variable provienen de una medición, es decir, los valores que toma se encuentran en un intervalo. También se dice que los valores que toma esta variable están asociados a los números reales. Ejemplos: a. X= Tiempo de vida (hora) de baterías para automóviles b. Y= Edad (años) de los alumnos matriculados en el presente año Académico . c. Z = Estatura (mts) de los alumnos –PNP. 1.3.6 Muestra Es una parte representativa de la población estadística en estudio o también se dice que es un subconjunto de unidades elementales de la población . Al tamaño de la muestra se le representa con la letra minúscula “n” Se dice que una muestra es aleatoria o al azar , cuando todos los Elementos de la población tienen la misma probabilidad de ser parte de la muestra.
11
Muestreo.- Es el procedimiento para obtener una muestra representativa de la población en estudio . 1.3.7 Parámetro.Es un valor fijo que caracteriza a la variable de interés en la población en estudio. Para conocer este valor se requiere tener Todos los datos de la variable en la población por lo general este valor casi nunca se conoce el objetivo de investigador es estimarlo a través de una muestra aleatoria .Los parámetros más usados son 1. La media aritmética 2. La mediana 3. La Moda 4. La media Geométrica 5. La media Armónica 6. La varianza 7. La Desviación Estándar 8. Coeficiente de variación 1.3.8 Valor Estadístico o estimado Es un valor calculado con los datos de la muestra aleatoria y se Supone estima al valor del parámetro de la variable en estudio en la Población .Este valor cambia de una muestra a otra muestra. La formula permite calcular el valor estadístico, recibe el nombre de Estimador o estadística . Los valores estadísticos más utilizados son: a. La media aritmética b. La mediana c . La Moda d. La media Geométrica e. La media Armónica f. La varianza g. La Desviación Estándar h. Coeficiente de variación 1.4 Ejercicios resueltos Ejemplo -1 En Lima Metropolitana se toma una muestra aleatoria de 30 grifos que se dedican a la venta de combustible de un día determinado, se obtiene en siguiente resultado, el monto de venta diaria promedio de s/ 12 600.50 con esta información identificar población estadística, unidad elemental, variable en estudio, tipo de variable, un posible dato, tamaño de la muestra, parámetro y estimado o valor estadístico. Solución: Población estadística
: Todos los grifos de Lima Metropolitana, que se 12
dedican a la venta de combustible . Unidad elemental : Un grifo de Lima Metropolitana, que se dedican a la venta de combustible. Variable en estudio : Monto por venta ( s / ) diaria de combustible Tipo de variable : Variable cuantitativa continua Dato u observación : s/ 12 600.50 Tamaño de la muestra : 30 grifos Parámetro : No se conoce el monto promedio por venta diaria en la población . Dato estadístico : s/ 12 600.50. Ejemplo -2 De una población de 2 042 revistas científicas de biología, el 41,63% están escritas en idioma inglés, Una muestra aleatoria de 50 revistas arroja que el 42.12% están escritas en inglés, el promedio de artículos por revistas es de 12,4 .Con esta información identificar, población unidad elemental, variables, en estudios, tipos de variables, posibles datos, tamaño de la muestra, parámetro y estimado o valor estadístico. Solución: Población estadística: Todas las revistas científicas de biología N=2 042 Unidad elemental : Una revista científica de biología Tamaño de la muestra:50 revista científicas de biología
Variable estudio
en Tipos variables
Idioma de la revista Número de artículos
de Datos u Parámetro observaciones
Cualitativa Nominal Cuantitativa Discreta
Español Ingles Portugués 12,16, 8, 9 etc
41,63% Se desconoce
Estimador o valor estadístico 42,12% 12, artículos
4
1.5 Ejercicios Propuestos.En cada uno de los siguientes enunciados identificar de ser posible , la población ,unidad elemental, variables en estudio, tipos de variables, tamaño de la muestra , valores estadísticos, parámetros, y un ejemplo de dato en cada caso : 1. De una población de 1000 alumnos PNP, se elige una Muestra aleatoria de 25 cadetes, arrojando la siguiente información : el 98.4% son varones , la estatura promedio es d 1,69 mts, el gasto semanal promedio por cafetería es de s/ 35.8 el 30% se encuentran en el 5to año de estudio2. Una muestra aleatoria de 30 recién nacidos en la Maternidad de Lima Arroja un peso promedio de 3.50 Kg. 13
3. Una muestra aleatoria de 550 peruanos mayores de 18 años arroja que el 30% está de acuerdo con las medidas económicas anunciados por el gobierno hace uno días . 4. Para analizar la posibilidad de lanzar al mercado una nueva marca de cigarrillos, se efectuó una encuesta entre fumadores que transitan por la quinta cuadra de la av. Canadá entre las 5 P.m. y 8 P.m. del día 14 de febrero, para ello se seleccionó en forma aleatoria a 80 fumadores obteniéndose los siguientes resultados : el 65% prefiere los cigarrillos importados que los nacionales y el precio promedio que pagan al comprador una cajetilla es de s/ 7.40. 1.6 SUMATORIAS SIMPLES DOBLES Y NOTACION PUNTUAL 1,7,1 SUMATORIAS SIMPLES. Sea x, una variable en estudio que toma valores x 1 x 1 ……..xn , la Suma de los valores x 1 + x 2 +……….+xn , se representa mediante el n
operador matemático ∑ xi ; que significa sumar todos los valores x i i=1
para “ i ” que toma valores enteros positivos consecutivos desde 1 hasta n, es decir : n
X 1 + x 2+ ……. x n
∑ xi ; i=1
Ejemplos : 1.Desarrollar las siguientes sumatorias 5
∑ x 2i + 1 = x 3 + x 5 + …… x11 i=1
6
2
2
2
2
∑ x2 = x 2 + x 4 + ……+ x12 i=1 4
∑ 2x i +1 = 2x 2 + 2x3+ ……… 2x 5 y5 y9 i=1 y 2i+1 y 3 2.- Supongamos que una variable X toma los siguientes valores X1 = 7 x 2= 9 x3 = 5 x 4 = 6 Calcular : 4
14
∑ 2x 2 i + 3 = 2( 7 )2 +3 + 2 (9) 2 + 3 ( 5) 2 +3 + 2 ( 6)2 +3 7-2 9-2 5-2 6-2 i=1 x i – 2 4
∑ 2x 2 i + 3 = 20.2 + 23.57 +17.67 + 18.75 = 80.19 i=1 x i – 2
CAPITULO 2 ORGANIZACIÓN DE DATOS INTRODUCCION Tiene por objetivo presentar los datos obtenidos de una población o muestra para una o más variables en estudio, en tablas de distribución de frecuencias y sus correspondientes gráficos .Con la finalidad de resumir la información para que sea de fácil interpretación y análisis. 2.1 ORGANIZACIÓN DE DATOS Los datos obtenidos de una población o muestra, para el estudio de una Variable de interés, conducen muchas veces a una gran cantidad de números o atributos , los cuales al intentar analizarlos en su forma original presentan dificultad en cuanto a su interpretación y análisis .Existe muchas interrogantes sobre la estructura de los datos tales como : a. Que categoría se presenta con mayor o menor frecuencia. b. Cuál es la distribución empírica de estos datos con respecto a la población (simétrica o asimétrica) c. Qué medidas resumen al conjunto de datos. Estas interrogantes se resuelven si los datos son organizados y Representados en tablas de distribución de frecuencias (inivariadas bivariadas) . Una tabla de distribución de frecuencias es un arreglo rectangular en filas y columnas en la cual los datos de una muestra o población son resumidos. En la primera fila de la tabla se colocan, el nombre de las variables en estudio , la frecuencia absoluta, frecuencia relativa , la frecuencia absoluta acumulada , frecuencia relativa acumulada y la marca de clase solo para variables cuantitativa continuas.
15
TITULO
Variable en estudio Clas -1 Clas-2
Frecuencia absoluta
Frecuencia relativa
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
Marca clase
de
Clas-k Total LEYENDA: FUENTE :
2,2 ELEMENTOS DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS.
TITULO Se coloca en la parte superior central de la tabla, el titulo debe ser, claro preciso, y conciso y guarde relación con la variable que se estudia. FUENTE Se coloca en la parte inferior de la tabla y corresponde al nombre de la entidad o literatura de donde se obtuvo la información, debe incluir la fecha si es posible, si el mismo investigador es autor de dicha información, debe colocar fuente propia . LEYENDA Se coloca delante de la fuente y corresponde a una nota o aclaración con respecto al contenido de la tabla. CLASE Se considera clase a una cualidad, un numero o intervalo, las clases para una tabla de distribución de frecuencia , deben ser mutuamente excluyentes, es decir . un dato solo puede pertenecer a una determinada clase. Al Numero de clases de una tabla se le representa por la letra “K” Si existe una gran cantidad de datos discretos o continuos, el número de Clase debe encontrarse entre 5 y 15 . Un número pequeño de clases puede ocultar la distribución real del conjunto de datos, mientras que un Número muy grande puede dejar sin observaciones algunas de las clases Limitando de esta forma su uso.
FRECUENCIA ABSOLUTA Su valor indica el número de veces que los datos de la muestra caen en una determinada clase .se representa por fi Para una muestra de tamaño “n” y con
16
“ k “ clase se cumple que la sumatoria de todas las frecuencias absolutas es igual a “n” es decir :
k
∑ fi =n i=1
Siendo f i = valor que toma la frecuencia absoluta en la i-esima clase n = tamaño de la muestra k= número de clase FRECUENCIA RELATIVA Su valor indica la proporción o porcentaje de la muestra contenida en la clase. Se representa por h i y se obtiene al dividir la frecuencia absoluta por el tamaño de la muestra, es decir : h i = f i ( en proporción ) n
h i = f i x 100 % ( en porcentaje ) n En ambos casos se cumple que : Nota
k
∑ f i = h i = 1 o 100% i=1
FRECUENCIA ABSOLUTA ACUMULADA Se obtiene al acumular los valores de las frecuencias absolutas para cada clase. Un valor cualquiera indica que parte de la muestra , tiene valores menores o iguales al valor que toma la variable en estudio .Se presenta por F i y se obtiene por k
F= ∑ f i =
i=
1 ,2,…….K
i=1
k
Nota
F= ∑ f i = n i=1
El valor de F k nos indica la cantidad de datos menores o iguales al valor de iesima clase. FRECUENCIA RELATIVA ACUMULADA
17
Se obtiene al acumular los valores de las frecuencias relativas para cada clase.Su valor indica la proporción o porcentaje de la muestra que tiene valores menores o iguales al valor de la variable. Se representa por H i. También se obtiene dividiendo cada valor de la frecuencia acumulada absoluta por el tamaño de la muestra, es decir:
2.3
H = F i = 1,2,……….. k n Nota: H k = 1 o 100% El valor de H K nos indica la proporción o porcentaje de datos , menores o iguales al valor de la i- esima clase MARCA DE CLASE El concepto de marca de clase solo se usa cuando se elabora una tabla de distribución de frecuencias para una variable cuantitativa continua , y su interpretación matemática corresponde al punto medio para una determinada clase . Estadísticamente corresponde al valor representativo para todos los datos que caen en esa clase .Se calcula usando la formula
X i = Límite inferior + límite superior 2 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUALITATIVA. Cuando los datos corresponde a una variable cualitativa ( Nominal o jerárquica ) la tabla de distribución de frecuencia tiene la siguiente forma TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO 1 Variable fi hi 2 C1 f1 h1 3 C2 f2 h2 k
C TOTAL
fk N
hk 1
FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C i corresponde a los valores que toma la variable ( clase) , Si la variable es nominal no existe un orden entre sus valores, en cambio si la variable en estudios es jerárquica debe tomarse en cuenta el orden de sus valores, ya sea en forma ascendente y descendente. Para esta variable se presentan algunos tipos de gráficos, pero los más frecuentes es el grafico de barras verticales u horizontales , grafico circular gráfico de líneas y graficas pictóricos . Ejemplo: Con la finalidad de estudiar la variable x= Preferencia a determinados Marcas de jabones de tocador por los alumnos -PNP, se toma una muestra aleatoria conformada por 30 alumnos , los resultados son : Rexona Palmolive rexona camay Palmolive lux Camay lux lux rexona camay lux 18
Camay rexona camay lux lux camay Lux camay rexona rexona camay lux lux camay Palmolive lux luz FUENTE PACOCHA S.A Para este ejemplo la tabla de distribución de frecuencias es : DISTRIBUCION DE FRECUENCIAS SOBRE PREFERENCIA A MARCAS DE JABONES DE TOCADOR POR LOS 30 alumnos -PNP i
Jabones de F h h% tocador 1 rexona 6 0.2 20% 2 camay 9 0,3 30% 3 lux 12 0,4 40% 4 palmolive 3 0,1 10% total 30 1.0 100% FUENTE : PACOCHA S.A Calcular e interpretar: f 2 : 9 alumnos encuestados prefieren el jabón de tocador camay h 2 : 30% de los alumnos encuestados prefieren el jabón de tocador Camay
GRAFICA DE BARRAS PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS alumnas FEMENINAS PNP
frecuencia absoluta f 12 9
6 3
rexona
camay
lux
palmolive
FUENTE PACOCHA S.A.
19
GRAFICA DE CIRCULAR PREFERENCIA DE MARCA DE JABONES DE TOCADOR POR LAS ALUMNAS FEMENINAS -PNP
frecuencia absoluta 3 6
10%
20% rexona camay lux
12
9
40%
palmolive
30%
2.4 TABLA DE DISTRIBUCION DE FRECUENCIAS PARA UNA VARIABLE CUANTITATIVA DISCRETA. Cuando los datos corresponden a una variable cuantitativa discreta la tabla de distribución de frecuencias tiene la siguiente forma : TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO Variable f h F H 1 C1 f1 h1 F1 H1 2 C2 f2 h2 F2 H2 K
Ck fk hk Fk Hk total n 1 FUENTE ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C1 corresponden a valores que toma las variables ( clase ) Ejemplo : Los siguientes datos corresponden a una muestra aleatoria de 50 tiendas Que se dedican a la venta de gas con la finalidad de analizar la variable Y= Número de balones de gas vendidos en un día determinado, los Resultados son : 21 21
23 22
24 24
23 22
24 24
21 25
24 26
23 25
24 24
22 23
22 23
24 21 20
23 23 22 24 26 26 22 23 22 24 21 22 23 25 26 24 22 25 24 25 21 26 25 24 Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos DISTRIBUCION DE FRECUENCIAS DEL NUMERO DE BALONES DE GAS VENDIDOS POR 5O TIENDAS
1 2 3 4 5 6
Variable 21 22 23 24 25 26
f 6 9 10 13 7 5 50
h 0,12 0,18 0,20 0,26 0,14 0,10 1.00
F 6 15 25 38 45 50
25 23
H 12 30 50 76 90 100
FUENTE: SOL GAS S.A Hallar e interpretar: f 3 = 10 significa que 10 tiendas , tienen una venta de 23 balones de gas h 3 = 20% significa que el 20% , de las tiendas tienen una venta de 23 balones de gas.
GRAFICA DE BASTONES 1º13 10 9 9
5 6
0 21
22
9
23
7
24
25
5
26
Fuente sol de gas
21
GRAFICA DE BARRAS
frecuencia Variable
26
25
24
23
22
21
f
13 10
9
7
6
1
2
3
4
5
5
6
2.5 TABLA DE DISTRIBUCION DE FRECUENCIA PARA UNA VARIABLE CUANTITATIVA CONTINUA Cuando los datos corresponden a una variable cuantitativa continua la tabla de distribución de frecuencias tiene la siguiente forma : TITULO CORRESPONDE A LA VARIABLE EN ESTUDIO Variable f h F H 1 C1 f1 h1 F1 H1 2 C2 f2 h2 F2 H2 K
Ck total
fk n
hk 1
Fk
Hk
FUENTE : ENTIDAD QUE PROPORCIONA LOS DATOS Los valores C 1 corresponde a valores que toma la variable ( clases ) Ejemplo : Una muestra aleatoria de tamaño n= 34, es tomada con la finalidad de estudiar La variable W = peso del recién nacido en la Maternidad de Lima .Los resultados en kg. Se presentan a continuación. 1.5 1.5 1,9 2.0 2,1 2,1 2.3 2.4 2,5 2,5 2,6 4.1 2.7 2.8 2.9 3,0 3,1 3,1 3,2 3,2 3,2 3,2 3.3 3,3 3.3 3.4 3.4 3,5 3,6 3,6 3,7 3,7 3,9 4.1 FUENTE : Maternidad de Lima 22
Elaborar la tabla de distribución de frecuencia y sus gráficos respectivos Cuando los datos pertenece a una variable cuantitativa continua, las clases C I Corresponde a intervalos de la forma [ a ; b > llamados intervalos de clases siendo a y b el límite inferior y superior respectivamente del intervalo de clase PROCEDIMIENTO PARA ELABORAR UNA TABLA DE FRECUENCIA PARA UNA MUESTRA DE TAMAÑO “n” a. Calculo de Rango “R” R = dato mayor – Datos Menor Para el cálculo de datos se tiene R= 4.1 – 1.5 = 2,6 b. Calculo del número de clase Para el cálculo del número de clase para una tabla de distribución de frecuencias se hará usando la regla de STURGES K = 1 +3.3 Log (n) K= 1 +3,.3 log 34 = 6.053 como el valor que toma K debe ser un numero entero , se usa el redondeo Simple k = 6 Observación.El redondeo simple significa, que si un numero tiene como primer decimal un número mayor o igual a 5 . Entonces la cifra entera del número se incrementa en una unidad. Ejemplo Si, k= 6.7 usando el redondeo simple k= 7 Si k = 6.4 usando el redondeo simple k = 6
c.-. CALCULO DEL ANCHO DEL INTERVALO DE CLASE ( C ) C= R K C= 2.6 = 0,4333 6 El valor que toma el (C ) debe de tener el mismo número de decimales de los datos originales y a la vez su valor debe tener un redondeo por exceso (incrementar en la unidad al último decimal ). Para determinar los intervalos de clase es como sigue: El dato menor corresponde al límite inferior de la primera clase y para obtener el límite superior de esta primera clase se suma al límite inferior el valor del ( C ) El límite inferior del segundo, intervalo de clase , corresponde al límite superior del primer intervalo de clase y para obtener su límite superior , al límite inferior de esta clase se le añade el (C) y así sucesivamente hasta completar las “k” clases
23
Tabla de distribución de pesos (kg de recién nacidos registrados en la Maternidad de Lima . i 1 2 3 4 5 6
Pesos (kg) [1,5 -2,0 > [2,0 -2,5> [2,5-3,0> [3.0-3,5> [3,5-4,0> [4,0-4,5]
fi 3 5 6 12 6 2 34
hi 0,088 0,147 0,176 0,35 0,176 0,058 1.00
Fi 3 8 14 26 32 34
Hi 0,08 0,235 0,411 0,761 0,931 0,989
Xi 1,75 2,25 2,75 3,25 3,75 4,25
Hallar e interprete los siguientes valores : f3=6 (Significa que hay 6 recién nacidos que tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) h3=17.6% (Significa que el 17.6% de los recién nacidos tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) F3= 14 (Significa que hay 14 recién nacidos tienen un peso igual o mayor a 1.5 kg , pero menor a 3.0 kg) H3=41.10% (Significa que el 41.10% de los recién nacidos que tienen un peso igual o mayor a 1.5 kg , pero menor a 2.0 kg) H3 – H2= 52.9% (Significa que el 52.9% de los recién nacidos que tienen un peso igual o mayor a 2.5 kg , pero menor a 3.5 kg) X´2=2.25 (Significa que 2.25 kg es el peso representativo para los recién nacidos que tienen un peso mayor o igual 2.0 kg , pero menor a 2.5 kg) 2. ¿Cuántos recién nacidos aproximadamente tienen un peso menor a 2.8 kg? Por interpolación lineal (utilizando la columna de las frecuencias absolutas Acumuladas) Límite superior Frecuencias acumuladas de los pesos absolutas (menor que) 2.5 2.8 3.0
8 (un peso menor a 2.5 kg se encuentran 8 recién nacidos x (un peso menor a 2.8kg se encuentran x recién nacidos) 14 (un peso menor que 3.0 kg se encuentran 14 recién nacidos
Utilizando la interpolación lineal (semejanza de triangulo) se tiene: 3.0 – 2.5 = 14 - 8 → x= 11.6 ≈12 (usando redondeo simple) 2.8 – 2.5 x – 8 Aproximadamente 12 recién nacidos tiene un peso menor a 2.8 kg 3. ¿Qué porcentaje de los recién nacidos tiene un peso inferior a 2.8 kg 24
Como 11.6 recién nacidos tienen un peso inferior a 2.8 kg, entonces → x = 11.6 → 11. 6 x 100% = 34.12% 34 Graficas Tiempo (min) fi hi Fi
F*i
Hi
2-4
3
0,10
3
30
0,10
4–6
6
0,20
9
27
0,30
6–8
12
0,40
21
21
0,70
8 – 10
7
0,23
28
9
0,93
10 – 12
2
0,07
30
2
1,00
Total
30
1,00
35 GRAFICA DE BARRAS 12 12 10
7
8 6
fi
6 4
3 2
2 0 02-Abr
4–6
6–8
8 – 10
10 – 12
GRAFICA DE LA OJIVA Para construir la Ojiva en el eje de la abscisa se colocan los intervalos de clase y en eje de la ordenada las frecuencias acumuladas absolutas o frecuencias acumuladas relativas. Por ejemplo la gráfica de la Ojiva para los pesos de los recién nacidos se obtiene de la siguiente manera , cero recién nacidos tiene un peso menor a 1.5 kg, 3 recién nacidos tiene un peso menor a 2 kg, 8 recién nacidos tienen un peso menor a 2.5kg , 14 recién nacidos tienen un peso menor a 3.0 kg, 26 recién nacidos tienen un peso menor a 3.5 kg, 32 recién nacidos tiene un peso menor a 4.0 kg. y 34 recién nacido tienen un peso
25
menor a 4,5 kg uniendo estos puntos se obtiene la curva creciente a la derecha llamada la Ojiva ( “Menor que “)
30 25
20
15
10
5 0 0
2
4
6
8
10
12
14
GRAFICA DE LA OJIVA ( “ MENOR QUE ” ) Supongamos que la variable en estudio es el tiempo ( minutos) que utiliza un usuario en realizar una transacción bancaria. Tiempo (min)
fi
hi
Fi
F*i
Hi
2-4
3
0,10
3
30
0,10
4–6
6
0,20
9
27
0,30
6–8
12
0,40
21
21
0,70
8 – 10
7
0,23
28
9
0,93
10 – 12
2
0,07
30
2
1,00
Total
30
1,00
26
30 25
20
15
10
5 0
0
2
4
6
8
10
12
14
GRAFICA DE LA CURVA ( MAYOR QUE)
27
TABLA QUE PROPORCIONA EL NUMERO DE CLASES PARA UN TAMAÑO DE MUESTRA DADO Tamaño de la
Numero de clases
muestra
K=1+3.3 Log (n)
20 a 23
5
24 a 46
6
47 a 93 94 a 187
7 8
188 a 376 377 a 756
9 10
757 a 1519
11
1520 a 3053
12
3054 a 6135
13
6136 a 12328
14
12329 a 24770
15
Nota-5 Otra metodología para determinar el ancho del intervalo de clase ( C ). 1. Determinación de rango R R= dato máximo-dato mínimo 2. Determinación de numero de clases K K= 1+ 3.3 log (n) 3. Determinación de ancho del intervalo de clase ( C ) C= R → Debe redondearse por defecto K El mismo número de decimales de los datos C redondearse por defecto casi siempre se comete error
i) 0 → El dato de arranque para la tabla= dato mínimo E= ( C) k-R ii) > 0 → El dato de arranque para la tabla =Dato mínimo _ E 2 iii) < 0 →El número de clases se incrementa en 1 y se sigue (i o ii)
28
Ejemplo La mayor y menor estatura de 50 personas es respectivamente 1.72 mts y 1.55 mts. Calcular el número de clases y su ancho para construir la tabla de distribución de frecuencias 1. Determinación de rango R= 1.72-1.55=0.17 2- Determinación de número de clases K= 1+3.3 log (50)= 6.6= 7 Redondeo por simple 3.-Determinacion de ancho de clase C= 0.17 = 0,0242 = 0.02 7 Al redondearse se comete error E= 0.02 * 7 – 0.17 = -0.03 Agregamos una nueva clase k= 8 C= 0.17 = 0.0212 = 0.02 E= 0,02 * 8 – 0,17 = - 0 , 01 Agregamos una nueva marca de clase k= 9 C= 0,17 = 0,0188 = 0,02 9 E = 0.02 * 9 -0.17 = 0.01 Dato de arranque =1.55 – 0.01 = 1.545 = 1.55 2 Los intervalos de clases para esta tabla son : Estaturas ( mts ) fi 1,55-1,57 1.57-1,59 1.59-1.61 1.61-1.63 1,63-1,65 1.65-1.67 1.67-1,69 1,69-1,71 1,71-1,73 Total 50 Si usamos la metodología anterior , los intervalos de clase para la tabla seria Estaturas ( mts ) 1,55-1,57 1.57-1,59 1.59-1.61 1.61-1.63 1,63-1,65 1.65-1.67 1.67-1,69
fi
29
1,69-1,71 1,71-1,73 Total
50
Se observa que las seis primeras clases contienen los datos , la 7ma clase carece de datos. Nota -6 No existe una formula única para determinar el número de clase (k) en la construcción de una tabla de distribución de frecuencias. Un número muy pequeño de clases tiende a ocultar la distribución real del conjunto de datos, mientras que un número muy grande puede dejar sin observaciones algunas de Las clases, limitando de esta forma su uso. La idea es tener un numero de clases de tal forma que todos los datos se encuentren en las clases formadas y además nos permite conocer la distribución empírica de los datos , Se sugiere que el número de ellos debe variar entre 5 y 15. NOTA-7 Para determinar el número de clases ( k) también se pueden usar otras fórmulas tales como : K= Log 2 ( n) K=√n NOTA-8 Para determinar el número de clases para la tabla el investigador puede utilizar algún criterio sostenido. 2.6 Ejercicios propuestos 1. Usando la tabla de distribución de frecuencia de los pesos de los recién nacidos a. ¿ Cuantos recién nacidos aproximadamente tienen un peso superior a 2.8 kg. b. ¿Cuántos recién nacidos aproximadamente tienen un peso entre 2.2kg y 3.4 kg c. ¿Cuál es el mínimo peso para que un recién nacido se encuentre considerado dentro del 20% de los que tienen pesos altos ? d. ¿ Cuál es el máximo peso para que un recién nacido se encuentre considerado dentro del 20% de los que tienen pesos bajos ? e. ¿ Qué porcentaje de los recién nacidos tienen un peso superior a 3.2 kg.? f. ¿ Qué pesos encierran al 80% central de los pesos de los recién nacidos ? g. Hallar el mínimo peso, para que un recién nacido este considerado dentro del 25% de los que tiene mayores pesos . h. Entre que valores se encuentra el 50% central de los pesos de los recién nacidos. i. Calcular el peso total aproximado de todos los recién nacidos j. Después de cierto tiempo, los que tenían un peso menor a 3 kg incrementan su peso en un 25% mas ¼ de kg. y los que tenían un peso mayor o igual a 3 kg. Se incrementan en un 5%. mas ¼ kg. Hallar el nuevo peso total aproximado de todos los recién nacidos . k. Suponiendo que los datos de la tabla presentan las siguientes transformaciones, los datos con un peso menor a 3 kg. Incrementándose en 30
un 12% y los datos con pesos superiores o iguales a 3 kg. Se incrementan en un 20% ambos con respecto a los pesos iniciales. ¿ Hallar el peso total después del incremento . 2.Una serie de 50 datos tiene como variable en estudio , los montos por venta en miles de nuevos soles, siendo el monto mínimo 85 y el monto mayor 129 Establecer las clases para la tabla. 3. Un conjunto de 50 datos, tiene como variable en estudios los pesos de cajas, Siendo el peso mínimo 43.43 Kg. y el peso máximo 68.15 kg. Establecer las Clases para la tabla. 4. Los datos que a continuación se presentan, corresponden a una muestra Aleatoria de 40 frascos conteniendo mermeladas de fresa , el objetivo es Estudiar su peso ( grs) 149 156 157 158 162
164 165 165 168 170
171 172 174 175 175
176 176 176 180 180
181 182 183 183 184
185 186 186 187 187
187 187 188 188 189
190 194 196 198 202
a. Elaborar la tabla de distribución de frecuencias y hacer los gráficos Correspondiente, histograma, polígono de frecuencia, y ojiva use la regla de STURGES. b. Hallar e interprete: H 5 – H 3 c. Usando la tabla de distribución de frecuencias, cual es el peso mínimo que debe tener un frasco, para estar considerado dentro del 15% de los de mayor peso. CAPITULO 3 INTRODUCCION En este capítulo se estudia las principales medidas de tendencia central o de posición, las cuales se definen como aquellos valores que representan al conjunto de datos de una variable en estudio. Se presenta el cálculo de las medidas de tendencia central para datos agrupados, y datos no agrupados , así como también sus propiedades 3.1 MEDIDAS DE TENDENCIA CENTRAL O DE POSICION Son valores estadísticos calculados con los datos de la muestra o de la población y que tienden a ubicarse en el centro de la distribución de los datos. A estas medidas se les considera como valores representativos para el conjunto de datos Si estos valores son calculados usando todos los datos de la muestra, se les llama valores estadísticos, estadígrafos o estimados; en cambio sí son calculados usando todos los datos de la población, se les llama parámetros. Las medidas de tendencia central más usadas son: 1. La media aritmética, media o promedio 2. La media ponderada 3. La mediana 4, La moda 31
5. La media geométrica 6. La media armónica 3.2 LA MEDIA ARITMETICA Es un valor que tiende a ubicarse en el centro de la distribución de los datos, y es considerado un valor representativo para el conjunto de datos, cuando su distribución es simétrica o los datos presentan poca variabilidad. Su valor se calcula tanto para la muestra (valor estadístico) como para la población (parámetro) Cuando la medida aritmética se calcula utilizando datos que no se encuentran en una tabla de distribución de frecuencias, se dice que la media aritmética se obtuvo para datos sin agrupar, en caso contrario la media aritmética se obtuvo para datos agrupados. LA MEDIA ARIMÉTICA PARA LA POBLACION Sea X una variable en estudio que toma valores x1, x2, x3,….., xN , la media aritmética para la población se simboliza universalmente con la letra griega µ(se lee “mu”) y es igual a la sumatoria de todos los datos de la población divididos por el total de ellos N
x µ=
i 1
i
N
NOTA: El valor de la media aritmética para la población (parámetro) casi nunca se conoce, el objetivo es estimar su valor, a través de la media aritmética muestral. Ejemplo: Supongamos que se tienen todos los pesos en kg de 3.546 varones adultos de una empresa minera, siendo estos: 65.5 70.5 69.5 70.0 71.0 ……………68.5 Hallar su peso promedio e interprete 3546
x
µ=
i 1
i
3546
=
65.5 70.5 69.5 70 71 ... 68.5 = 68.2 kg 3.546
68.2 kg Es el peso promedio para todos los trabajadores de la empresa (parámetro) LA MEDIA ARIMÉTICA PARA LA MUESTRA Se X una variable en estudio que toma valores x 1, x2, x3,….., xn, la media aritmética para una muestra se simboliza universalmente con la letra x ( se lee x-barra) y su valor es igual a la sumatoria de todos los datos de la muestra divididos por el total de ellos n ∑ xi X = i=1 n Es la media aritmética para datos sin agrupar. Al valor de la media aritmética, también se le conoce como la media aritmética muestral) Ejemplo Los siguientes datos corresponden a los pesos (kg) , de 8 personas adultas de sexo varón: 60.5 68.5 58.5 70.5 70.0 68.5 72.0 71.0 Calcular e interpretar la media aritmética 32
n
x=
x
60.5 68.5 58.5 70.5 70 68.5 72 71 = 67.4 kg 6
i
i 1
=
6
Interpretación 67.4 kg es el peso promedio de 8 varones adultos, este valor representa a los pesos de los 8 varones; supongamos que los 8 varones adultos son elegidos al azar de una población de varones adultos, entonces se puede concluir que el peso promedio de los varones adultos en la población es de 67.4 kg PROPIEDADES DE LA MEDIA ARIMÉTICA MUESTRAL La media aritmética para la muestra, tiene las siguientes propiedades: 1. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética definimos a una desviación como la diferencia entre un dato x i de la muestra y su media aritmética x ; es decir: d i = xi - x Entonces la sumatoria de todos los valores d i es igual a cero; esto es n
d
2 i
i 1
n
=
( x x) 0 i 1
i
2. La suma de los cuadrados de las desviaciones con respecto a la media aritmética, es siempre un valor mínimo; es decir n
d i 1
2 i
n
= ( xi x)2 es siempre un valor mínimo i 1
3. Sea x1, x2, x3,….., xn,, una muestra de tamaño “n” y x , la media aritmética, sea la combinación lineal yi = axi ± b; entonces la media aritmética para variable Y es: Y =a
x
±b
4. Sea una muestra de tamaño “n” , dividida en “k” submuestra de tamaño n 1, n2…nk , y X1, X2,…,Xk , la media aritmética de cada submuestra; entonces la media aritmética de la muestra se calcula por: k
x=
x f i 1
i
i
n A esta medida se le conoce como la media ponderada LA MEDIA ARIMETICA PARA DATOS AGRUPADOS Cuando los datos se encuentran en una tabla de distribución de frecuencias la media aritmética se calcula de la siguiente fórmula n
x = xi fi , i 1
Donde: K= número de clases
xi = Marca de clase i-ésima clase (corresponde a la ponderación)
fi= Frecuencia absoluta de la i-ésima clase 33
Otra fórmula que se puede utilizar para calcular la media arimetica para datos agrupados, es en función de las frecuencias relativas n
x = xi fi i 1
Nota: Las propiedades de la media aritmética para datos sin agrupar, se cumplen también para datos agrupados. Ejemplo Sea la tabla para los datos agrupados de los pesos (kg) de los recién nacido. Hallar e interpretar la media aritmética: i pesos fi hi Fi Hi i
x
1
[1.5 -2.0
3
0.08
3
8.80%
1.75
2
[2.0-2.5
5
0.14
8
23.50%
2.25
3
[2.5-3.0
6
0.18
14
41.10%
2.75
4
[3.0-3.5
12
0.35
26
76.40%
3.25
5
[3.5-4.0
6
0.18
32
94.00%
3.75
6
[4.0-4.5]
2
0.05
34
100.0%
4.25
TOTAL
34
k
x=
x f i 1
i
i
=
1.75*3 2.25*5 ... 4.25* 2 103 3.029kg 34 34
n Interpretación: 3.029kg es el peso promedio representativo para los recién nacidos de la maternidad de Lima VENTAJAS Y DESVENTAJAS DE LA MEDIA ARIMÉTICA VENTAJAS a. Es fácil de calcular e interpretar su valor b. La suma de las desviaciones es cero c. La suma de las desviaciones al cuadrado siempre es mínima DESVENTAJAS a. Su valor se encuentra afectado por datos extremos (datos muy altos o datos muy bajo de lo común); es decir estos datos tienden a alterar su valor b. Deja de ser un valor representativo para la muestra cuando los datos presentan mucha variabilidad. c. No se puede calcular en tabla con extremos abiertos d. Para datos con distribución asimétrica, no debe usarse como medida 34
representativa 3.3 LA MEDIA PONDERADA Sea X una variable en estudio que toma los valores x 1, x2, ,….., xn y sea los pesos o ponderaciones asociada a cada valor de la variable w 1, w2, ,….., wn: la media ponderada es definida como: n
xp
w x i 1 n
i i
w i 1
1
Ejemplo: En una empresa compuesta por 300 trabajadores, el ingreso mensual es como sigue: 250 de ellos son obreros y ganan S/. 850.00; 40 trabajan en la administración y ganan /. 950.00 y el resto son profesionales y ganan S/. 1,500.00 . Hallar e interpretar el ingreso promedio para los trabajadores de la empresa el enunciado presentado en la tabla; i
Trabajadores
Sueldo (xi)
Obreros
Ponderación (wi) 250
1 2
Administrativos
40
950.00
3
Profesionales
10
1500.00
total
300
850.00
3
xp
w x i 1 3
i i
w i 1
=
1
250(850.00) 40(950.00) 10(1500) = S/. 885.00 250 40 10 Interpretación: S/. 885.00, es el ingreso promedio para los trabajadores de la empresa. 3.4 LA MEDIANA Es una medida de tendencia central que divide al conjunto de datos en dos partes iguales; es decir el 50% de los datos tendrán valores menores o iguales al valor de la mediana y el otro 50% de los datos con valores superiores al valor de la mediana. Al igual que la media aritmética el valor de la mediana se calcula para datos sin agrupar y para datos agrupados en tabla de distribución de frecuencias CALCULO DE LA MEDIANA PARA DATOS SIN AGRUPAR Sea X una variable en estudio que toma los valores X 1, X2 , ….; Xn, para calcular el valor de la mediana se ordenan los datos en magnitud en forma ascendente o 35
descendente, para calcular la mediana debemos tener en cuenta si el número de datos es par o impar; es decir: Si es impar la mediana es el termino central después de ordenar de menor a mayor Ejemplo 1.3 ; 2; 9; 5; 6 Solución 2, 3, 5 , 6. 9 La Me = 5 Si es par . ordenamos de menor a mayor y es la semisuma de los datos centrales Ejemplo 2.5; 3; 1; 6; 7; 2; 9, 8 Solución 1, 2, 3 ,5 ,6, 7, 8, 9, Me= 5 + 6 = 5.5 2 Donde: X(j)= valor que toma la variable X en la posición “j” El valor de la mediana es útil como medida representativa para el conjunto de datos, cuando estos no tienen un comportamiento homogéneo Ejemplo-3 La cantidad de usuarios que concurren a un centro de información durante la semana es: 230 220 250 228 240 1200 Hallar el valor de la mediana de la concurrencia de usuarios Ordenando los datos en forma ascendente 220 228 230 240 250 1200 Me = 230+240 = 235 2 Interpretación: El 50% de las cantidades de usuarios que concurren al centro de información durante los días de la semana es menor o igual a 235, y el otro 50% de las cantidades es superior a 235 usuarios Ejemplo-4 Sea la serie de datos: 5, 3, 2, 1, 2, 5, 4, 3, Hallar la mediana Ordenando los datos en forma ascendente: 1, 2, 2, 3, 3, 4, 5, 5 x4 x5
Como n=8 (número de datos par), entonces: me = 2 2 3 Interpretación: El 50% de los datos son menores o iguales a 3 y el otro 50% son superiores a 3 Ejemplo-5 Hallar e interprete el valor de la mediana para las estaturas (mts) de 7 personas adultas 1.71 1.69 1.72 1.69 1.68 1.70 1.73 Ordenando las estaturas: 1.68 1.69 1.69 1.70 1.71 1.72 1.73 33
36
me x( 71 ) = x4 1.70 2
Como n=7, entonces:
Interpretación: El 50% de los Cadetes tienen estaturas menor o iguales a 1.70 mts. Y el otro 50% de los Cadetes tienen estaturas superiores a 1.70 mts CALCULO DE LA MEDIANA PARALOS DATOS AGRUPADOS PARA UNA VARIABLE CUANTITATIVA DISCRETA Y CONTINUA PARA UNA VARIABLE CUANTITATIVA DISCRETA Ejemplo: En la siguiente tabla de distribución de frecuencias, la variable en estudio X corresponde al número de balones de gas vendidos diariamente por 50 tiendas. Hallar el valor de la mediana del número de balones de gas vendidos diariamente i
X
fi
1
22
9
2
23
10
3
21
6
4
25
7
5
26
5
6
24 TOTAL
13 50
Ordenando los valores que toma la variable X, y obtenemos el valor de las frecuencias absolutas acumuladas
i
X
fi
Fi
1
21
6
6
2
22
9
15
3
23
10
4
24
13
38 x26 x38
5
25
7
45
6
26
5 50
50
TOTAL
38 x26 x38
n= 50 ( par) me = x 25 + x 26 = 23 + 24 = 23.5 37
2
2
Interpretación : El 50% de las tiendas tienen una venta diaria menor o igual a 23,5 balones de gas, y el otro 50% de las tiendas tienen una venta diaria mayor a 23,5 balones de gas.
PARA UNA VARIABLE CUANTITATIVA CONTINUA Cuando los datos se presentan en un tabla de distribución de frecuencias, para una variable continua, el valor de la mediana se calcula haciendo uso de la fórmula : N - F i-1 Me = Li + 2 x C fi Donde : Li = Límite inferior de la clase que contiene al valor de la mediana F i-1 = Frecuencia acumulada absoluta de la clase anterior a la clase que Contiene a la mediana f i = Frecuencia absoluta de la clase que contiene a la mediana C = Ancho del intervalo de clase . Para ubicar la clase que contiene el valor de la mediana se busca en la columna de la frecuencias acumuladas absolutas o frecuencias acumuladas relativas ( F i o Hi ) el primer valor que supera a la mitad del número de datos 0 el 50% de los mismos , es decir, F i ≥ n 0 Hi ≥ 0.5 2 Ejemplo -6 Hallar e interprete el valor de la mediana para la tabla de datos agrupados de los recién nacidos . i 1 2 3 4 5 6
pesos [1.5 -2.0> [2.0-2.5> [2.5-3.0> [3.0-3.5> [3.5-4.0> [4.0-4.5]
fi 3 5 6 12 6 2 34
hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00
Fi 3 8 14 26 32 34
Hi 0.088 0,235 0,411 0,763 0,939 0,997 100%
Xi 1,75 2.25 2,75 3,25 3,75 4,25
n= 34 → n = 17 ≤ F i → i = 4 2
N - F i-1 Me = Li + 2
xC 38
fi Me = 3 + 17-14 x 0,5 = 3,125 Kg. 12 Interpretación : El 50% de los recién nacidos tienen pesos menores a iguales a 3,125 kg. y el otro 50% de los recién nacidos tienen pesos superiores a 3,125 kg
VENTAJAS Y DESVENTAJAS DE LA MEDIANA VENTAJAS .1. Es fácil de calcular e interprete su valor 2. Se realizan manipulaciones algebraicas 3. Su valor no se encuentra afectado por datos extremos 4. Se puede calcular en tablas de distribución de frecuencias con extremos abiertos DESVENTAJAS La suma de los cuadrados de las desviación es con respecto a la mediana no es mínima, en comparación con la media aritmética. PROPIEDADPES DE LA MEDIANA PARA UN CONJUNTO DE DATOS TRANSFORMADOS Sea x x 2 x3 ……..xn una muestra de tamaño “n” y me, el valor de la mediana , sea la combinación lineal yi = ax i+ b , entonces el nuevo valor de la mediana para la variable Y es : m ey = am ex + b siendo : a y b constante
Ejemplo -1 Un conjunto de 20 datos tiene por median 24 , si al conjunto de datos se le incrementa en un 15% mas 3 unidades Hallar el nuevo valor de la mediana . Sea el x, valor del i-esimo dato, por el enunciado del problema el valor del iesimo dato transformado es y k= 1,15x k + 3 y por la propiedad de la mediana su nuevo valor es : Me ey = 1.15(24) + 3 = 30.6
39
Ejemplo-2 Sea la tabla de distribución de frecuencias EDAD [18-22> [22-26> [26-30> [30-34> [34-38] TOTAL
fi 4 13 19 12 5 53
Fi 4 17 36 48 53
Yi 20 24 28 32 36
De la tabla, si las edades de las 53 personas se incrementan en un 12% mas 2 años , calcular el nuevo valor de la mediana . De la tabla calculamos el valor de la mediana
Me = 26 + 26.5 – 17 x 4 = 28 19 Sea el x I valor de la i-esima marca de clase para la tabla, por el enunciado del problema el valor de la i-esima marca de clase transformada es y i= 1.12 x i + 2 y por la propiedad de la mediana, su Nuevo valor es : Me = 1.1 m + 2 = 1.12(28) + 2 = 33.36 3.5 LA MODA Sea x una variable en estudio que toma los valores x 1 , x2 ………xn la moda, es aquel valor de la variable que se presenta con mayor frecuencia, se representa por ( Mo ) = es decir : mO = valor que toma la variable para la máxima frequencia ( f i ) El valor de la moda se interpreta, como el valor más frecuente para el conjunto de datos de una muestra o población .
El valor de la moda puede o no existir, Si un conjunto de datos tiene una sola moda a su distribución se le llama unimodal, si tiene dos modas se le llama bimodal y para más modas multimodal DATOS NO AGRUPADOS Ejemplo-1 Hallar la moda para el conjunto de datos : 12 , 16, 18, 18, 18, 20, 20, 20, 20, 20 , 20 , 24
40
El dato que se repite con mayor frecuencia es el valor 20, luego la moda es 20 . Ejemplo -2 Calcular la moda para la serie de datos 1, 1, 2, 3, 3, 4, 7 Los datos que se repiten con igual frecuencia son el 1, y 3 , luego la distribución tiene dos modas 1, y 3 bimodal Ejemplo -3 Calcular la moda para el conjunto de datos : 4 , 2, 3, 7, 5, 9 Como no existe ningún dato que se repite más de una vez, luego el conjunto de datos no tiene moda . ( amodal ) Ejemplo – 4 Una tienda vende durante el día tres tipos de conservas, 120 frascos con fresa, 40 frasco con mango y 50 frasco con piña, calcular la moda. En este ejemplo la variable en estudio es tipo de conservas vendidas, luego los frascos con fresa registraron la mayor venta, por lo tanto el frasco con fresa corresponden a la moda . CALCULO DE LA MODA PARA DATOS AGRUPADOS Cuando los datos se encuentran en una tabla de distribución de frecuencias la fórmula para calcular la moda es :
Mo = Li +
d1 x C d1 + d2
Donde : Li = Límite inferior de la clase que contiene al valor de la moda d 1 = f i– f i - 1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior . d 2= f i– f i + 1 = Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente. La clase modal corresponde a la clase de mayor frecuencia absoluta Ejemplo
41
De la tabla de distribución de frecuencia, en la cual se analiza los pesos de los recién nacidos, Hallar e interprete el valor de la moda .
i 1 2 3 4 5 6
pesos 1.5 2.0 2.0-2.5 2.4-3.0 3.0-3.5 3.5-4.0 4.0-4.5
fi 3 5 6 12 6 2 34
hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00
Fi 3 8 14 26 32 34
Hi 0.088 0,235 0,411 0,763 0,939 0,997
Xi 1,75 2.25 2,75 3,25 3,75 4,25
El valor de la moda se encuentra en la 4ta clase, por presentar la máxima frecuencia absoluta, en este caso las distribución es unimodal para esta muestra, luego i = 4
d 1 = f i– f i - 1 = f 4– f 5 = 12 – 6 = 6 d 2= f i– f i + 1 = f4 – f 5 = 12- 6 = 6
Mo = Li +
d1 x A = M 0 = 3 + 6 , 05 = 3.25 kg d1 + d2 6+6
Interpretación : 3.25 kg. Es el peso más frecuente para los recién nacidos. PROPIEDADES DE LA MODA PARA DATOS TRANSFORMADOS Sea x1 x 2 x 3 …………….x una muestra de tamaño “n” y m 0 , el valor de la moda, sea la combinación lineal y i = ax i + b ,entonces el nuevo valor de la moda para la variable Y es : M0 = am0 + b Siendo a y b constantes. 3. LA MEDIA ARMONICA Se utiliza para promediar razones que tienen dimensiones físicas, tales como km/hora promediar el costo medio de artículos comprados con una cantidad fija de dinero, La media armónica para n valores mayor a cero y positivos , se define como el reciproco de la media aritmética de los reciproco de los datos.
Xa =
n 1 + 1 + ….. + 1 42
X1 x2
xn
Para datos agrupados Xa =
n f 1 f 2 + ………+f k x1 x2 xk
Siendo : x I = valor de la i-esima marca de clase f i = valor de la frecuencia absoluta de la i-esima clase k
n= ∑ f i i=1 Ejemplo – 1 Tres vehículos recorren cierto tramo de una autopista con las siguientes velocidades : 90 km/hora , 110 km/ hora y 140 km/hora .Hallar la velocidad media.
Xa =
3 = 109.7097 km/hora 1 + 1 + 1 90 110 140
Ejemplo – 2 Una persona concurre a tres mercados para consultar el precio de un artículo “M” llevando consigo la suma 24 nuevos soles. En el primer mercado pude comprar 4 artículos ”M” , 5 artículos ”M” en el segundo y 6 artículos “M” en el tercero .Hallar el precio promedio del artículo “M” en los tres mercados .
Xa=
3 1 + 1 + 6 4.8
= s/ 4.8 1 4
Ejemplo -3 Un representante del INEI , con la misma cantidad de dinero, compra en diferentes establecimientos cantidades de un mismo artículo , tal como se muestra en la tabla siguiente. Hallar el precio promedio del artículo en los diferentes lugares
43
Dinero
Cantidad de Articulo comprado 10 8 14
20 20 20
X a=
Precio unitario por articulo 2 2.5 1.42857
3 = 1. 875 1 + 1 + 1 2 2.5 1,42857
3.8 Ejercicios Propuestos 1. Los siguientes datos corresponden a pesos ( kg) de 20 alumnos 50.5 54.5 52.4 51.4 52.5 62.5
54.5 55.0 61.5 61.0 60.0 50.5 50.0 50.5 52.5 58.5
62.0 64.2
58.5 50.5
a. Hallar e interpretar la media aritmética, mediana y moda b. Si los pesos de los alumnos , se incrementan en un 15% mas ¾ kg Hallar el nuevo peso promedio y el peso mediano. 2. La siguiente tabla de distribución de frecuencia proporciona los montos por venta en cientos de nuevos soles de un grifo.
Montos por ventas f1
[10-15>
[15-20>
[20-25>
[25-30>
[30-35>
[35-40
12
15
20
25
12
8
a. Hallar e interprete la media aritmética, mediana y moda b. Si los montos por venta se incrementan en 12% Hallar el monto promedio y el monto mediano 3.- La tabla de distribución de frecuencias, tiene como variable en estudio las estaturas ( mts) de 50 alumnos .
Estatura (mts) 1.67-1.69 1.69-1.71 1.71-1.73 1.73-1.75
fi
hi
Fi
Hi
Xi
5 9 12 10 44
1.75-1.77 1.77-1.79 total
9 5 50
Calcula e interprete : a. f 3 , h 5 , F 3 , H 5 , H 5 – H 2 x i b. Qué porcentaje de alumnos, tienen una estatura inferior a 1.73 mts c. Qué porcentaje de alumnos, tienen una estatura superior a 1.75 mts d. Qué porcentaje de alumnos , tienen una estatura entre 1.69 y 1.77 mts e. La estatura media , mediana y modal de los alumnos f. Qué porcentaje de alumnos, tienen una estatura entre 1.70 y 1.76 mt g. Qué porcentaje de alumnos , tienen una estatura menor al promedio h. Que cantidad aproximadamente de alumnos , tienen una estatura superior a 1.74 mts i. Que cantidad aproximadamente de alumnos , tienen una estatura inferior a 1.74 mts j. Cuál es la máxima estatura para que un alumnos , se encuentre considerado dentro de 20% de los que tienen estaturas menores k. Cuál es la mínima estatura para que un alumno , se encuentre considerado dentro de 20% de los que tienen estaturas mayores 4. El promedio de 10 calificaciones del curso de estadística en un salón de clase es de 9.8 , pero al ingresar los datos a la computadora en lugar de digitar, 14 dígitos se digita 4, y en lugar de digitar 8 dígitos se digita 12 Calcular la nueva nota promedio con esta corrección.
3.9 OTRAS MEDIAS DE POSICION PERCENTIL PARA DATOS NO AGRUPADOS Son valores que divide al conjunto de datos ordenados ascendentemente en 100 partes iguales, la fórmula para calcular los percentiles es : P j = X ( n+1) = X i + a( x i+1 – x I ) 0 < j < 1
( a)
J= 0.01 . 0,02 . 0,03, 0,04 , …….. 0,99 Siendo P j = valor que divide a un conjunto ”n” datos, ordenados de tal manera que el 100 j % son menores o iguales que el valor del percentil PJ y 100 ( 1- J ) % mayores que el percentil P j. X i = valor del dato en la posición del entero menor ( n+1) j “a” = decimal del número ( n+1) j
45
CUARTILES Q j PARA DATOS SIN AGRUPÀR Son valores que divide al conjunto de datos ordenados ascendente en 4 partes Iguales , en la formula ( a) j forma los siguientes valores . J= 0.25 ; 0.5 ; 0.75
DECILES ( D j) PARA DATOS SIN AGRUPAR Son los valores que divide al conjunto de datos ordenados ascendentemente en 10 partes iguales , en la formula ( a ) , j toma los siguientes valores. J = 0,1 , 0,2 , 0,3 .0,4 , 0,5 , 0,6 , 0, 7, 0,8 , 0,9
Ejemplo:
1 2 3 4
569 01134556789 011222233344566779 11
Siendo la unidad de hoja = 0.1 n= 34
CALCULO DE PERCEN TILES P J PARA DATOS AGRUPADOS La fórmula es : nj – Fi-1 x C PJ =Li+ fi
J= 0,,01 , 0,02,0,03, 0,04 …….. 0,99
Nota: La primera frecuencia acumulada absoluta o frecuencia acumulada relativa que sea superior a nj o j % será la clase que contiene al percentil Pj L i = Límite inferior de la clase que contiene al percentil P j = Valor del percentil que acumula el j % C = Ancho de clase 46
F I-1 = Frecuencia absoluta acumulada de la clase anterior a la clase que contiene al valor del percentil f i = Frecuencia absoluta de la clase que contienen al valor del percentil
para los Cuartiles será:
Q = L i+
nj – F i-1 x C fi
J= 0.25. 0.5 . 0.75
Para los deciles será : Dj = L i + nj- F i-1 x C fi
J= 0,1, 0,2, 0,3, 0,4, 0,5, 0,6, 0,7, 0,8 , 0,9
Ejemplo La tabla de distribución de frecuencias agrupan las edades ( años) de los usuarios que concurren a un centro de información : Calcular el 1er cuartil, 3er cuartil , 4to cuartil y el 65 avo percentil Edades de usuarios [18.5-22.5> [22.5-26.5> [26.5-30.5> [30.5-34.5> [34.5-38.5> [38.5-42.5> [42.5-47.5] Total
fi
Fi
5 9 12 20 13 10 4 73
5 14 26 46 59 69 73
Calculo del 1er cuartil nj = 73 * 0,25 = 18.25 → Fi > 18.25 → i =3 clase Q 0.25 = L 3 nj – F 3-1 x C = 26.5 + 18.25-14 x 4 = 27.92 años f3 12 47
Calculo del 3er cuartil Nj = 73 * 0.75 = 54.75 → Fi > 54.75 →i = 5 clase Q 0.75 = L 5 + nj – F 5-1 f5
xC
= 34.5+ 54.75 – 46 x 4 = 37.19 años 13
Interpretación : El 75% de los usuarios tienen edades menores o iguales a 37.19 años y el otro 25% de los usuarios tienen edades superiores a 37.192 años
Calculo del 4to decil
nj = 73 * 0.40 = 29.2 → F I > 29.2 → i = 4 clase D 0.4 = L 4 + nj – F 4-1 x C = 30.5 + 29.2-26 x 4 = 31.14 años f4 20 Interpretación El 10% de los usuarios tienen edades menores o iguales a 31.14 años y el otro 60% de los usuarios tienen edades superiores a 31.14 años
Calculo del 65 avo percentil nj = 73 * 0.65 = 47.45 → F I > 47.45 →i = 5 clase
P 0.65 = L 5 + nj – F 5-1 x C = 34.5 + 47.45 -46 X 4 = 34.95 años f5 13 Interpretación El 65% de los usuarios tienen edades menores o iguales a 34.95 años y el otro 35% de los usuarios tienen edades superiores a 34.95 años .
48
CAPITULO 4 MEDIDAS DE VARIABILIDAD o DISPERSION INTRODUCCION En este capítulo se estudiaran las medias estadísticas de variabilidad o dispersión para un conjunto de datos. Son valores que miden que tan homogéneas o heterogéneas son los datos, si los datos fuesen iguales, se dice que no existe variabilidad o dispersión entre ellos, en caso contrario se dice que los datos presentan dispersión o variabilidad. El estudio de la variabilidad de un conjunto de datos es de suma importancia en todo análisis estadístico ya que esto depende el grado de confiabilidad de las estadísticas que se formulen. Las medidas de variabilidad o dispersión se clasifican en : MEDIAS DE VARIABILIDAD ABSOLUTAS Cuando el valor de esta medias esta expresado en la misma unida de media de los datos originales. Ejemplo: 1. Rango 2. Varianza 3. Desviación estándar MEDIDAS DE VARIABILIDAD RELATIVA Cuando el valor de estas medidas carece de unida de media coeficiente de variación o variabilidad. 4.1 EL RANGO El rango es una medida ( distancia ) a través de la cual se distribuyen todos los datos de la muestra o población .Se calcula por la diferencia entre el dato mayor y dato menor. Para datos sin agrupar: Rango = dato mayor – dato menor Para datos agrupados: Rango = LS –Li Dónde:
LS = límite superior de la última clase LI = límite inferior de la primer clase Ejemplo Sean los montos por ventas de una tienda comercial expresada en nuevos 49
soles
1500 2300
2300 1000
1800 2000 1500 2400 1200 2400 2500 1800
De acuerdo a la definición el rango es: Rango = R= 2500 -1000 = 1500 Nos indica que a una distancia de 1500 se distribuyen los montos por ventas, el rango es una medida de dispersión de primera vista para la variabilidad de los datos, pero no evalúa el grado de variabilidad de los datos intermedios. NOTA Si todos los datos fuesen iguales el rango es cero, nos indica que todos los datos se concentran en un mismo punto .Si el rango es diferente de cero nos indica que los datos no se concentran en un mismo punto, es decir existe variabilidad o dispersión. El rango puede ser positivo, negativo o cero El rango posee unidad de medida, que es la misma de los datos originales El rango es bien sensible a la presencia de datos extremos ( datos muy altos o datos muy bajo de lo normal ) MEDIDAS DE DISPERSION.- Son estadígrafos que cuantifican el grado en que los datos numéricos tienden a extenderse alrededor de un valor medio de la distribución y son necesarias para verificar la confiabilidad de los promedios . Que sirven como base para el control de la variación de la misma CARACTERISTICAS.- Si se desea exactitud estadística en un estudio se debe aplicar los estadígrafos de acuerdo al siguiente orden : 1º Desviación estándar 2º Desviación Media 3º Rango La desviación estándar.- Es el más importante y de mayor uso, un valor grande de ella significa que la mayoría de los datos están concentrados en la proximidad de la Media Aritmética.
4.2.-DESVIACION MEDIA ( DM) Se define como el promedio de las desviaciones o diferencias de cada observación con respecto a la media . Estas diferencias son formadas en valor absoluto para que al sumarlas no se eliminen entre si. La suma obtenida se divide entre el número de 50
elementos de la distribución 4.2.1 DESVIACION MEDIA PARA DATOS NO AGRUPADOS DM= ∑ │ x i - x │ N 4.2.2 DESVIACION MEDIA PARA DATOS AGRUPADOS DM= ∑ │ x i - x │ f i N a) Desviación Media (DM) = │ x i – x │ n PROCESO: 1. Se obtiene la Media Aritmética para datos simples o no agrupados. X=∑ xi n
= 23+20+21+19+18 = 20.2 años 5 2. Construimos la siguiente tabla : Edad ( x ) X -x x-x 23 20 21 19 18 ∑
23-20.2=2.8 20-20.2=-0.2 21-20.2=0.8 19-20.2=-1.2 18-20.2=-2.2
2.8 0.2 0,8 1.2 2.2 7.2
3. Calculamos la Desviación Media :DM = 7.2 = 1. 44 años 5 INTERPRETACION: La edad de los alumnos de Integridad –PNP con respecto a su Media aritmética tiene una dispersión de 1.44 años.
PROCESO : 1) Se calcula la Media aritmética que en este caso es igual a 20.2 años 2) ∑xi2 = 232 +20 2 + 21 2 + 19 2 +18 2 = 529 +400+441 +361 +324 = 2055 3) La varianza será: S 2 = ∑ x i 2 – n ( x) 2 = 2055 -5 (20.2)2 =2055-2040.2 =3.7 años n-1 4 4 NO TIENE INTERPRETACION PRACTICA , solo se calcula para poder 51
determinar la desviación estándar. 5. VARIANZA ( s 2 ) .- Su valor corresponde al promedio de las desviaciones al cuadrado de los datos con respecto a la media aritmética . Es decir su valor da una idea del grado de dispersión de los datos con respecto a la media aritmética . La varianza para un conjunto de datos esta expresada en unidades Cuadráticas. Por ejemplo , si la unidad de medida de los datos es kilogramos, la varianza será expresada en kilogramos al cuadrado .Este hecho dificulta la interpretación de la varianza . VARIANZA PARA DATOS NO AGRUPADOS S 2 = ∑ │ x i - x │2 n- 1 VARIANZA PARA DATOS AGRUPADOS
S 2 = ∑ fi ( x i - x )2 f i n-1 nota.- 1 Si los datos fuesen todos iguales la varianza es cero, esto nos indica que todos los datos están concentrados en la media, en otras palabras no existe variabilidad con respecto a la media aritmética . Si los datos son diferentes de acuerdo a la definición el valor de la varianza Será mayor que cero, en otras palabras existe variabilidad entre los datos con respecto a la media aritmética nota.- 2 Es riesgoso usar el valor de la varianza para concluir que los datos de la muestra son muy o poco variable .Su uso es más que todo para comparar la variabilidad entre dos o más conjuntos de datos que analiza la misma variable
Ejemplo -1 Sea una muestra aleatoria de los pesos kg de 15 alumnos de un salón de Clase Hallar la varianza
52
35.5 36.0
37.5 35.0
38.0 35.0
38.0 36.5
39.0 38.5
37.0 38.0
36.8 38.0
35.8
X = 518.8 = 36,9 14 S 2 = 1.96+0.36+1,21+4,41+0,01+0,01+1,21+0,81+3,61+3,61+0,16+2,56+1,21+1,21 = 22.3 14 14 S2 = 22.3 = 1.592857 Kg. 14 1,592857 este valor nos indica la presencia de variabilidad de los pesos de los alumnos con respecto al peso promedio. Ejemplo -2 fy 5,25 11.25 16,5 39 22.5 8,5 103
(x-x)2 .f (1,75-3.02)2,3 = 4.8 (2.25-3.02 )2 .5= 2,96 (2,75-3.02)2 . 6= 0.437 (3,25-3.02)2 12=0,63 (3,75-3.02)2 6= 3.19 (4,25-3.02)2 2= 3.02 15.037
pesos 1.5 2.0 2.0-2.5 2.4-3.0 3.0-3.5 3.5-4.0 4.0-4.5
fi 3 5 6 12 6 2 34
hi 0,088 0,147 0,176 0,352 0,176 0,058 1.00
Fi 3 8 14 26 32 34
Hi 0.088 0,235 0,411 0,763 0,939 0,997 100%
Yi 1,75 2.25 2,75 3,25 3,75 4,25
X= 103 = 3.029 34
S2
= 15,037 = 0.442264 34
S2 = 0.44 kg. 0.44 kg. es la desviación promedio en kg 2 con respecto al peso promedio , este valor nos indica la presencia de variabilidad entre los pesos con respecto al peso promedio en kg 2 . 5.2 PROPIEDADES DE LA VARIANZA 1. Si los datos de la muestra son iguales , es decir los valores que toma los 53
datos es constante, entonces su varianza o variabilidad es igual a cero, es decir : x 1 = x 2 = ……….x 4 = ….= x n = m → S 2 = 0 2. Cuando a todos los datos de la muestra , se le multiplica por una constante “a” y además se le suma o resta otra constante “b” , entonces la varianza de los datos transformados, es igual a la primera constante al cuadrado multiplicado por la varianza de los datos originales . x 1 = x 2 = ……….x 4 = x → S 2 , sea la transformación y i = ax +b , luego se cumple que la varianza de los datos trasformados es igual a : S2 =a2 S2 y
x
5.3 DESVIACION ESTANDAR Su valor, se define como la raíz cuadrada positiva de la varianza , es decir S x= Varianza El valor de la desviación estándar para un conjunto de datos esta expresado en la mismas unidades de la variable en estudio. Características: 1. Cuando mayor es la dispersión alrededor de la media, tanto mayor es el valor de la D.S. 2. Las desviaciones extremas con respecto a la media pesan mucho más en Cuanto a determinar el valor de la D.S. Ejemplo : De los ejemplos anteriores se tiene : Para datos sin agrupar : S x=
1.67638 kg2 = 1.29475 kg
Para datos agrupados :
S x=
0,45744 kg = 0.676344 kg 2
54
Interpretación 1.29475 kg, es la desviación promedio con respecto a la media aritmética 0.676344 kg. es la desviación promedio con respecto a la media aritmética ambos valores obtenidos nos indica la presencia de variabilidad de los datos con respecto a la media. NOTA -1 La desviación estándar al igual que la variancia, se utiliza para comparar la variabilidad o el grado de dispersión de dos o más conjunto de datos que poseen la misma unidad de medida y tienen sus promedios similares; es decir si se tiene dos o más conjunto de datos que poseen la misma unidad de medida y promedio similares, tendrá mayor dispersión o mayor variabilidad con respecto a la media aritmética aquel conjunto de datos que tienen la mayor variancia o desviación estándar Ejemplo De la tabla que conjunto de datos son más variables o están más dispersos Muestras
Datos
Media Aritmética
Variancia
Desviación estándar
1 2
4, 5, 6 1, 5, 9
5 5
1 16
1 4
DESVIACION ESTANDAR ( DS o S) = ( S 2 ) S=
√S2 =
√ 3.7 = 1.92 = 2 años
INTERPRETACION.- La edad de los alumnos de Integridad -PNP, se dispersan respecto al valor central en aproximadamente 2 años . 5.4 COEFICIENTE DE VARIACION Es una medida de variación relativa no tiene unidad de medida se calcula haciendo uso se la siguiente fórmula El coeficiente de la Desviación Estándar y la Media Aritmética, expresado en porcentaje. Se calcula │ S CV=
x100% 55
X El CV ; indica el número de veces que la desviación estándar contiene a la media aritmética. Su valor se usa para comparar la variabilidad entre dos o más conjuntos de datos que poseen diferentes unidades de medidas y medias aritméticas diferentes Sean A y B dos conjuntos de datos si el coeficiente de variación para el conjunto A es mayor a el coeficiente de variación para B, entonces los datos de A presentan mayor variabilidad o dispersión relativa que los datos de B. INTERPRETACION.- Como el coeficiente de variación porcentual CV% si es menor que el 30% , entonces la media es una medida representativa del conjunto de datos . Ejemplo para DATOS AGRUPADOS: Considerando el ejemplo anterior sobre el peso de los alumnos calcularemos las medias de dispersión y para ello se tiene la tabla antes construida I.C Xi fi Fi hi Hi L.R. [53.0-58.0> 55.5 4 4 0.17 0.17 (52.95-58.05) [58.1-63.1> 60.6 4 8 0.17 0.34 (58.05-63.15) [63.2-68.2> 65.7 2 10 0.09 0.43 (63.15-68.25) [68.3-73.3> 70.8 10 20 0.44 0.87 (68.25-73.35) [73.4-78.4] 75.9 3 23 0.13 1. (73.35-78.45) ∑ 23 1.00 De la tabla vamos a tomar las partes que necesitamos para nuestros cálculos y agregamos tres columnas adicionales fi(xi-x)2 4(23.21)=49284
I.C 53.-58.0
xi 55,5
fi 4
xi.fi 222.0
4(36) = 144.00
58.1-63.1
60.6
4
242.4
2(0.8 )= 1.62
63.2-68.2
65.7
2
131.4
10(17.69)=176.4 0 3(86,44)=259.47
68.3-73.3
70.8
10
708.0
73.4-78.4
75.9
3
227.7
23
1531. 5
Xi 2 3080.2 5 3672.3 6 4316.4 9 5012.6 4 5760.8 1
fi.xi 2 12321.00
(xi-x)fi 11.1.4=44.4
f(x-x)2 4(-11-1)2
14689.44
6.0x4=24.0
4(-6) 2
8632.98
0.9x2=1.8
2(-0.9)2
50126.40
4.2x10=42.0
10(4.2)2
17282.43
9.3x3=27.9
3(93)2
103052.25
140.1
PROCESO 1. Se calcula el producto fi.xi= ( 55,5) ( 4) = 222 etc . Para con la suma hallar la Media Aritmética .Este valor ya lo tenemos calculado y es 66,6 4 = 15.31.5 23 2 2. Se eleva al cuadrado la marca de clase : x i = ( 55.5) ( 55.5) = 3080.25. etc 3. Se calcula el producto fixi 2 = ( 4) ( 3080.25) = 12321 , etc. 56
Los datos de la muestra 2 están mas dispersos que la muestra 1 Ejemplo-1 Sean los siguientes datos 1, 2, 3, 4, 5 Hallar e interprete el coeficiente de variación
x 3
S
S
2
2.5
S
1.5811
CV 1.5877 3 x100% 52.70% (nos indica que la desviación estándar para este conjunto de datos representa el 52.70% de su media aritmética) Ejemplo-2 La siguiente información corresponden a los montos (S/ )por ventas de dos tiendas comerciales A y B Valores estadísticos Venta promedio Desviación estándar
Tienda comercial A 22,000 2,640
Tienda comercial B 18,500 3,145
¿Qué montos por ventas están más dispersos? Para la tienda comercial (A) CV = 2640 x 100% = 12.0% 22000 Para la tienda comercial (B)
CV = 3145 x 100% = 17.0% 18500 Por lo tanto los montos por ventas de la tienda comercial B son más variables o más dispersos que los montos por ventas de A Ejemplo : CV = 6,99 X 100 = 10.5% 57
66.6 El coeficiente de variación es útil cuando la intersección es comparar dos distribuciones numéricas medidas en escalas diferentes. 5.5 EJERCICIOS PROPUESTOS
1. Los siguientes datos corresponden a estaturas (mts) de los alumnos de cierta universidad
1.71
1.78
1.85
1.58
1.68
1.66
1.72
1.67
1.68
1.65
1.68
1.65
1.68
1.67
1.70
1.70
1.68
1.65
1.66
1.68
Hallar e interprete las medidas de dispersión absoluta y relativa 2 Los siguientes datos corresponden a una muestra al azar de 40 frascos conteniendo mermelada de piña los pesos (grs) se presentan a continuación 149 156 157 158 162
164 165 165 168 170
171 172 174 175 175
176 176 178 180 180
181 182 183 183 184
185 186 186 188 187
187 187 188 188 189
190 194 196 198 202
a. Elaborar la tabla de distribución de frecuencias b. Calcular las medidas de dispersión o variabilidad
3. Se eligen al azar a 70 trabajadores de una empresa, la distribución de los ingresos mensuales se presentan en la tabla siguiente
i 1 2 3 4 5 6
Ingresos [400 600) [600 800) [800 1000) [1000 1200) [1200 1400) [1400 1600) Total
fi 6 12 18 15 12 7 70 58
Usando la información de la tabla, calcular a. El rango b. La variancia c. La desviación estándar d. El coeficiente de variación e. La variancia y desviación estándar f. La variancia y desviación estándar, si la empresa decide aumentar los ingresos de sus trabajadores en un 7% mas 45 nuevos soles
59
ORGANIZACIÓN DE LA INFORMACION 2.1. RECOPILACIÓN DE DATOS La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que pueden ser utilizadas por el analista para recopilar los datos de interés, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observación, registros de denuncias etc. 2.2. ORGANIZACIÓN DE DATOS Una vez recopilada la información, es necesario revisarla cuidadosamente luego resumirla y presentarla convenientemente por ejemplo en tablas de frecuencias, gráficos etc., posteriormente analizarla e interpretarla y tomar decisiones convenientes. 2.3. PRESENTACIÓN DE LA INFORMACIÓN MEDIANTE CUADROS O TABLAS Después de la revisión y corrección de los datos recopilados, conviene estructurar y ordenar estos datos de acuerdo a algún sistema de clasificación a fin de describirlos o analizarlos en cuadros o tablas. A continuación, se señalan algunos conceptos y procedimientos comunes para la presentación de los datos en cuadros o tablas. DISTRIBUCIÓN DE FRECUENCIAS O TABLAS DE FRECUENCIAS DE UNA VARIABLE DISCRETA Una distribución de frecuencias es un arreglo de los valores observados x i,…,xk de la variable X con sus respectivas frecuencias en una tabla de la forma. Valor de Xi x₁ x₂ . . . xk
fi f1 f2 . . . fk k
Total
i 1
n xi fi Fi hi Hi
: : : : : :
fi n
Fi F₁ F₂ . . . FK=n
hi h₁ h2 . . . hk
Hi H1 H2 . . . Hk = 1
k
h 1 i 1
i
Donde: número de observaciones variable o clase frecuencia absoluta frecuencia absoluta acumulada frecuencia relativa frecuencia relativa acumulada
60
TABLAS DE DISTRIBUCIÓN DE FRECUENCIA DE DATOS CUALITATIVOS En este caso como la variable cualitativa indica cualidades, propiedades, etc., se agrupa de acuerdo a cada categoría que se diferencia en la variable cualitativa. (Sin un orden establecido). Ejemplo Sea la empresa “dieta SA” cuyo gerente de producción está interesado en estudiar las preferencias del público sobre diferentes tipos de mermeladas que pueden ser de pera, manzana, durazno y fresa, toma una muestra de la preferencia de 20 personas siendo los resultados los que se presentan. Datos recopilados Pera Durazno Fresa Fresa Pera
Manzana Pera Durazno Manzana Manzana
Manzana Fresa Fresa Fresa Pera
Pera Fresa Fresa Durazno Durazno
Pasos para la elaboración de las tablas de frecuencias 1. Identificar las clases o nombre de la variable (Xi) Xᵢ = tipo de mermelada x1 = Pera
x2 = Durazno
x3 = Fresa
x4 = Manzana
2. Organizar la información de acuerdo al tipo de clase Xi 3. Hallar la frecuencia absoluta (fi) 4. Hallar la frecuencia absoluta acumulada (Fi) 5. Hallar la frecuencia relativa (hi) 6. Hallar la frecuencia relativa acumulada (Hi) Con esto se termina de construir la tabla Clase Xᵢ Pera Durazno Fresa Manzana
fi 5 4 7 4 20
Fi 5 9 16 20
hi 0.25 0.2 0.35 0.2 1
Hi 0.25 0.45 0.8 1
PROPIEDADES DE LA TABLA DE FRECUENCIAS 61
La suma de las frecuencias absolutas es igual al número de observaciones k
f1 f 2 ... f k fi n i 1
La primera frecuencia acumulada es igual a la primera frecuencia absoluta F1= f1 La frecuencia absoluta acumulada de cualquier clase será igual a la frecuencia absoluta acumulada anterior más la frecuencia absoluta de la clase. Fi Fi 1 fi La última frecuencia acumulada es igual al nuero de observaciones Fk=n La suma de las frecuencias relativas es igual a la unidad k
h1 h2 ... hk hi 1 i 1
La primera frecuencia relativa acumulada es igual a la primera frecuencia relativa. H1 h1 La frecuencia relativa acumulada de cualquier clase será igual a la frecuencia relativa acumulada anterior más la frecuencia relativa de la clase H i H i 1 hi La última frecuencia relativa acumulada es igual a la unidad Hk 1 EJERCICIOS: 1. Al elaborar una tabla de frecuencias donde se evaluó la opinión de 40 personas sobre la calidad como, excelente (E), bueno (B), regular (R), malo (M) de una nueva conserva. Se perdió información de dicha tabla recuperándose solo lo siguiente: 1. La primera clase está definida como excelente 2. La frecuencia relativa de la primera clase es igual al 30% de la muestra 3. f3 f 4 f1 4.
f3 f 4 2
2. Elaborar una tabla de frecuencias con los datos a continuación señalados
62
Sol. clase Xi Narrativa Biografía Poesía Cuento Teatro
fi 23 15 20 5 7 70
Fi 23 38 58 63 70
hi 0.33 0.21 0.29 0.07 0.10 1.00
Hi 0.33 0.54 0.83 0.90 1.00
3. Completar la tabla de frecuencias con los resultados de las notas finales de un curso de ESTADÍSTICA
Sol. clase Xi No presente Suspenso Aprobado Notable Sobresaliente
fi 17 16 29 24 2 88
Fi 17 33 62 86 88
hi 0.19 0.18 0.33 0.27 0.02 1.00
Hi 0.19 0.38 0.70 0.98 1.00
4. Ejemplo: Las calificaciones de un examen de Matemáticas de 18 alumnos son las siguientes: Sobresaliente, Notable, Notable, Insuficiente, Sobresaliente, Suficiente, Suficiente, Insuficiente, Notable, Notable, Suficiente, Suficiente, 63
Suficiente, Notable, Suficiente, Sobresaliente, Notable, Notable Sabemos el orden que mantiene, la nota más baja es el Insuficiente, le siguen el Suficiente y Notable y la más alta es Sobresaliente, construir la tabla de frecuencias Sol. clase Xi Sobresaliente Notable Suficiente Insuficiente
fi 3 7 6 2 18
Fi 3 10 16 18
hi 0.17 0.39 0.33 0.11 1.00
Hi 0.17 0.56 0.89 1.00
5. Ejercicio: Con la escena anterior contesta a las siguientes preguntas. a) ¿Cuántos alumnos sacaron una nota inferior a Notable? R. 8 alumnos b) ¿Qué porcentaje de alumnos aprueba el examen? R. 11% c) ¿Cuántos alumnos aprobados no sacaron la nota más alta? R. 13 alumnos 6. Ejercicio El color de lo coches que circulan por una calle céntrica es el siguiente: NEGRO NEGRO ROJO AZUL ROJO VERDE VERDE BLANCO BLANCO BLANCO NEGRO NEGRO BLANCO NEGRO ROJO ROJO BLANCO BLA NCO NEGRO BLANCO AZUL ROJO NEGRO AZUL NEGRO BLANCO BLANCO VERDE VERDE ROJO Construye, una tabla con estos datos. Sol. clase Xi Negro Rojo Azul Verde Blanco
fi 8 6 3 4 9 30
Fi 8 14 17 21 30
hi 0.27 0.20 0.10 0.13 0.30 1.00
Hi 0.27 0.47 0.57 0.70 1.00
7. Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados: Considerando los siguientes datos elaborar la tabla correspondiente negro azul rojo negro
azul rojo amarillo azul
amarillo negro amarillo rojo
rojo amarillo azul negro
azul rojo rojo amarillo
64
8. Indica que variables son cualitativas y cuales cuantitativas 1. Comida Favorita. Var. Cualitativa 2. Profesión que te gusta. Var. Cualitativa 3. Número de goles marcados por la U. Var. Cuantitativa 4. Número de alumnos de tu Instituto. Var. Cuantitativa 5. El color de los ojos de tus compañeros de clase. Var. Cualitativa 6. Coeficiente intelectual de tus compañeros de clase. Var. Cuantitativa 9. Después de verificar en el cuaderno de denuncias de la comisaria de una localidad de Huancavelica, se verificó que las violaciones durante el año están registradas como sigue: clase Xi Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
fi 8 6 3 4 9 5 7 2 5 4 3 8
Elabore la tabla de frecuencias correspondiente Sol. clase Xi Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre
fi 8 6 3 4 9 5 7 2 5 4 3 8 64
Fi 8 14 17 21 30 35 42 44 49 53 56 64
hi 0.13 0.09 0.05 0.06 0.14 0.08 0.11 0.03 0.08 0.06 0.05 0.13 1.00
Hi 0.13 0.22 0.27 0.33 0.47 0.55 0.66 0.69 0.77 0.83 0.88 1.00
65
10. La siguiente información corresponde a una tabla de frecuencias sobre la preferencia de 80 fanáticos del cine, deteriorada por un accidente en el trabajo, se pide completar los datos de la tabla con os datos recuperados.
Clase Xi Drama Terror Comedia Aventura Guerra
fi 12 48
Fi
hi
Hi
60 0.125 0.075
80 Sol. Clase Xi Drama Terror Comedia Aventura Guerra
fi 12 48 10 6 4 80
Fi 12 60 70 76 80
hi 0.15 0.6 0.125 0.075 0.05 1
Hi 0.15 0.75 0.875 0.95 1
EJERCICIOS SOBRE VARIABLES CUANTITATIVAS DISCRETAS
Este tipo de variables cumple una cantidad de números exacta. Solo se maneja con valores enteros.
1. Número de alumnos de las aulas de un colegio de la región Ucayali 22 – 22 – 24 – 21 – 28 – 30 – 26 – 31 – 22 – 26 – 32 – 28 – 30 – 24 – 30 – 32 – 20 – 24 – 35 – 22 – 24 – 24 – 26 – 24 – 26 – 30 – 24 – 28 – 27 – 23 – 35 – 24 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 35 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 20 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 35 − 20 = 15 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 66
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3
clases [20 − 23[ [23 − 26[ [26 − 29[ [29 − 32[ [32 − 35]
𝑓𝑖 6 9 8 5 4 32
𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 6 0,19 15 0,28 23 0,25 28 0,16 32 0,12 --1
𝐻𝑖 0,19 0,47 0,72 0,88 1 ---
X 21,5 24,5 27,5 30,5 33,5
ℎ𝑖 % 𝐻𝑖 % 19 % 19 % 28 % 47 % 25 % 72 % 16 % 88 % 12 % 100 % 100 % ---
2. Número de Uvas de un racimo 18 - 16 - 20 – 22 - 25 – 24 – 30 – 28 – 27 – 42 – 28 – 20 – 22 – 33 – 32 – 26 – 25 - 20 – 24 – 38 – 35 – 16 – 16 – 30 – 30 – 26 – 27 – 28 – 30 – 16 – 24 - 32 – 38 – 40 – 24 – 25 – 40 – 42 - 35 - 40 – 29 – 34 – 32 - 35 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 40 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 42 − 16 = 26 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 26: 5 = 5,2 ≈ 5
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [16 − 21[ 8 8 0,18 [21 − 26[ 10 18 0,22 [26 − 31[ 11 29 0,25 [31 − 36[ 8 37 0,18 [36 − 42] 7 44 0,17 44 --1
𝐻𝑖 0,18 0,40 0,65 0,83 1 ---
X ℎ𝑖 % 𝐻𝑖 % 18,5 18 % 18 % 23,5 22 % 40 % 28,5 25 % 65 % 33,5 18% 83 % 38,5 17 % 100 % --- 100 % ---
3. Número de hijos por familia en un vecindario del Distrito de Villa el salvador 5–4–3–0–1–7–6–4–3–2–5–4–8–6–5–4–3–6–6–4–2–1 1–4–5–6–4–3–5–6–4–3–8–6–2–2–1–1–2–4–6–4–4–5 5 – 4 – 2 – 1 -7 - 2 Desarrollo: 67
𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 8 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 0 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 8 − 0 = 8 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [0 − 2[ 7 7 0,14 [2 − 4[ 12 19 0,24 [4 − 6[ 19 38 0,38 [6 − 8[ 10 48 0,20 [8 − 10] 2 50 0,04 50 --1
𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,14 1 14 % 14 % 0,38 3 24 % 38 % 0,76 5 38 % 76 % 0,96 7 20 % 96 % 1 9 4 % 100 % --- --- 100 % ---
4. Edades de los postulantes a la escuela de SOPNP en el primer día. 20 - 24 – 18 – 23 – 22 – 18 – 20 – 22 – 22 – 20 – 19 – 24 – 20 – 21 – 19 – 24 18 – 21 – 22 – 17 – 22 – 24 – 18 – 20 – 20 – 20 – 21 – 21 – 20 – 20 – 24 – 24 24 – 22 – 18 – 20 – 20 – 20 – 22 – 21 – 20 – 17 – 24 – 20 – 20 – 21 – 22 – 23 18 – 19 – 20 – 17 – 20 – 16 – 21 – 24 – 24 – 23 – 22 – 23 – 20 – 21 - 22 – 24 20 – 20 – 21 – 20 - 20 – 22 – 23 – 19 – 19 – 20 – 23 – 24 – 24 – 22 – 23 – 22 21 – 22 – 23 – 24 – 20 - 24 – 20 – 22 – 21 – 22 – 23 – 24 – 23 – 19 – 18 – 20 20 – 22 – 24 - 23
Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 24 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 16 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 24 − 16 = 8 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 8: 5 = 1,6 ≈ 2
clases [16 − 18[ [18 − 20[ [20 − 22[ [22 − 24[ [24 − 26]
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 4 4 0,04 13 17 0,13 39 56 0,39 27 83 0,27 17 100 0,17 100 --1
𝐻𝑖 0,04 0,17 0,56 0,83 1 ---
X ℎ𝑖 % 𝐻𝑖 % 17 4 % 4% 19 13 % 17 % 21 39 % 56 % 23 27 % 83 % 25 17 % 100 % --- 100 % --68
5. Calificaciones exactas de los parciales de Estadística en las aulas 01 y 02 ESOPNP 08 – 12 – 14 – 10 – 12 – 11 – 10 – 12 – 09 – 12 – 13 – 14 – 16 – 17 – 11 – 12 – 14 – 15 – 12 – 11 – 14 – 10 – 12 – 14 – 16 – 18 – 12 – 14 – 05 – 12 – 15 – 10 – 12 – 10 – 11 – 13 – 15 – 17 – 17 – 13 – 18 – 09 – 12 – 11 – 07 – 06 – 14 – 12 05 – 15 – 13 – 11 – 10 – 10 – 09 – 07 – 16 – 14 – 12 – 10 – 08 – 07 – 12 – 09 17 – 15 – 08 – 06 – 14 - 15 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 18 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 05 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 18 − 05 = 13 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 13: 5 = 2,6 ≈ 3
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [04 − 07[ 4 4 0,06 [07 − 10[ 10 14 0,14 [10 − 13[ 28 42 0,40 [13 − 16[ 19 61 0,27 [16 − 19] 9 70 0,13 70 --1
𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,06 5,5 6% 6% 0,20 8,5 14 % 20 % 0,60 11,5 40 % 60 % 0,87 14,5 27 % 87 % 1 17,5 13 % 100 % ----- 100 % ---
EJERCICIOS SOBRE VARIABLES CUANTITATIVAS CONTINUAS Estas pueden ser expresadas con decimales, toman cualquier valor dentro de un intervalo. 1. Peso del primer grupo de los postulantes a la ESOPNP. 62 – 62,3 – 70,2 – 63- 68,4 – 72 – 72,5 – 74 – 68,8 – 66,8 – 72 – 72, 4 – 82,4 78,4 - 64,6 – 82,4 – 68,8 - 72,2 – 74,6 – 68,8 – 65,8 – 64,8 – 78,6 – 82,6 – 78 68,8 – 68,2 – 78,4 – 86,6 – 70 – 72 – 72,6, 78, 8 – 65 – 65,4 – 65,8 – 84 67 – 62,8 -74,4 – 74 – 72,4 – 72,8 – 68,8 – 64,8 - 72,4 – 74 – 72,8 – 74,4 – 76,8
69
Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 84 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 62 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 84 − 62 = 22 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 22: 5 = 4,5 ≈ 5
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 𝐻𝑖 clases X ℎ𝑖 % 𝐻𝑖 % [61 − 66[ 10 10 0,2 0,2 63,5 20 % 20 % [66 − 71[ 12 22 0,24 0,44 68,5 24 % 44 % [71 − 76[ 17 39 0,34 0,78 73,5 34 % 78 % [76 − 81[ 6 45 0,12 0,90 78,5 12 % 90 % [81 − 86] 5 50 0,1 1 83,5 10 % 100 % 50 --1 ----- 100 % -2. Velocidad que llevan las combis que circulan en la panamericana norte en una determinada hora 82 – 84,4 – 90,4 -96,8 – 79,6 – 84,4 – 88,2 – 78 – 86,4 – 94,2 – 96,2 – 98,2 – 100 – 96,8 – 86,4 – 87,1 – 88,2 – 86,4 – 82,4 – 88,8 – 79,8 – 78,8 – 86,8 – 94 – 96,4 – 87,6 – 84,8 – 98,8 – 84,6 – 88,7 – 80 – 82,8- 102 – 100,4 – 98,8 – 96,6 – 82 – 82,6 – 92,5 – 96 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 102 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 78 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 102 − 78 = 24 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 24: 5 = 4,8 ≈ 5
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [78 − 83[ 9 9 0,22 [83 − 88[ 11 20 0,28 [88 − 93[ 6 26 0,15 [93 − 98[ 8 34 0,2 [98 − 103] 6 40 0,15 40 --1
𝐻𝑖 X ℎ𝑖 % 𝐻𝑖 % 0,22 80,5 22 % 22 % 0,50 85,5 28 % 50 % 0,65 90,5 15 % 65 % 0,85 95,5 20 % 85 % 1 100,5 15 % 100 % ----100 % ---
3. Estatura (en cm) de los postulantes a la ESOPNP 2019 165 – 166 – 168 – 176 – 168 – 166 – 173 – 173 – 174 – 173 – 175 – 172 – 180 – 171 – 171 – 166 – 165 – 167 – 165 – 177 – 176 – 170 – 172 – 172 – 174 – 178 – 165 – 169 – 166 – 167 – 165 – 175 – 174 – 174 – 168 – 173 – 174 – 173 – 170 – 165 – 167 – 168 – 170 – 174 – 178 – 172 – 174 – 168 – 169 - 171 – 173 – 17270
169 – 170 – 169 – 169 – 168 – 168 - 170 - 169 Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 180 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 165 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 180 − 165 = 15 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 15: 5 = 3
clases [165 − 168[ [168 − 171[ [171 − 174[ [174 − 177[ [177 − 180]
𝑓𝑖 15 16 14 11 4 60
𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 15 0,25 31 0,27 45 0,23 56 0,18 60 0,07 --1
𝐻𝑖 0,25 0,52 0,75 0,93 1 ---
X ℎ𝑖 % 𝐻𝑖 % 166,5 25 % 25 % 169,5 27 % 52 % 172,5 23 % 75 % 175,5 18 % 93 % 178,5 7 % 100 % --100 % ---
4. Tiempo (en segundos) que demoran en recorrer los 100 metros planos los postulantes a la ESOPNP 67 – 70 - 72 – 74 – 68 – 69 – 73 – 70 – 74 – 72 – 74 – 71 – 66 – 64 – 66 – 70 – 69- 65 – 66 – 68 – 69 – 65 – 69 – 65 – 64 – 72 – 74 – 69 – 68 – 69 – 71 – 70 – 72 – 69 – 64 – 66 – 65 – 66 – 67 – 68 – 69 – 70 – 68 – 64 – 65 – 71 – 73 – 66 – 64 – 68
Desarrollo: 𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 74 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 64 𝑅𝑎𝑛𝑔𝑜 = 𝐿𝑖𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 − 𝐿𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 74 − 64 = 10 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 5 (𝑟𝑒𝑐𝑜𝑚𝑒𝑛𝑑𝑎𝑏𝑙𝑒) 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑅𝑎𝑛𝑔𝑜 ∶ 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 = 10: 5 = 2
𝑓𝑖 𝐹𝑖 ℎ𝑖 = 𝑓𝑖 : 𝑛 clases [64 − 66[ 10 10 0,20 [66 − 68[ 8 18 0,16 [68 − 70[ 14 32 0,28 [70 − 72[ 7 39 0,14 [72 − 74] 11 50 0,22
𝐻𝑖 0,20 0,36 0,64 0,78 1
X ℎ𝑖 % 65 20 % 67 16 % 69 28 % 71 14 % 73 22 %
𝐻𝑖 % 20 % 36 % 64 % 78 % 100 % 71
50 ---
1
---
--- 100 %
---
5. Un club de básquet realizo una convocatoria para niños de 12 años. Se sabe que el primer día se presentaron 200 niños cuyas estaturas se agrupan en intervalos y se registra en una tabla. ¿Cuántos miden menos de 165 cm? clases [150 − 155[ [155 − 160[ [160 − 165[ [165 − 170[ [170 − 175]
𝑓𝑖 40 80 50 20 10 200
𝐹𝑖 40 120 170 190 200 ---
Rpta: Se necesitan 170 niños
Experimentos (o fenómenos) aleatorios.- Son aquellos en los que no se puede predecir el resultado. Experimento determinista.- Aquellos experimentos que si se puede predecir el resultado Ejemplos: a) Lanzar una moneda es un experimento aleatorio ya que no sabemos si obtendremos cara o cruz. b) Calentar agua a altas temperaturas es un experimento determinista ya que sabemos, con toda seguridad, que el agua hervirá a partir de determinada temperatura. c) Lanzar un dado es un experimento aleatorio ya que no podemos predecir el número que obtendremos. d) Extraer una bola de una urna que sólo contiene bolas rojas es un experimento determinista ya que podemos predecir que la bola extraída será roja. El espacio muestral .- Es el conjunto de los resultados posibles de un experimento aleatorio. Denotaremos el espacio muestral de un experimento con E o Ω. Ejemplo: a). El espacio muestral del lanzamiento de una moneda es; E={cara, cruz}E={cara, cruz} ya que éstas son las dos únicas posibilidades. b). El espacio muestral del lanzamiento de un dado es; E={1,2,3,4,5,6} pero también puede ser. E={par, impar} Un suceso aleatorio.- Es un elemento del espacio muestral. Es decir, cada uno de los posibles resultados de un experimento aleatorio es un suceso aleatorio. 72
Ejemplo 1: En el lanzamiento de una moneda, los sucesos aleatorios son: sale cara, sale cruz Decimos que un suceso aleatorio es un suceso imposible si nunca puede ocurrir. Ejemplo 2: En el lanzamiento de un dado, los siguientes sucesos son imposibles: sacar un 8, sacar un número mayor que 6. En contraposición, Decimos que un suceso aleatorio es un suceso seguro si siempre ocurre. Ejemplo 3: En el lanzamiento de un dado, los siguientes sucesos son seguros: sacar un número mayor que 0, sacar un número menor que 7. EJERCICIOS DE APLICACIÓN. 1) Si lanzamos al aire una moneda, entonces. Responder la opción correcta a) El espacio muestral es E = {Sacar cara}. b) El espacio muestral es E = {Sacar cara, Sacar cruz}. c) El espacio muestral es E = {Sacar cruz}. 2) Lanzamos un dado y nos interesa el número que sale, Responder la opción correcta: a) El espacio muestral es, E = {1,2,3,4,5,6} b) El espacio muestral es, E = {Sale un número par, Sale un número impar}. c) El espacio muestral es E = {Sale cara, Sale cruz}. d) Todas son falsas 3) Extraemos una carta de una baraja española y nos fijamos sólo en el palo de la carta extraída. a). No se trata de un experimento aleatorio. b). El espacio muestral es E = {1,2,3,4,5,6,7,8,9,10,11,12}. c). El espacio muestral es E = {Bastos, Copas, Oros, Espadas}. d). Todas las opciones son verdaderas. 4). Lanzamos al aire una moneda. Buscar la opción correcta: a). El suceso "Sacar cara" es más probable que el suceso "Sacar cruz". b). Los sucesos "Sacar cara" y "Sacar cruz" son sucesos contrarios. c). El espacio muestral es E = {Sacar cruz}. d). Todas la anteriores son falsas. 5) Lanzamos un dado. Indicar la opción correcta a) "Sacar un número impar" y "Sacar un número mayor que 3" son sucesos incompatibles.
73
b) "Sacar un número par" y "Sacar un número mayor que 3" son sucesos incompatibles. c) "Sacar un número impar" y "Sacar un número mayor que 5" son sucesos
incompatibles. d) Todas la anteriores son verdaderas.
Los sucesos incompatibles son los que no pueden darse al mismo tiempo. 6) En un bombo con 50 bolas numeradas del 1 al 50, se extrae una bola. a) Los sucesos "Sacar un número par" y "Sacar un número mayor que 38" son incompatibles. b) El espacio muestral es E={10,20,,30,40,50}E={10,20,,30,40,50} c) Se trata de un experimento determinista. d) Todas las opciones son falsas. 7) Se ha lanzado 5 veces una moneda y en todas las ocasiones se ha obtenido cara. a) En el siguiente lanzamiento es más probable que salga cara. b) En el siguiente lanzamiento es más probable que salga cruz. c) Es igual de probable que salga cara y que salga cruz. d) Todas las opciones son falsas. 8) En una urna hay 10 bolas numeradas del 1 al 10 y realizamos una extracción. Consideramos los sucesos A = "Sacar una bola con un número par" y B = "Sacar una bola menor que 2". a) La intersección de los sucesos A y B es igual al espacio muestral, E. Es decir, A∩B=EA∩B=E b) La intersección de los sucesos A y B es un suceso imposible. c) Los sucesos A y B son el mismo suceso. d) Todas las opciones son falsas. EJERCICIOS DE PERCENTILES 1. Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1.
74
Calcular para la primera serie los percentiles 32 y 85. Para la segunda, hallar los percentiles 20 y 70. Solución
3, 5, 2, 7, 6, 4, 9. La serie en orden es: 2, 3, 4, 5, 6, 7, 9. Al calcular los percentiles tenemos: P32 = 4 P85 = 7
3, 5, 2, 7, 6, 4, 9, 1. La serie en orden es: 1, 2, 3, 4, 5, 6, 7, 9. Al calcular los percentiles obtenemos: P20 = 2 P70 = 6
2. Una distribución estadística viene dada por la siguiente tabla: fi [10, 15)
3
[15, 20)
5
[20, 25)
7
[25, 30)
4
[30, 35)
2
Hallar el percentil 70. Solución: -Completamos la tabla con la frecuencia acumulada: xi
fi
Fi
[10, 15)
12.5
3
3
[15, 20)
17.5
5
8
[20, 25)
22.5
7
15 75
[25, 30)
27.5
4
19
[30, 35)
32.5
2
21
21 -Buscamos el intervalo donde se encuentra el percentil 70 Multiplicamos 70 por N, en este caso 21, y dividimos por 100
En la columna de las frecuencias acumuladas contiene a 14.7
, identificamos el intervalo que
La clase de P70 es: [20, 25) -Aplicamos la fórmula para el cálculo de percentiles de datos agrupados Extrayendo los siguientes datos:
Concluimos que:
3. Calcular el percentil 35 y 60 de la distribución de la tabla: fi [50, 60) 8 [60, 70) 10 [70, 80) 16 [80, 90) 14 [90, 100) 10 [100, 110) 5 [110, 120) 2
Fi 8 18 34 48 58 63 65
65 Solución: Cálculo del percentil 35 76
-Buscamos el intervalo donde se encuentra el percentil 35 Multiplicamos 35 por N, en este caso 65, y dividimos por 100
En la columna de las frecuencias acumuladas contiene a 22.75
identificamos el intervalo que
La clase de P35 es: [70, 80) -Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados Extraemos los siguientes datos:
Concluimos que:
Cálculo del percentil 60 -Buscamos el intervalo donde se encuentra el percentil 60 Multiplicamos 60 por N, en este caso 65, y dividimos por 100
Buscamos en la columna de las frecuencias acumuladas a 39
el intervalo que contiene
La clase de P60 es: [80, 90) -Aplicaremos la fórmula para el cálculo de percentiles para datos agrupados Extraemos los siguientes datos:
77
Concluímos que:
EJERCICIOS DE CUARTILES 4. Calcular los cuartiles las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 1
2
3 26/4 = 6.5 Q1 = 7 Q2 = Me = 10 (26 · 3)/4 = 19.5 Q3 = 14
5. Una distribución estadística viene dada por la siguiente tabla:
78
fi [10, 15)
3
[15, 20)
5
[20, 25)
7
[25, 30)
4
[30, 35)
2
Hallar los cuartiles 1º y 3º.
xi
fi
Fi
[10, 15)
12.5
3
3
[15, 20)
17.5
5
8
[20, 25)
22.5
7
15
[25, 30)
27.5
4
19
[30, 35)
32.5
2
21
21 Cálculo del primer cuartil Buscamos el intervalo donde se encuentra el primer cuartil, multiplicando 1 por N (21) y dividiendo por 4
Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 5.25 La clase de Q1 es: [15, 20) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 15 Fi–1= 3 fi = 5 ai = 5 79
Cálculo del tercer cuartil Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (21) y dividiendo por 4
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 18.75 La clase de Q1 es: [25, 30) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 25 Fi–1= 15 fi = 4 ai = 5
6. Dada la distribución estadística: fi [0, 5)
3
[5, 10)
5
[10, 15)
7
[15, 20)
8
[20, 25)
2
[25, ∞)
6
Calcular los Cuartiles 1º y 3º. Ampliamos la tabla con otra columna donde disponemos la frecuencia acumulada (F i): En la primera casilla colocamos la primera frecuencia absoluta. En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta correspondiente y así sucesivamente hasta la última, que tiene que se igual a N (31)
80
xi
fi
Fi
[0, 5)
2.5
3
3
[5, 10)
7.5
5
8
[10, 15)
12.5
7
15
[15, 20)
17.5
8
23
[20, 25)
22.5
2
25
6
31
[25, ∞)
31 Cálculo del primer cuartil Buscamos el intervalo donde se encuentra el primer cuartil, multiplicando 1 por N (31) y dividiendo por 4
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 7.75 La clase de Q1 es: [5, 10) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 5 Fi–1= 3 fi = 5 ai = 5
Cálculo del tercer cuartil Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (31) y dividiendo por 4
Buscamos en la columna de las frecuencias acumuladas (Fi) el intervalo que contiene a 23.25 La clase de Q1 es: [20, 25) 81
Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 20 Fi–1= 23 fi = 2 ai = 5
7. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente:
¿A partir de que valores se encuentran el 25% de los alumnos más pesados? Construimos la tabla: xi
fi
Fi
[60,63)
61.5
5
5
[63, 66)
64.5
18
23
[66, 69)
67.5
42
65
[69, 72)
70.5
27
92
[72, 75)
73.5
8
100
100 Buscamos el intervalo donde se encuentra el tercer cuartil, multiplicando 3 por N (100) y dividiendo por 4
82
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 75 La clase de Q3 es: [69, 72) Aplicaremos la fórmula para el cálculo de cuartiles para datos agrupados, extrayendo los siguientes datos: Li = 69 Fi–1= 65 fi = 27 ai = 3
EJERCICIOS DE DECILES 8. Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: Los deciles 2º y 7º. 3, 5, 2, 7, 6, 4, 9. 8 · (2/10) = 1.6 D2 = 2 8 · (7/10) = 5.6 D7 = 6 3, 5, 2, 7, 6, 4, 9, 1. 8 · (2/10) = 1.6 D2 = 2 8 · (7/10) = 5.6 D7 = 6 9. Calcular los deciles de la distribución de la tabla: fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
83
[100, 110)
5
63
[110, 120)
2
65
65 Cálculo del primer decil Buscamos el intervalo donde se encuentra el primer decil, multiplicando 1 por N (65) y dividiendo por 10
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.5 La clase de D1 es: [50, 60) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 50 Fi–1= 0 fi = 8 ai = 10
Cálculo del segundo decil Buscamos el intervalo donde se encuentra el segundo decil, multiplicando 2 por N (65) y dividiendo por 10
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 13 La clase de D2 es: [60, 70) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 60 Fi–1= 8 fi = 10 84
ai = 10
Cálculo del tercer decil
Cálculo del cuarto decil
Cálculo del quinto decil
Cálculo del sexto decil
Cálculo del séptimo decil
Cálculo del octavo decil
85
Cálculo del noveno decil
10.
Una distribución estadística viene dada por la siguiente tabla: fi [10, 15)
3
[15, 20)
5
[20, 25)
7
[25, 30)
4
[30, 35)
2
Hallar los deciles 3º y 6º. Completamos la tabla con a frecuencia acumulada: xi
fi
Fi
[10, 15)
12.5
3
3
[15, 20)
17.5
5
8
[20, 25)
22.5
7
15
[25, 30)
27.5
4
19
[30, 35)
32.5
2
21
21 Cálculo del tercer decil Buscamos el intervalo donde se encuentra el tercer decil, multiplicando 3 por N (21) y dividiendo por 10
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.3 La clase de D3 es: [15, 20) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: 86
Li = 15 Fi–1= 3 fi = 5 ai = 5
Cálculo del sexto decil Buscamos el intervalo donde se encuentra el sexto decil, multiplicando 6 por N (21) y dividiendo por 10
Buscamos en la columna de las frecuencias acumuladas (F i) el intervalo que contiene a 6.3 La clase de D6 es: [20, 250) Aplicaremos la fórmula para el cálculo de deciles para datos agrupados, extrayendo los siguientes datos: Li = 20 Fi–1= 8 fi = 7 ai = 5
87
EJEMPLOS DE VARIABLES N° 1
CUALITATIVA Mujer y hombre
2
Colores de un grupo de automóviles resguardados en un depósito. Nacionalidad de un grupo de detenidos en una comisaria. Tipos de drogas
3 4 5
CUANTITATIVA Edades de los funcionarios y funcionarias en una estación policial Cantidad de armas asignadas a un policía.
Número de personas que conforman una determinada división. Salario de los y las Oficiales policiales en Soles. Velocidad de algún automóvil al pasar un punto de control.
Color de los ojos de los detenidos en un procedimiento.
EJERCICIOS DE MEDIDAS DE DISPERSION 1. En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y cantidades se especifican en el siguiente cuadro:
EDADES
FRECUENCIA
[ 20; 25 >
2
[ 25; 30 >
5
[ 30; 35 >
2
[ 35; 40 ]
1
a) Hallar las medidas de tendencia central b) Hallar el Q1; D4; P16 c) Hallar la varianza, la desviación típica y el coeficiente de variación.
2. En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos en el cuadro dado.
INTERVALOS FRECUENCIA [ 20; 40 >
10
[ 40; 60 >
30
[ 60; 80 >
20 88
[ 80; 100 >
20
[ 100; 120 ]
20
3. Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la eo. 0 3 0 1 0 1 1 1 2 1 1 4 2 3 3 2 2 1 1 2 1 Calcula las medidas de dispersión. 4. Los siguientes datos representan el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. Calcular la varianza y la desviación típica. 5. Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias: Intervalo frecuencia 6.
0 a 10 8
10 a 20 34
20 a 30 76
30 a 40 60
40 a 50 31
50 a 60 28
60 a 70 13
Durante un periodo de 150 horas, se observó el número de policías por horas que acuden a una comisaria, encontrando: Policías
0
1
2
3
4
5
6
7
8
frecuencias
5
19
29
30
22
16
14
9
6
Determine la desviación típica y la media de las desviaciones medias.
7. La siguiente tabla se refiere a las estaturas en pulgadas, de un grupo de cadetes: Estatura frecuencia
60 a 62
63 a 65
66 a 68
69 a 71
72 a 74
5
18
42
27
8
Determine el rango, la media de las desviaciones absolutas, la desviación típica y el coeficiente de variación.
89
8. Dada la siguiente tabla de frecuencias, para datos sin agrupar: Valor
0
1
2
3
4
5
6
7
frecuencia
8
14
25
13
20
12
6
2
Calcule su varianza, la desviación típica, el coeficiente de variación, el rango, la media de las desviaciones absolutas.
9. Si se tienen dos conjuntos de datos expresados en las mismas unidades, ¿puede decirse que el que tenga mayor varianza presenta una mayor dispersión?
10. Si en un conjunto de datos todos los valores son negativos, ¿puede alguna de las medidas absolutas de dispersión ser negativa?
11. ¿Cuál es la diferencia entre las medidas absolutas y las medidas relativas de dispersión?. ¿Cuál de las dos mide mejor la variabilidad?
90
SOLUCION DE MEDIDAS DE DISPERSION
1.-En una redada en el distrito de Chorrillos se logró capturar avezados delincuentes cuyas edades y cantidades se especifican en el siguiente cuadro: Hallar la varianza y la desviación típica.
Edades [20 - 25> [25 - 30> [30 - 35> [35 - 40]
Frecuencia fi 2 5 2 1 10
Marca de clase Xi 22.5 27.5 32.5 37.5
Media =
fi*Xi 45.00 137.50 65.00 37.50 285.00
Frecuencia Acumulada 2 7 9 10
_
_
_
Xi X
(X i X )2
( X i X )2 * fi
-6 -1 4 9
36 1 16 81
72 5 32 81 190
28.5
Varianza =
19
Desviación típica =
4.36
2.- En un estudio estadístico se analizó la cantidad de balas que los efectivos policiales utilizan anualmente en el campo. Halla las medidas de dispersión, según los siguientes datos en el cuadro dado.
Frecuencia fi
Marca de clase Xi
[ 20; 40 >
10
[ 40; 60 >
30
[ 60; 80 > [ 80; 100 >
INTERVALOS
[ 100; 120 ]
fi*Xi
Frecuencia Acumulada
Xi X
(X i X )2
( X i X )2 * fi
30
300
10
-42
1764
17640
420
50
1500
40
-22
484
14520
660
20
70
1400
60
-2
4
80
40
20
90
1800
80
18
324
6480
360
20
110
2200
100
38
1444
28880
760
67600
2240
100
_
_
7200
Media =
_
_
| X
i
X | * fi
72
Varianza =
676
Desviación típica =
26.00
Media de las desviaciones medias =
22.40
3.- Se reporta la cantidad de libros leídos en un mes, por un grupo de 21 alumnos de la Escuela de Suboficiales de la PNP. 0 3 0 1 0 1 1 1 2 1 1 4 2 3 3 2 2 1 1 2 1 Calcula las medidas de dispersión. Frecuencia Acumulada
Xi X
(X i X )2
( X i X )2 * fi
0
3
-1.52
2.3220
6.9660
4.57
9
12
-0.52
0.2744
2.4694
4.71
2
10
17
0.48
0.2268
1.1338
2.38
3
3
9
20
1.48
2.1791
6.5374
4.43
1
4
4
21
2.48
6.1315
6.1315
2.48
23.2381
18.57
Frecuencia fi
Xi
fi*Xi
0
3
0
1
9
1
2
5
3 4
# de Libros
21
_
_
32
Media =
_
_
| X
i
X | * fi
1.52
Varianza =
1.1066
Desviación típica =
1.05
Media de las desviaciones medias =
0.88435
4.- Los siguientes datos representan el peso de 4 capitanes de la escuela de oficiales expresados en Kilogramos: 64; 70; 66 y 80. Calcular la varianza y la desviación típica.
Capitan
Frecuencia fi
Peso Xi
fi*Xi
Frecuencia Acumulada
Xi X
(X i X )2
( X i X )2 * fi
A
1
64
64
1
-6
36
36
B
1
70
70
2
0
0
0
C
1
66
66
3
-4
16
16
D
1
80
80
4
10
100
100
4
_
280
Media =
70
Varianza =
38
Desviación típica =
_
_
152
91
6.16
5.- Calcular la varianza y la desviación típica de la siguiente distribución de frecuencias:
Frecuencia
Marca de
Frecuencia
_
_
_ 2
2
EJERCICIOS N° 01 Se le pidió a un grupo de personas que marque la imagen de su bebida preferida, y los resultados fueron:
Cocacola Cocacola Pepsi Sprite fanta
Pepsi sprite fanta Pepsi
fanta Pepsi sprite fanta
sprite
cocola Cocacola
Pepsi Cocacola Cocacola sprite
Con los resultados obtenidos, elaborar una tabla de frecuencias. SOLUCION:
variable
Frecuenci a Absoluta
FANTA SPRITE PEPSI COCACOLA TOTAL
4 5 5 6 N = 20
Frecuencia Frecuencia Frec. acumulad relativa Relativa a acumulad a 4 0,20 0,20 9 0,25 0,45 14 0,25 0,70 20 0,30 1 1
La bebida elegida por la mayor cantidad de personas fue la Cocacola, mientras que la fanta fue elegida por la menor cantidad de personas
GRAFICO INCOMPLETO variable
Frecuencia absoluta
Frecuencia acumulada
Frecuencia Frec. Relativa relativa acumulada
DUFF SPRITE PEPSI COCACOLA
4
4 9 14 20
0,20
5
0,25 0,30
0,20 0,45 1 92
TOTAL
N = 20
1
GRAFICO DE BARRAS - POLIGONO DE FRECUENCIA
7 6 5 4
3 2 1 0 FANTA
SPRITE
PEPSI
COCACOLA
EJERCICIOS N° 02 Elaborar una tabla de frecuencias a partir de las temperaturas máximas registradas en el mes de agosto en la ciudad de Lima: Temperaturas: 17 18 20 16 19 17 16 20 20 15 18 16 19
15 18 15 18 19 17
16 17 16 17 18 15
19 18 19 18 20 19
Elaboramos una tabla de frecuencias, agregando la frecuencia porcentual y la frecuencia porcentual acumulada. SOLUCION: Tempera tura (°C)
Frecuencia Frecuenci Absoluta a acumulad a
Frecuen cia relativa
Frec. Relativa acumulada
Frec. porcentu al
Frec. % acumulad a
93
15 16 17 18 19 20 TOTAL
4 5 5 7 6 4 N =31
4 9 14 21 27 31 ---------
0,129 0,161 0,161 0,226 0,194 0,129 1
0,129 0,290 0,451 0,677 0,871 1 ----------
12,9 % 16,1% 16,1% 22,6% 19,4% 12,9% 100%
12,9% 29,0% 45,1% 67,7% 87,1% 100% --------
La Temperatura que se registró en una mayor cantidad de días es la T° de 18 grados que se registró en 22,6% de días, mientras que las T° menos evidenciadas fueron las de 15 grados y 20 grados, que se evidenciaron en un 12,9% de los dias
GRAFICO INCOMPLETO T° (°C)
15 16 17 18 19 20 TOTAL
Frecuencia Frecuencia Frecuencia Frec. Absoluta acumulad relativa Relativa a acumulad a 4 4 0,129 0,129 5 9 0,290 14 0,161 0,451 7 21 0,226 6 0,194 0,871 4 31 0,129 1 N =31 --------1 ----------
Frec. porcentual
Frec. % acumulad a
12,9 %
12,9% 29,0% 45,1%
16,1% 22,6% 19,4% 100%
87,1% 100% --------
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
8 7 6 5 4 3 2 1 0 15
16
17 fi
18
19
20
fi
94
EJERCICIOS N° 03 Se le pidió a un grupo de personas que indiquen su color favorito, y se obtuvo los siguientes resultados: negro azul rojo negro
azul rojo amarillo azul
amarillo negro amarillo rojo
rojo amarillo azul negro
azul rojo rojo amarillo
Con los resultados obtenidos, elaborar una tabla de frecuencias. SOLUCION: variable color
Frecuencia Frecuencia Frecuencia Absoluta acumulad relativa a
Frec. Relativa acumulad a 0,20 0,45 0,70 1
NEGRO 4 4 0,20 AZUL 5 9 0,25 AMARILLO 5 14 0,25 ROJO 6 20 0,30 TOTAL N = 20 1 El color elegido por la mayor cantidad de personas fue el Rojo, mientras que el color negro fue elegido por la menor cantidad de personas. GRAFICO INCOMPLETO variable color
Frecuenci a absoluta
NEGRO AZUL AMARILLO ROJO TOTAL
4 5 5 N = 20
Frecuencia Frecuencia Frec. acumulad relativa Relativa a acumulad a 4 0,20 0,20 0,25 14 0,25 0,70 20 1 1
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
95
7 6 5 4 3 2 1 0 NEGRO
AZUL
AMARILLO
ROJO
EJERCICIOS N° 04 En una tienda de autos, se registra la cantidad de autos Toyota vendidos en cada día del mes de Setiembre. 0; 1; 2; 1; 2; 0; 3; 2; 4; 0; 4; 2; 1; 0; 3; 0; 0; 3; 4; 2; 0; 1; 1; 3; 0; 1; 2; 1; 2; 3
Con los datos obtenidos, elaborar una tabla de frecuencias. Frecuencia Frecuencia Frecuencia Frec. Autos absoluta acumulada relativa Relativa vendidos acumulada 0 8 8 0,267 0,267 1 7 15 0,233 0,500 2 7 22 0,233 0,733 3 5 27 0,167 0,900 4 3 30 0,100 1 TOTAL N =30 1
Frecuencia Frecuencia porcentual porcentual acumulada 26,7 % 26,7 % 23,3 % 50,0% 23,3 % 73,3% 16,7 % 90,0% 10,0 % 100% 100 %
n =30 GRAFICO INCOMPLETO 96
Frecuencia Frecuencia Frecuencia Frec. Autos absoluta acumulada relativa Relativa vendidos acumulada 0 8 8 0,267 1 7 0,233 0,500 2 7 22 0,233 3 27 0,167 0,900 4 3 30 0,100 1 TOTAL N =30 1
Frecuencia Frecuencia porcentual porcentual acumulada 26,7 % 26,7 % 23,3 % 23,3 % 73,3% 16,7 % 90,0% 100% 100 %
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA 9 8 7 6 5 4 3 2 1 0 0
1
2 fi
3
4
fi
EJERCICIOS N° 05 Se recogen las hojas caídas de un árbol, y se registran sus longitudes en centímetros. Elaboramos una tabla de frecuencias con 4clases o Intervalo 1 4 8 11 16
1 5 8 12 16
2 6 9 12 18
3 6 10 13 18
3 6 10 15 20
SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 20 - 1=19 2. hallando n° de intervalos = K 97
El problema ya nos está dando el número de clase o intervalo = 4 3. hallando amplitud o tamaño de intervalo = A A= R/k = 19/4 =4,75 REDONDEANDO = 5
variable longitudes
Marcas de clase
Frecuencia Frecuencia absoluta acumulada
[0-5) [5-10) [10-15) [15-20] TOTAL
2,5 7,5 12,5 17,5
6 7 6 6 25
6 13 19 25
Frecuencia Frec. relativa Relativa acumulad a 0,24 0,24 0,28 0,52 0,24 0,76 0,24 1 1
n=25 Podemos ver que la Clase o Intervalo con un mayor de cantidad de valores es la segunda clase o intervalo [5-10),en donde tenemos una mayor cantidad de hojas caídas del árbol.
GRAFICO INCOMPLETO variable longitudes
Marcas de clase
Frecuencia Frecuencia absoluta acumulada
[0-5) [5-10) [10-15) [15-20] TOTAL
2,5 7,5
6
17,5
6 6 25
6 13 25
Frecuencia Frec. relativa Relativa acumulad a 0,24 0,24 0,28 0,52 0,24 0,24 1 1
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
98
7.2 7 6.8 6.6 6.4 6.2 6 5.8 5.6 5.4 2,5
7,5
12,5
17,5
EJERCICIOS N° 06 Una compañía telefónica registra la duración (en minutos) de las llamadas que recibe en su call center. Elabore una tabla de frecuencia con los resultados
Duración de las llamadas : 0,1 3,4 5,1 7,2
0,4 3,9 5,3 8,1
1,6 4,5 5,5 9,4
2,6 4,8 5,6 9,9
3,3 4,8 5,9 9,9
Elabore una tabla de frecuencias con los resultados obtenidos.
SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 9,9 – 0,1= 9,8 2. hallando n° de intervalos = K Aplicando regla de Strugges: K = 1+3,322logn = 1+3,322.log20 (donde n es igual al número de datos) = 5.32 , para poder trabajar mejor redondeamos y tenemos 5 99
3. hallando amplitud o tamaño de intervalo = A A= R/k = 9,8/5 = 1,96 REDONDEANDO = 2
variable duración
Marcas de clase
[0-2) [2-4) (4-6) (6-8) [8-10] TOTAL
1 3 5 7 9 -------
Frecuencia Frecuencia Frecuencia Frecuencia frecuencia Frecuencia absoluta acumulad relativa relativa porcentual porcentual a acumulad acumul a 3 3 0,15 0,15 15% 15% 4 7 0,20 0,35 20% 35% 8 15 0,40 0,75 40% 75% 1 16 0,05 0,80 5% 80% 4 20 0,20 1 20% 100% 20 -----1 ------100% -------n=20
La clase o categoría con una mayor cantidad de valores fue la [4-6), con 8 valores, con 40% del total de los datos, mientras que la clase o categoría con una menor cantidad de valores fue la [6-8) con solo 1 valor y 0,05 del total de los datos GRAFICO INCOMPLETO variabl e duració n [0-2) [2-4) (4-6) (6-8) [8-10] TOTAL
Marcas de clase
1 3 5 7 9 -------
Frecuencia Frecuencia Frecuencia Frecuencia frecuencia Frecuencia absoluta acumulad relativa relativa porcentual porcentual a acumulad acumul a 3 3 0,15 0,15 15% 15% 7 0,20 20% 8 15 0,40 0,75 40% 75% 1 0,05 0,80 80% 4 20 0,20 1 20% 100% 20 -----1 ------100% --------
100
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
9 8 7 6 5 4 3 2 1 0 1
3
5 fi
7
9
fi
EJERCICIOS N° 07 Las notas de 35 alumnos en el examen final de estadística, calificado del 0 al 10, son las siguientes: 0; 0; 0; 0; 1; 1; 1; 1; 2; 2; 2; 3; 3; 3; 3; 4; 4; 4; 4; 5; 5; 5; 5; 6; 6; 6; 7; 7; 7; 8; 8; 8; 9; 10; 10. Con los datos obtenidos, elaborar una tabla de frecuencias con 5 intervalos o clases. SOLUCION:
CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min = 10-0 =10 2. hallando n° de intervalos = K El enunciado del problema me dice 5 intervalos, entonces K =5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 10/5 = 2 101
Intervalo
Marca de clase
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
[0-2) [2-4) [4-6) [6-8) [8-10) TOTAL
1 3 5 6 9
8 7 8 6 6 35
8 15 23 29 35
0,229 0,200 0,229 0.171 0,171 1
Frec. Relativa acumulada 0,229 0,429 0,658 0,829 1
n =35 GRAFICO INCOMPLETO Intervalo
Marca de clase
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
[0-2) [2-4) [4-6) [6-8) [8-10) TOTAL
1 3 5 6 9
8
8 15 23
0,229 0,200 0,229 0.171
8 6
35 35
Frec. Relativa acumulada 0,229 0,658 0,829 1
1
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
102
9 8 7 6 5 4 3 2 1 0 1
3
5 fi
6
9
fi
EJERCICIOS N° 08 Un grupo de atletas se está preparando para una maratón siguiendo una dieta muy estricta. A continuación, viene el peso en kilogramos que ha logrado bajar cada atleta gracias a la dieta y ejercicios. 0,2 4,6 6,4 12,1
8,4 9,1 15,2 9,6
14,3 4,3 16,1 8,7
6,5 3,5 19,8 12,1
3,4 1,5 5,4 3,2
Elabore una tabla de frecuencias con los resultados obtenidos. SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min =19,8-0,2=19,6 2. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log20 (donde n es igual al número de datos) = 5,32 103
para poder trabajar mejor redondeamos y tenemos 5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 19,6/5 = 3,92 redondeando = 4 Intervalo
Marca de clase
[0-4) 2 [4-8) 6 [8-12) 10 [12-16) 14 [16-20) 18 TOTAL GRAFICO INCOMPLETO
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
5 5 4 4 2 20
5 10 14 18 20
0,25 0,25 0,20 0,20 0,10 1
Intervalo
Marca de clase
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
[0-4) [4-8) [8-12) [12-16) [16-20) TOTAL
2 6 10
5
5 10
0,25 0,25 0,20
4 4
18
18 20
20
0,10 1
Frec. Relativa acumulada 0,25 0,50 0,70 0,90 1
Frec. Relativa acumulada 0,25 0,50 0,90 1
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
104
6 5 4
3 2 1 0 2
6
10 fi
14
18
fi
EJERCICIOS N° 09 Una tienda en línea registra el tiempo que tarda la empresa de correos en hacer llegar su mercadería a los clientes. Los tiempos en días registrados son los siguientes: 2 22 13 20
7 6 32 13
10 25 13 6
16 5 29 12
19 20 18 35
Con los datos obtenidos, elaborar una tabla de frecuencias. SOLUCION: CONSTRUYENDO INTERVALOS: 1. hallando rango = R R= X max - X min =35-2 =33 2. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log20 (donde n es igual al número de datos) = 5,32 para poder trabajar mejor redondeamos y tenemos 5 3. hallando amplitud o tamaño de intervalo = A A= R/k = 33/5 = 6,6 = 7
Intervalo
Marca de
Frecuencia
Frecuencia
Frecuencia
Frec. 105
[0-7) [7-14) [14-21) [21-28) [28-35) TOTAL
clase
absoluta
acumulada
relativa
Relativa acumulada 0.2 0.5 0.75 0.85 1
3.5 10.5 17.5 24.5 31.5
4 6 5 2 3 20
4 10 15 17 20
0.2 0.3 0.25 0.1 0.15 1
Frecuencia absoluta
Frecuencia acumulada
Frecuencia relativa
4 6 5 2 3 20
4 10
0.2 0.3 0.25
GRAFICO INCOMPLETO Intervalo
[0-7) [7-14) [14-21) [21-28) [28-35) TOTAL
Marca de clase
10.5 24.5 31.5
17 20
0.15 1
Frec. Relativa acumulada 0.2 0.75 0.85 1
n=20 GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
7 6 5 4 3 2 1 0 3.5
10.5
17.5 fi
24.5
31.5
fi
106
EJERCICIOS N° 10 Se ha recolectado los pesos en kilos de un grupo de personas. Elaborar una tabla de distribución de frecuencias con intervalos 63 60 58 64
62 62 62 61
60 63 63 56
58 62 60 59
60 61 56 61
62 59 63 59
63 61 62 65
61 62 58 62
60 65 54 61
55 60 63 63
58 60 62 63
58 61 62 63
59 61 62 64
59 61 62 65
59 61 62 65
SOLUCION: Ordenando los datos de menor a mayor 54 60 61 63
55 60 61 63
56 60 62 63
56 60 62 63
58 60 62 63
CONSTRUYENDO INTERVALOS: 4. hallando rango = R R= X max - X min = 65 – 54= 11 5. hallando n° de intervalos = K Aplicando regla de Sturges: K = 1+3,322.logn = 1+3,322.log40 (donde n es igual al número de datos) = 6,28679791 para poder trabajar mejor redondeamos y tenemos 6 6. hallando amplitud o tamaño de intervalo = A A= R/k = 11/6 = 1,8333
REDONDEANDO = 2
Interval o
Marca de clase (Xi)
f.absolut a ( fi)
f.relativa (hi)
f.relativa acumulada (Hi)
[54-56) [56-58)
55 57
2 2
0,05 0,05
0,05 0,1
f.relativa porcentual simple (hi %) 5% 5%
f.relativa porcentual acumulado (Hi %) 5% 10 107
[58-60) [60-62) [62-64) [64-66) TOTAL
59 61 63 65 -------
6 12 15 3 40
0,15 0,3 0,375 0,075 1
0,25 0,55 0,925 1 -------
15% 30% 37,5 % 7,5% 100%
25 55 92,5 100 -------
f.relativa porcentual simple (hi %) 5% 5% 15% 30%
f.relativa porcentual acumulado (Hi %) 5%
n=40 GRAFICO INCOMPLETO Interval o [54-56) [56-58) [60-62) [62-64) [64-66) TOTAL
Marca de clase (Xi)
f.absolut a ( fi)
f.relativa (hi)
f.relativa acumulada (Hi)
55 57 59 61 63 65 -------
2 2 6
0,05
0,05 0,1 0,25
0,15 0,3 0,375 0,075 1
15 3 40
0,925 1 -------
25 % 55 % 92,5 % 100 % -------
7,5% 100%
GRÁFICA DE BARRAS- POLÍGONO DE FRECUENCIA
16 14 12 10
8 6 4 2 0 55
57
59
61
fi
63
65
fi
108