Guia de Trabajo - Estadistica General

1 Visión Ser una de las 10 mejores universidades privadas del Perú al año 2020, reconocidos por nuestra excelencia aca

Views 112 Downloads 1 File size 4MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

1

Visión Ser una de las 10 mejores universidades privadas del Perú al año 2020, reconocidos por nuestra excelencia académica y vocación de servicio, líderes en formación integral, con perspectiva global; promoviendo la competitividad del país.

MISIÓN Somos una universidad privada, innovadora y comprometida con el desarrollo del Perú, que se dedica a formar personas competentes, íntegras y emprendedoras, con visión internacional; para que se conviertan en ciudadanos responsables e impulsen el desarrollo de sus comunidades, impartiendo experiencias de aprendizaje vivificantes e inspiradoras; y generando una alta valoración mutua entre todos los grupos de interés.

Universidad Continental Material publicado con fines de estudio Código: ASUC01275

2

Gestión Curricular Asignatura: Estadística general

Presentación RESULTADO DE APRENDIZAJE Al finalizar la asignatura, el estudiante será capaz de analizar información utilizando los métodos y técnicas de la estadística descriptiva y probabilidad, para brindar información que sirva para la toma de decisiones.

ORGANIZACIÓN DE LOS APRENDIZAJES

Unidad I

Unidad II

Unidad III

Unidad IV

Introducción, tipos de distribuciones y gráficos

Distribuciones bidimensionales y gráficos comparativos

Medidas resumen o descriptivas

Distribuciones de probabilidad

Resultado de

Resultado de

Resultado de

Resultado de

Aprendizaje:

Aprendizaje:

Aprendizaje:

Aprendizaje:

Al finalizar la unidad,

Al finalizar la unidad,

Al finalizar la unidad,

Al finalizar la unidad,

el

el

el

el

estudiante

capaz

de

será utilizar

distribuciones unidimensionales gráficos

y

estadísticos

estudiante

será

estudiante

será

capaz de calcular las

capaz de calcular e

e

los

medidas

interpretar

las

tendencia

central,

variación,

posición

interpretar

resultados

de

distribuciones bidimensionales

en

relativa

de

acontecimientos

de

deformación

estadísticos.

estudiante

capaz de comparar

para la interpretación resultados

será

sus

actividades

diarias.

de

y para

probabilidades distribuciones

discretas y continuas en

acontecimientos

interpretar

datos

cotidianos

relacionados

a

carrera profesional.

su

de

carrera profesional. Semana 1 - 4

Semana 5 - 8

en

Semana 9 - 12

Semana 13 - 16

TIEMPO MINIMO DE ESTUDIO: Unidad I:

Unidad II:

Unidad III:

16 horas

16 horas

16 horas

Unidad IV: 16 horas

su

Gestión Curricular Asignatura: Estadística general

Introducción La Asignatura de Estadística General pertenece al plan curricular de cursos generales, el cual se desarrolla dentro de la modalidad presencial, la presente guía - auto formativo material idóneo dentro de su formación Universitaria. La Estadística General está orientada a adquirir herramientas básicas para reforzar sus habilidades de inter relación con la sociedad en todos sus ámbitos. Es así, a asignatura trata de aquellos temas que permite a los estudiantes desarrollar sus habilidades lógicas y más importantes aún, aplicar lo aprendido en el ámbito profesional y solucionar problemas del día a día. De esta manera se desarrollará competencia general de aprendizaje autónomo, debidamente

organizados

y

sistematizados

tomando

en

cuenta

los

principios

pedagógicos, por ello en primer lugar se presenta la teoría acompañados de ejemplos, de igual modo se muestran ejercicios desarrollados, ejercicios y problemas plantados y finalmente la meta cognición de su aprendizaje. Para el estudio la guía se sugiere la siguiente secuencia en cada resultado de aprendizaje: Al finalizar la unidad I, el estudiante será capaz de utilizar distribuciones unidimensionales y gráficos estadísticos para la interpretación de resultados estadísticos. Al finalizar la unidad II, el estudiante será capaz de comparar e interpretar los resultados de las distribuciones bidimensionales en acontecimientos de sus actividades diarias. Al finalizar la unidad III, el estudiante será capaz de calcular las medidas de tendencia central, variación, posición relativa y deformación para interpretar datos relacionados a su carrera profesional. Al finalizar la unidad IV, el estudiante será capaz de calcular e interpretar probabilidades en distribuciones discretas y continuas en acontecimientos cotidianos de su carrera profesional. Por tanto Ud. requiere de un conocimiento directo, práctico de la Estadística General que permita aplicar y emprender nuevos retos, tomando casos prácticos de su entorno y logrando conocimientos de la Estadística general a través de una aplicación objetiva, la motivación y nuevas metodologías para desarrollar y consolidar su desarrollo universitario. Los autores

Índice Contenido Unidad I ..................................................................................................................................................... 1 Semana 1 .................................................................................................................................................. 2 INTRODUCCIÓN A LA ESTADÍSTICA................................................................................................. 2 SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA.............................................................................. 4 1

DEFINICIÓN. .............................................................................................................................. 4

2

UTILIDAD E IMPORTANCIA. .................................................................................................... 4

3

CLASES DE ESTADISTICA. ........................................................................................................ 4

4

TERMINOS UTILIZADOS EN LA ESTADISTICA........................................................................ 5



Variable cualitativa nominal: .............................................................................................. 6



Variable cualitativa ordinal: ................................................................................................ 6

4

REDONDEO DE DATOS: .............................................................................................................. 7

Semana 2 ................................................................................................................................................ 12 SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS ............ 14 1

ORGANIZACIÓN DE LOS DATOS. ...................................................................................... 14

2

DISTRIBUCIÓN DE FRECUENCIAS. ....................................................................................... 14

3

CLASES DE FRECUENCIAS. ................................................................................................... 14

1.1.

FRECUENCIAS SIMPLES: ........................................................................................................ 14

1.2.

FRECUENCIAS ACUMULADAS: ........................................................................................... 16

2.

TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA. ..................................................... 17

3.

TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA. ...................................... 18

Semana 3 ................................................................................................................................................ 21 DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES ............................................................. 21 SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS ......... 23 1.

RECOMENDACIONES: ........................................................................................................... 23



Los intervalos deben tener igual amplitud. ................................................................... 23

2.

PASOS: ...................................................................................................................................... 23

Semana 4 ................................................................................................................................................ 30 GRÁFICOS ESTADÍSTICOS ................................................................................................................ 30 SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES....................................................................... 32 Entre las gráficas más utilizadas tenemos: .................................................................................... 32 1.

GRÁFICA DE BARRAS. ........................................................................................................... 32

2.

HISTOGRAMA. ......................................................................................................................... 32

Gestión Curricular Asignatura: Estadística general

3.

POLÍGONO DE FRECUENCIAS. ............................................................................................ 33

4.

OJIVA........................................................................................................................................ 33

5.

GRÁFICA DE PUNTOS. ........................................................................................................... 33

6.

GRÁFICO DE PARETO. ........................................................................................................... 34

7.

GRÁFICO DE TALLO Y HOJAS. ............................................................................................ 34

3.

PICTOGRAMA. ........................................................................................................................ 34

4.

GRÁFICA CIRCULAR. ............................................................................................................. 35

5.

DIAGRAMA DE DISPERSIÓN................................................................................................. 35

6.

PIRAMIDE DE POBLACIÓN. .................................................................................................. 36

7.

CAJA Y BIGOTES. ................................................................................................................... 36

Unidad II ................................................................................................................................................. 41 EVALUACIÓN DE LA PRIMERA UNIDAD ....................................................................................... 42 Semana 6 ................................................................................................................................................ 44 SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUALITATIVOS Y MIXTOS. ................................................................................................................. 46 1.

DATOS BIVARIADOS: ............................................................................................................. 46

2.

DISTRIBUCIONES ABSOLUTAS MARGINALES: ................................................................... 46

Semana 7 ................................................................................................................................................ 53 SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUANTITATIVOS. ................................................................................................................................. 55 1.

VARIABLES BIDIMENSIONALES. ........................................................................................... 55

2.

DIAGRAMA DE DISPERSIÓN:................................................................................................ 55

Semana 8 ................................................................................................................................................ 61 EVALUACIÓN PARCIAL .................................................................................................................... 61 Unidad III ............................................................................................................................................... 62 Semana 9 ................................................................................................................................................ 63 SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL. ........................................................................ 65 1.

LA MEDIA ARITMÉTICA (𝒙; 𝒙; 𝑴; 𝑴(𝒂)): ............................................................................. 65

2.

LA MODA (𝑴𝒐): ...................................................................................................................... 67

3.......................................................................................................................................................... 69 LA MEDIANA (𝑴𝒆): ........................................................................................................................ 69 4.......................................................................................................................................................... 72 RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA. ............................................... 72 Semana 10 .............................................................................................................................................. 76 SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN. .............................................................. 78

2

Gestión Curricular Asignatura: Estadística general

1.

LA VARIANZA Y LA DESVIACIÓN ESTANDAR: ................................................................. 78

2.

COEFICIENTE DE VARIACIÓN: ............................................................................................ 81

Semana 11 .............................................................................................................................................. 87 SESIÓN 21: CUARTILES Y PERCENTILES. ......................................................................................... 89 1.

CUARTILES: ............................................................................................................................... 89

2.

PERCENTILES: ........................................................................................................................... 92

4.

RANGO INTERCUARTIL. ......................................................................................................... 94

5.

ANALISIS EXPLORATORIO DE DATOS................................................................................. 94

6.

GRÁFICA DE CAJA Y VIGOTE. ............................................................................................ 95

7.

COEFICIENTE DE CURTOSIS. ................................................................................................. 95

Semana 12 ............................................................................................................................................ 101 EVALUACIÓN DE LA TERCERA UNIDAD ..................................................................................... 101 Unidad IV .............................................................................................................................................. 103 Semana 13 ............................................................................................................................................ 104 SESIÓN 25: PROBABILIDADES FUNDAMENTOS. ......................................................................... 106 1.

FUNDAMENTOS. .................................................................................................................... 106

2.

EXPERIMENTOS ALEATORIOS Y ESPACIO MUESTRAL. .................................................. 107

3.

CONCEPTO DE PROBABILIDAD. ........................................................................................ 111

4.

TIPOS DE PROBABILIDAD. ................................................................................................... 111

5.

LEYES O AXIOMAS DE LA PROBABILIDAD. ..................................................................... 113

Semana 14 ............................................................................................................................................ 117 SESIÓN 27: DISTRIBUCIÓN BINOMIAL, POISSON. ...................................................................... 119 1.

DISTRIBUCIÓN BINOMIAL. .................................................................................................. 119

2.

DISTRIBUCIÓN POISSON. .................................................................................................... 123

Semana 15 ............................................................................................................................................ 129 SESIÓN 1: DISTRIBUCIÓN NORMAL .............................................................................................. 131 1.

Introducción. ........................................................................................................................ 131

2.

Definición............................................................................................................................... 132

3.

Curva Norma Tipificada (estándar, o reducida). ...................................................... 134

Semana 16 ............................................................................................................................................ 143 EVALUACIÓN FINAL ........................................................................................................................ 143

3

Unidad I Resultado de Aprendizaje de la Unidad I: Al finalizar la unidad, el estudiante será capaz de utilizar distribuciones unidimensionales y gráficos estadísticos para la interpretación de resultados estadísticos

ORGANIZACIÓN DE APRENDIZAJES TEMAS Y SUBTEMAS SEMANA N° 1

ACTIVIDADES Actividad N° 1

1. Introducción a la estadística 2. Estadística, división, objetivos, definiciones, tipos de datos. Métodos y fuentes de recolección de datos.

Desarrolla Diagnóstica.

SEMANA N° 2 3. Distribuciones de Frecuencias Unidimensionales: Variables cualitativas, grafico e interpretación. Gráficos: sectores y barras. 4. Base de datos e variables cualitativas y cuantitativas SEMANA N° 3 5. Distribuciones de Frecuencias Unidimensionales Variables cuantitativas, grafico e interpretación. Gráficos: histograma, ojiva, polígono de frecuencias. 6. Distribuciones de Frecuencias Unidimensionales: Variables cuantitativas aplicando spss..

la

1

evaluación

Actividad N° 2 Elabora un organizador del conocimiento haciendo uso de la guía. Responde las interrogantes de la guía.

EVALUCIÒN Prueba de entrada: Evaluación desarrollo

2

individual

de

Consolidado 1: Evaluación individual de desarrollo teórico-práctico

Actividad N° 3 Aplica una encuesta a sus compañeros de clase. Elabora tabla de frecuencias utilizando la variable género y carrera profesional. Actividad N° 4 Elabora una base de datos de la encuesta aplicada a sus compañeros de clase, utilizando el programa del SPSS.

SEMANA N° 4: ………. 7. Gráficos estadísticos especiales: Pareto, tallo y hoja, pictograma, Otras gráficas. 8. Gráficos estadísticos especiales: Pareto, tallo y hoja, pictograma, otras gráficas con spss - Excel.

1

Gestión Curricular Asignatura: Estadística general

Semana 1 INTRODUCCIÓN A LA ESTADÍSTICA La palabra Estadística procede del vocablo “Estado”, pues era función principal de los Gobiernos de los Estados establecer registros de población, nacimientos, defunciones, impuestos, cosechas... La necesidad de poseer datos cifrados sobre la población y sus condiciones materiales de existencia han debido hacerse sentir desde que se establecieron sociedades humanas organizadas. Es difícil conocer los orígenes de la Estadística. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas.

La isla de Cerdeña, existen monumentos prehistóricos pertenecientes a los Nuragas, estos monumentos constan de bloques de basalto superpuestos sin mortero y en cuyas paredes se encontraban grabados toscos, signos que han sido interpretados con mucha verosimilizad como muescas que servían para llevar la cuenta del ganado y la caza. Los babilonios usaban ya pequeñas tablillas de arcilla para recopilar datos en tablas sobre la producción agrícola y los géneros vendidos o cambiados mediante trueque. En China existían los censos chinos ordenados por el emperador Tao hacia el año 2.200 a.C.

2

Gestión Curricular

LECTURA

Asignatura: Estadística general HISTORIA LA ESTADISTICA 758 Durante los mil años posteriores a la caída del Imperio Romano se hicieron muy pocas operaciones estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve y por Carlomagno en los años 758 y 762, respectivamente. En Francia se realizaron algunos censos parciales de siervos durante el siglo IX. 1532 Debido al temor que Enrique VII tenía de la peste, en el año 1532 empezaron a registrarse en Inglaterra las defunciones causadas por esta enfermedad. En Francia, más o menos por la misma época, la ley exigía a los clérigos registrar los bautismos, fallecimientos y matrimonios. 1540 Alrededor del año 1540, el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, que comprendía datos acerca de la organización política, instituciones sociales, comercio y poderío militar. 1632 Durante un brote de peste que apareció a fines del siglo XVI, el gobierno inglés comenzó a publicar estadísticas semanales de los decesos. Esa costumbre continuó muchos años, y en 1632 los llamados Bills of Mortality (Cuentas de Mortalidad) ya contenían datos sobre los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt compiló documentos que abarcaban treinta años, mediante los cuales efectuó predicciones sobre el número de personas que morirían de diversas enfermedades, así como de las proporciones de nacimientos de hombres y mujeres que cabía esperar. El trabajo de Graunt, condensado en su obra Natural and political observations… made upon the Bills of Mortality (Observaciones políticas y naturales…hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo de inferencia y teoría estadística. 1691 Gaspar Neumann, un profesor alemán que vivía en Breslau, se propuso destruir la antigua creencia popular de que en los años terminados en 7 moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción, pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros. 1760 Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla en el término latino s t a t u s, que significa “estado” o “situación”. Esta etimología aumenta el valor intrínseco de la palabra por cuanto que la estadística revela el sentido cuantitativo de las más variadas situaciones. FUENTE: Freedman, D. (1999). «From association to causation: Some remarks on the history of statistics». Statistical Science 14 (3): 243-258. doi:10.1214/ss/1009212409. (Revised versión, 2002). Hald, Anders (2003). A History of Probability and Statistics and Their Applications before 1750. Hoboken, NJ: Wiley. ISBN 0-471-47129-1.

3

Gestión Curricular Asignatura: Estadística general

ESTADÍSTICA Propósito:  Define la estadística e identifica los tipos de datos en situaciones cotidianas.

SESIÓN 1: INTRODUCCIÓN A LA ESTADÍSTICA 1 DEFINICIÓN. La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva. 2

UTILIDAD E IMPORTANCIA.

La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de un fenómeno a través de cierto tiempo. En Perú, el Instituto Nacional de Estadística e Informática (INEI) se encarga de recabar información estadística y geográfica de todo el país, en diferentes áreas y contextos. Los datos que publica sirven para dar a conocer, a cualquier persona, la situación en la que se encuentra el área de donde se obtuvo la información. Los métodos estadísticos se utilizan prácticamente en investigaciones de todas las áreas de conocimiento, tanto en el ámbito académico, como en el profesional y laboral; en todos ellos la finalidad es poder resolver un problema, entendiendo que un problema queda definido como la diferencia entre lo real y lo deseado, en donde la estadística muestra la realidad para que el investigador pueda analizar sus deseos y con ello tomar una decisión. 3

CLASES DE ESTADISTICA.

a) Estadística descriptiva. Se orienta en la presentación y clasificación de los datos obtenidos de la población que se analiza, es decir, describe datos. Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difícil estudiar a la población completa. Esta rama de la estadística concluye a partir de los datos, como la estimación de un resultado.

4

Gestión Curricular Asignatura: Estadística general b) Estadística inferencial. Permite sacar conclusiones sobre una población a partir de una muestra, cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene, utilizando a la probabilidad cuando no se está seguro de la verdad. 4 TERMINOS UTILIZADOS EN LA ESTADISTICA. a) Población: Conjunto universal de elementos (personas, objetos, cosas, etc.) que contienen uno o más características observables medibles de naturaleza cualitativa o cuantitativa. A cada elemento de la población se denomina unidad elemental de observación o unidad estadística (UE) Ejemplo: La población de estudiantes de la Universidad Continental. En la que cada estudiante (UE) tiene características observables (cualitativas y cuantitativas) tales como: Estado civil, lugar de procedencia, preferencias, peso, talla, rendimiento académico, etc. b) Muestra: Es una parte o un subconjunto representativo de la población seleccionada mediante técnicas de muestreo, con el fin de obtener información acerca de la población de la cual proviene. Ejemplo: La muestra de estudiantes del III ciclo de la facultad de Arquitectura de la Universidad “Continental”. c) Datos estadísticos: Son números o medidas que han sido recogidos como resultado de observaciones, los que se pueden ser comparados, analizados e interpretados. Ejemplo: Notas vigesimales: 00, 04, 08, 10, 15 20 Peso: 2kg, 15kgf, 45,6kg, 80N, etc. d) Variable estadística: Es cada una de las características definida en la población por el investigador, que pueden tomar dos o más valores (cualidades o números). Se representan con una letra del alfabeto: X, Y, Z, etc. Ejemplo: En la población formada por los empleados de la Universidad “Continental”, algunas variables estadísticas definidas son:

5

Gestión Curricular Asignatura: Estadística general VARIABLES (características) X: genero Y: estado civil Z: peso en kg W. número de hijos P: ingresos mensuales

VALORES (cualitativo o cuantitativo) Masculino, femenino Soltero, casado, viudo, divorciado 0, 1, 2, 3, 4,…………….. 0, 1, 2, etc Números reales positivos

Clases de variables: Variable cualitativa: Son las cualidades, aquí no se pueden realizar operaciones matemáticas. Ejemplo: Género: masculino, femenino. Profesión: docente, abogado, ingeniero, etc. Estado civil: soltero, casado, viudo, etc. Es decir, las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: Variable cualitativa nominal: Presenta modalidades no numéricas que no admiten un criterio de orden. Ejemplo: El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. Variable cualitativa ordinal: Presenta modalidades no numéricas, en las que si admite un orden. Ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º, ... Medallas de una prueba deportiva: oro, plata, bronce. Variable cuantitativa: Son valores que se obtienen por medición o conteos, aquí se pueden realizar operaciones matemáticas. Ejemplo: N° de estudiantes. Temperatura, N° de hijos, Ingresos mensuales, etc. Dentro de las variables cuantitativas se encuentran las variables: discretas y continuas.

6

Gestión Curricular Asignatura: Estadística general Variable cuantitativa discreta: Estas variables no admiten ningún valor entre dos valores consecutivos fijos. Ejemplo: N° de hijos: una familia puede tener 0, 1, 2, 3…..hijos, No puede tener 1.5 o 3.7 hijos. Variable cuantitativa continua: Admite cualquier valor de un intervalo considerado o entre dos valores dados, en la práctica los valores numéricos de las variables continuas siempre son valores aproximados. Ejemplo: Estatura o talla en metros, puede ser: 1.20; 1.45; 1.75; etc Peso en kilogramos, puede ser: 50; 50.12; 50.20; 51; etc. Aproximados y redondeados. e) Escalas de medición: ESCALA NOMINAL

ORDINAL

INTERVALO

RAZÓN

DEFINICIÓN Son aquellas variables cualitativas que establecen la distinción de los elementos en diversas categorías (nombres, etiquetas), sin implicar algún orden entre ellas

EJEMPLOS Color de ojos, género, etc.

Aquellas variables cualitativas que implican orden entre sus categorías, pero no grados de distancia igual entre ellas, están referidas a un orden de jerarquía, donde las categorías expresan una posición de orden.

Grado de Instrucción, grado de satisfacción de los clientes, etc. Temperatura Coeficiente de inteligencia

Son aquellas variables cuantitativas que suponen a la vez orden y grados de distancia iguales entre las diversas categorías, pero no tienen origen natural, sino convencional, tiene un cero relativo. Estas variables comprenden a la vez todos los casos anteriores, distinción, orden, distancia y origen único natural; el valor se expresa con un número real tiene un cero absoluto.

Edad, peso, ingresos, producción, etc.

4 REDONDEO DE DATOS: Consiste en aproximar un número a su valor cercano. Casos: a) Cuando la primera cifra eliminada sea menor de 5, la última cifra a redondear debe mantenerse igual.

7

Gestión Curricular Asignatura: Estadística general Ejemplos: 12.743 redondeando a dos decimales, queda 12.74 85.613 redondeando a un decimal, queda 85.6 b) Cuando la primera cifra eliminada es mayor de 5, la última cifra a redondear debe aumentar en uno. Ejemplos: 1.658 redondeando a dos decimales, queda 1.66 124.869 redondeando a un decimal, queda 124.9 Según ITINTEC (Instituto de Investigación Tecnológica Industrial y de Normas Técnicas) considera un caso especial (c), cuando la cifra a eliminar es cinco. c) Cuando la primera cifra eliminada sea 5, la última cifra retenida debe incrementarse en una unidad si este es impar, debe mantenerse igual si la última cifra retenida es par o cero. Ejemplos: 12.475 redondeando a dos decimales, queda 12.48 14.425 redondeando a dos decimales, queda 14.42 24.205 redondeando a dos decimales, queda 24.20

Problemas Desarrollados En los ejercicios 1 al 4 determine si el valor dado es un estadístico o un parámetro. 1) Tamaño de la familia. Se selecciona una muestra de hogares y el número promedio (media) de personas por familia es de 2,58 (según datos de la Oficina censal peruana). 2) Política. En la actualidad, el 42% de los gobernadores regionales del Perú son de izquierda. 3) Titanic. En un estudio de los 2223 pasajeros del “Titanic”, se encontró que 706 sobrevivieron cuando se hundió. 4) Audiencia televisiva. Se selecciona una muestra de ciudadanos peruanos y se descubre que la cantidad de tiempo promedio (media) que ven la televisión es de 4,6 horas al día Respuestas: 1.Estadístico

2. Parámetro

3. Parámetro

4. Estadístico

5) Determine si la variable es cualitativa o cuantitativa y señale si son discretas o continuas. a) Lugar de residencia b) Número de vecinos de un edificio. c) Profesiones de empleados. d) Número de llamadas telefónicas. e) Consumo de gasolina cada 200 km.

8

Gestión Curricular Asignatura: Estadística general Respuestas:

a. Cualitativo

b. Cuantitativo discreto

c. Cualitativo

d. Cuantitativo discreto

e. Cuantitativo continuo

Problemas Propuestos

1. Identificar si cada una de las siguientes situaciones que se presenta a continuación representa a una población (P) o a una muestra (M). Luego señale cuántas corresponden a muestras. a) Alumnas egresadas del Colegio Estatal “Nuestra Señora del Rosario” durante el año 2018…………………………………………………………………………………………

(

)

b) Habitantes del distrito del Tambo………………………………………………………….

(

)

c) Habitantes de la primera cuadra de la Av. San Carlos……………………………….

(

)

d) 50% de los alumnos del Curso de Estadística General de la UCCI………………….

(

)

e) 60 mujeres embarazadas atendidas en el Hospital “D.A. Carrión” …………………

(

)

f)

30 hojas de papel bond……………………………………………………………………...

(

)

g) 15 reos del penal de Huamancaca Chico, inculpados por narcotráfico…………

(

)

h) Niños nacidos en la Clínica “Ortega” durante los primeros cinco días del mes…

(

)

i)

60% de las raciones atendidas en un negocio de comida………………………….

(

)

j)

El CI de los estudiantes del 5to. Año de Secundaria de todos los colegios estatales de Junín……………………………………………………………………………...

(

)

k) Edad de 25 pacientes con VIH atendidos en Es Salud Junín…………………………

(

)

l)

(

)

Precio del pollo en 10 puestos de venta del Mercado Mayorista de Huancayo…

2. Señale cuántas son variables cuantitativas continuas de la siguiente lista: a) Número de cursos que usted está cursando este semestre. b) Número de penales atajados por el arquero de la selección nacional durante todo el campeonato Copa Libertadores. c) Peso de sus compañeros de estudio con los que está llevando el curso de Estadística General d) Volumen de una botella de gaseosa comprada en el cafetín de la universidad. e) Número de libros que usted leyó el año pasado. 3. Identificar la clasificación (variable cualitativa, cuantitativa discreta, cuantitativa continua) a la que pertenecen las siguientes variables. Luego señale cuántas son variables cualitativas. a) Número de estudiantes matriculados en la UCCI durante el período 2018 – 10 Variable: ______________________________

9

Gestión Curricular Asignatura: Estadística general b) Color de cabello. Variable: ______________________________ c) Distancia que recorren dos personas caminando durante 5 minutos. Variable: ______________________________ d) Número de cursos desaprobados por un grupo de alumnos. Variable: ______________________________ e) Talla de recién nacidos. Variable: ______________________________ f)

Temperatura corporal. Variable: ______________________________

g) Peso de los alumnos del Primer Semestre de la EAP de Psicología. Variable: ______________________________ 4. Identificar el nivel de medición que se utilizará para medir las siguientes variables. Luego señale cuántas son de nivel de razón. a) Número de personas que vive en el distrito de Orcotuna. ________________________________________ b) Temperatura medida en la escala de Fahrenheit ________________________________________ c) Edad en años cumplidos de un grupo de personas ________________________________________ d) Ingreso familiar (bajo, medio, alto) ________________________________________ e) Peso de recién nacidos. ________________________________________ f)

Perímetro del cráneo de un cadáver ________________________________________

g) Estado civil de una persona ________________________________________ h) Clase social (baja, media, alta) ________________________________________ i)

Simpatía política de un estudiante ________________________________________

10

Gestión Curricular Asignatura: Estadística general j)

Marcas de cerveza ________________________________________

k) Velocidad de un vehículo (en Km/h) ________________________________________ l)

Signo del zodiaco de una persona ________________________________________

m) Presión de aire de una llanta (en Nw/cm2) ________________________________________ 5. Una marca de cloro líquido se vende en botellas cuya etiqueta dice contener 128 onzas (un galón). Debido a múltiples quejas recibidas de consumidores, INDECOPI decide investigar si la cantidad promedio en las botellas es realmente 128 onzas. En su puesto de inspector de INDECOPI decide visitar algunos comercios y compra 100 botellas de esta marca de cloro para corroborar las quejas de los consumidores. El resultado indica que la cantidad promedio en las botellas es de 126 onzas. Indique en términos del problema cuánto vale el parámetro. _________________________________________________________________________________________ _________________________________________________________________________________________

Video de Apoyo

Video 1: Introducción a la Estadística. https://youtu.be/njgYCEOdb6k Video 2: Tipos de variables, escala de medición según tipo de variable, ejemplos https://youtu.be/GOtwu5xiXnw

11

Gestión Curricular Asignatura: Estadística general

Semana 2 DISTRIBUCIONES DE FRECUENCIAS UNIDIMENSIONALES Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista inglés (1890-1962). Realizó muchos avances en la estadística, una de las contribuciones más importante fue la inferencia estadística que descubrió en 1920.

John Graunt, A John Graunt se le atribuye haber iniciado la demografía formal. Sentó las bases de la “regularidad estadística” al encontrar una “ley” para la mortalidad. Edmund Halley, En 1693 retomó las tablas sobre la expectativa de vida de la población diseñadas por John Graunt y las perfeccionó proponiendo algunas fórmulas para calcular la «población estacionaria» y la manera como la edad está distribuida dentro de esa población, lo cual fue un gran adelanto no sólo para los futuros estudios sobre demografía sino para el cálculo actuarial aplicable en el negocio de los seguros de vida Fisher, Ronald Aylmer, Científico, matemático, estadístico, biólogo evolutivo y genetista inglés (1890-1962). Realizó muchos avances en la estadística, una de las contribuciones más importante fue la inferencia estadística que descubrió en 1920.

12

Gestión Curricular Asignatura: Estadística general

LECTURA

JOHN GRAUNT Y LA PRIMERA TABLA DE MORTALIDAD Comerciante bien relacionado en Londres, tuvo acceso a los boletines parroquiales de mortalidad desde finales del siglo XVI, su base documental. En 1662 depositaba cincuenta ejemplares de su Natural and Political Observations on the Bills of Mortality en la Royal Sciety, que creó un comité para examinar la obra y emitió un informe favorable. El propio rey Carlos II se interesó por la obra y le propuso como miembro. En un momento en que el continente europeo era devastado por las epidemias, esta obra resume análisis de las décadas anteriores, y aporta estadísticas vitales sobre los ciudadanos de Londres, incluyendo las causas de mortalidad, la población total de Londres y la monogamia, entre otros. Es pionero en calcular la razón de masculinidad al nacer, la tasa bruta de mortalidad y detecta la estacionalidad de algunos fenómenos demográficos. Añadió así profundidad al análisis, y la información numérica empezó a tener uso más allá de los fines políticos y militares. Pero su contribución más relevante aquí es la elaboración de la primera tabla de mortalidad. Los registros de que disponía (Bills of mortality de la ciudad de Londres) sólo especificaban la causa de muerte y el sexo de los fallecidos, pero no su edad. Graunt dedujo la proporción de muertes anteriores a los 6 años sumando las muertes causadas por enfermedades infantiles y la mitad de las causadas por sarampión y viruela. Esto sumaba el 36% de todas las muertes, de manera que podía suponer una supervivencia del 64% a esa edad. Pero el libro no explica cómo estimó el resto de filas de la tabla, lo que ha supuesto un motivo de debate constante en la historiografía demográfica. Algunos creen que simplemente inventó los números, pero otros piensan que Graunt ya estaba dando por supuesta una ley constante de crecimiento exponencial (µ = .047) que, interpolada, proporciona los valores intermedios de la tabla. Este supuesto de una fuerza de mortalidad constante será el manejado poco después por Jan de Witt y Jan Hudde en sus tablas de mortalidad). Fuente: Camúñez Ruiz, José Antonio y Basulto Santos, Jesús. (2012) En el alumbramiento de la estadística moderna: John Graunt. Septem Ediciones. García González, Juan Manuel. 2011, Observaciones políticas y naturales hechas a partir de los boletines de mortalidad. EMPIRIA. Revista de Metodología de Ciencias Sociales. N.o 21, enero-junio, pp. 185-199. ISSN: 1139-5737. Vilquin Éric (1978). Une édition critique en français de l’œuvre de John Graunt (16201674). Présentation d’un ouvrage hors collection de l’INED. Population, 33e année, n°2, pp. 413-423.

13

Gestión Curricular Asignatura: Estadística general

VARIABLES CUALITATIVAS Propósito:  Define las variables estadísticas e identifica los tipos de frecuencias en situaciones cotidianas. SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUALITATIVAS

1 ORGANIZACIÓN DE LOS DATOS. Se entiende por organización de datos a la técnica de resumir y presentar datos, donde determinado la técnica de agrupamiento de las observaciones, procedemos a su cálculo, construyendo la tabla de frecuencias. Posteriormente podremos visualizar tales frecuencias (características) de forma gráfica con el diagrama o gráfico estadístico apropiado. 2 DISTRIBUCIÓN DE FRECUENCIAS. Se denomina distribución de frecuencias a los cuadros o tablas numéricos de las variables recopiladas para su fácil comprensión, interpretación y análisis. En general una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Aquí se encuentran las diferentes frecuencias tales como: La frecuencia absoluta. Frecuencia relativa. Frecuencia porcentual. Frecuencias acumuladas Estos datos organizados también pueden representarse en gráficos estadísticos. Los datos ordenados y presentados en una tabla para su mejor interpretación y análisis, es necesario procesarlos en los siguientes casos: a) Tabla de frecuencias para datos no agrupados en intervalos de clase (variable discreta) b) Tabla de frecuencias para datos agrupados en intervalos de clase (variable continua) 3

CLASES DE FRECUENCIAS. 1.1. FRECUENCIAS SIMPLES: a) Frecuencia absoluta o simple (ni o fi) Es representado como el número de veces que se repite el dato. La suma de todas las frecuencias absolutas es igual al total (N) de datos observados

14

Gestión Curricular Asignatura: Estadística general Ejemplo: En la siguiente tabla se representa las calificaciones obtenidas por los estudiantes del III ciclo de Administración de la Universidad Continental, en la asignatura de Estadística. Xi

ni

𝑋1 = 00

𝑛1 = 6

𝑋2 = 05

𝑛2 = 4

𝑋3 = 10

𝑛3 = 12

𝑋4 = 15

𝑛4 = 13

𝑋5 = 20

𝑛5 = 5 𝑁 = 40

Si n2 =4, se lee: hay 4 alumnos que tienen la nota de 05 b)

Frecuencia relativa (hi) Es el cociente de la frecuencia absoluta (n i) entre el número de observaciones realizadas(N).

𝒉𝒊 =

𝒏𝒊 𝑵

La suma de todas las frecuencias relativas es igual a uno (1). Ejemplo: De el ejemplo anterior.

c)

hi

Xi

ni

𝑋1 = 00

𝑛1 = 6

0.150

𝑋2 = 05

𝑛2 = 4

0.100

𝑋3 = 10

𝑛3 = 12

0.300

𝑋4 = 15

𝑛4 = 13

0.325

𝑋5 = 20

𝑛5 = 5

0.125

𝑁 = 40

1.000

ℎ3 =

𝑛3 12 = = 0.3 𝑁 40

Frecuencia relativa simple porcentaje o porcentual (hi%)

𝒉𝒊 % = 𝒉𝒊𝒙𝟏𝟎𝟎% La suma total de las frecuencias porcentuales es igual a cien (100%)

15

Gestión Curricular Asignatura: Estadística general Ejemplo: Utilizando el ejemplo anterior. hi

hi%

𝑛1 = 6

0.150

15.0%

𝑋2 = 05

𝑛2 = 4

0.100

10.0%

𝑋3 = 10

𝑛3 = 12

0.300

30.0%

𝑋4 = 15

𝑛4 = 13

0.325

32.5%

𝑋5 = 20

𝑛5 = 5

0.125

12.5%

𝑁 = 40

1.000

100.0%

Xi

ni

𝑋1 = 00

Esta frecuencia, nos permite responder preguntas como: ¿Qué porcentaje de estudiantes tienen notas de…….? 1.2. FRECUENCIAS ACUMULADAS: a. Frecuencia absoluta acumulada (Ni o Fi) Es la suma de las frecuencias absolutas simples y la dada en cada categoría o fila. Es decir: N1 = n1 N2 = n1 + n2 N3 = n2 + n3 N4 = n3 + n4 ……………………….etc.

b. Frecuencia relativa acumulada (Hi) Es la suma sucesiva de las frecuencias relativas o simples anteriores y la dada. Se define en cada fila como el cociente de la frecuencia absoluta acumulada (Ni) y el número total de observaciones. 𝑯𝒊 = H1 = h 1

𝑵𝒊 𝑵

H2 = h 1 + h 2 H3 = h 2 + h 3 H4 = h 3 + h 4 ……………………..etc.

c. Frecuencia relativa acumulada porcentual (Hi% ó Pi%) Es la suma sucesiva de las frecuencias relativas o simples porcentuales (hi%) anteriores y la dada. Se define en cada fila como:

𝑯𝒊% = 𝑯𝒊 𝒙 𝟏𝟎𝟎%

16

Gestión Curricular Asignatura: Estadística general d. Marca de clase (Xi ó mi) Es el punto medio del intervalo:

𝒎𝒊 =

𝑳𝒊+𝑳𝒔 𝟐

Problemas Desarrollados

2.

TABLAS DE FRECUENCIAS – VARIABLES CUALITATIVA. Ejemplo: En una encuesta de opinión sobre preferencias de bebidas gaseosas por su marca: coca cola (K), inca cola (I), sprite (S). 30 consumidores dieron las siguientes respuestas. S

S

K I

I

I

S

I

I

S K K S S

K K S K I

I K I

K I K S

S S I

I

a) Construir la distribución de frecuencias. b) Graficar la distribución circular y en barras. Solución 

Construimos la tabla de frecuencias: CATEGORIA DE VARIABLE Xi I S K TOTAL



FRECUENCIA ABSOLUTA

FRECUENCIA RELATIVA

ni 11 10 9 N =30

hi 0.367 0.333 0.300 1.000

FRECUENCIA RELATIVA PORCENTUAL hi% 36.7 33.3 30.0 100.0

ÁNGULO PARA GRÁFICO CIRCULAR ∝ = 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 1320 120° 108° 3600

Determinando los ángulos para el gráfico circular. Utilizamos: ∝ = 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 Para la categoría “I” ∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎= 0.367 x 3600 = 1320. Para la categoría “S” ∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 = 0.333 x 3600 = 119.88 = 1200 Para la categoría “K” ∝= 𝒉𝒊𝒙𝟑𝟔𝟎𝟎 = 0.300 x 3600 = 1080

17

Gestión Curricular Asignatura: Estadística general

ENCUESTA SOBRE LAS BEBIDAS GASEOSAS

K 30%

I 37%

S 33%

Representando la distribución en el gráfico de barras.

Bebidas gaseosas

40 36.7

NI%

30

33.3

30

20 10 0

I

S

K

XI

3.

TABLA DE FRECUENCIAS – VARIABLE CUALITATIVA DISCRETA. Para realizar el cuadro de distribución de frecuencias de una variable discreta, primero ordenamos los “n” datos recopilados en forma ascendente. Podemos representar los datos en tres gráficos: diagrama de barras, polígono de frecuencias y gráfico de sectores circulares. Ejemplo: En una encuesta a 28 hogares, para saber sobre el número de hijos por familia (X), se obtuvieron las siguientes respuestas. 4

1

2

0

2

3 2 1 4 3 2 3 4 3 2 4 Construir la distribución de frecuencias de la variable X.

3

2

0

2

1

6

9

4

3

2

9

6

Realizar la gráfica de barras.

18

Gestión Curricular Asignatura: Estadística general Solución  Construimos la tabla de distribución de frecuencias del número de hijos por familia(X): Xi 0 1 2 3 4 6 9 TOTAL

ni 2 3 8 6 5 2 2 N = 28

hi 0.07 0.11 0.29 0.21 0.18 0.07 0.07 1.00

hi% 7 11 29 21 18 7 7 100.00

 Realizamos el gráfico de barras (Xi y ni)

XI

Número de hijos

9 6 4 3 2 1 0

0

2

4

6

8

10

NI

Problemas Propuestos

1) En la Universidad Continental se ha realizado una encuesta 200 alumnos sobre el tipo de atención de esta institución. El 32% afirma que está muy contento, el 40% está contento, el 23% no está contento, y el resto muy descontento. Elabore la tabla de frecuencias e interprete. 2) Se ha llevado a cabo una encuesta a 27 empresas sobre el número de microcomputadoras que tienen, encontrando los siguientes resultados: 5

7

9

7

8

5

2

4

3

6

8

7

6

9

8

4

6

4

8 5 9 6 7 9 4 7 5 3) Los directivos de “Real Plaza” realizan una prueba de mercado respecto a la facilidad de navegación en su nuevo sitio web. Selecciona al azar 18 usuarios frecuentes y les solicita

19

Gestión Curricular Asignatura: Estadística general que califique la relativa facilidad para navegar como mala (M), buena (B), excelente (E) o sobresaliente (S)”. Los resultados son los siguientes, elabore la tabla de frecuencias e interprete. B M M

E S M

S E B

B S M

M B E

S E S

4) Para un estudio de accesibilidad, durante 30 días anotamos el número de plazas libres de aparcamiento a las 5 de la tarde. Elabore la tabla de frecuencias e interprete. 1 2 2

1 3 1

5 1 5

0 1 0

5 2 2

3 1 2

0 2 1

3 0 3

3 1 3

2 3 2

5) Se realizó una encuesta a los trabajadores de la casa de préstamos “Perú Cash”, sobre el número de hijos. Elabore la tabla de frecuencias e interprete. 2 3 3

1 2 2

2 3 1

4 2 3

1 0 2

3 3 1

2 4 2

Video de Apoyo

Video 1: Tipos de variables estadísticas | Cuantitativas Cualitativas (https://www.youtube.com/watch?v=nCszHELuwxk) Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores (https://www.youtube.com/watch?v=rsYCe73_q-I)

20

Gestión Curricular Asignatura: Estadística general

Semana 3 DISTRIBUCIÓN DE FRECUENCIAS UNIDIMENSIONALES En el siglo XIX, la estadística entra en una nueva fase de su desarrollo con la generalización del método para estudiar fenómenos de las ciencias naturales y sociales. Galton (1.8221.911) y Pearson (1.857-1936) se pueden considerar como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la estadística inductiva.

David Huntsberger: Utilizo la palabra estadística con números apilados en grandes arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y así sucesivamente. Sebastián Muster, durante el siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística. Gaspar Neumann, Sionista, teólogo y filólogo alemán, nacido en 1648 y muerto en 1715. Sus principales obras son: Génesis linguae sanctae, Exodus linguae sanctae y Formulario de todas las oraciones.

21

Gestión Curricular Asignatura: Estadística general

LECTURA

ETAPAS DE DESARROLLO DE LA ESTADÍSTICA La historia de la estadística está resumida en tres grandes etapas o fases. 1. Primera Fase: Los Censos: Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos. 2. Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política: Las ideas mercantilistas extrañan una intensificación de este tipo de investigación. Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural. La escuela inglesa proporciona un nuevo progreso al superar la fase puramente descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política. Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durante las dos terceras partes del siglo XIX. 3. Tercera Fase: Estadística y Cálculo de Probabilidades: El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos “cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su análisis”. Fuente: Pearson, Egon (1978). The History of Statistics in the 17th and 18th Centuries against the changing background of intellectual, scientific and religious thought (Lectures by Karl Pearson given at University College London during the academic sessions 1921-1933). Nueva York: MacMillanPublishng Co., Inc. p. 744. ISBN 0-02-850120-9. Salsburg, David (2001). The Lady Tasting Tea: How Statistics Revolutionized Science in the Twentieth Century. ISBN 0-7167-4106-7. Stigler, Stephen M. (1986). The History of Statistics: The Measurement of Uncertainty before 1900. Belknap Press/Harvard University Press. ISBN 0-674-40341-X.

22

Gestión Curricular Asignatura: Estadística general

VARIABLES CUANTITATIVAS Propósito:  Organizar datos en una tabla de distribución de frecuencias para variables cuantitativas continuas. SESIÓN 3: DISTRIBUCIÓN DE FRECUENCIAS PARA LAS VARIABLES CUANTITATIVAS Este cuadro se usa cuando la variable cuantitativa es continua o cuando el número de valores distintos de una variable discreta es muy grande (N > 20). 1. RECOMENDACIONES:  Agrupar los datos en no más de 20 intervalos ni menos de 5  Los intervalos deben tener igual amplitud. 2. PASOS: 1° Identifique el dato mayor y dato menor. Dato mayor = Xmax Dato menor = Xmin 2° Hallamos el rango o recorrido (R). R = Xmax – Xmin 3° Hallamos el número de intervalos (K).  Si: n ≥ 10, por la Regla de Sturges

K = 1 + 3.322 log(n)  Por la Ley de Portugal:  Si: 25 ≤ n ≤ 400

K = ξ𝒏  Si: 50 < n ≤ 100

K = 1. 8914 + 3.991 log(n)  Si: n ≤ 50

K = 1 + 3.322 log(n)  Si: n > 100

K = 2.7560 + 5.8154 log(n)

23

Gestión Curricular Asignatura: Estadística general 4° Hallamos la amplitud o la longitud del intervalo de clase (C):

𝑪=

𝑹 𝑲

El producto R = K.C debe ser el mínimo y que cubra el recorrido de la variable (K.C ≥ R), es decir primero se considera el producto igual al rango, si no hay este número se considera el mayor más cercano al rango. Si los datos de la muestra (n) son enteros, entonces C debe ser entero Si los datos de la muestra (n) tienen uno o dos decimales, entonces C debe tener uno o dos decimales. 5° Hallamos los intervalos: Si ya se conoce el Xmin, K y C Utilizamos la siguiente fórmula:

𝑰𝒌 = [𝑿𝒎𝒊𝒏 + (𝒌 − 𝟏). 𝑪 − 𝑿𝒎𝒊𝒏 + 𝒌. 𝑪] Ejemplo: Las calificaciones obtenidas por un grupo de 45 estudiantes en una prueba escrita de estadística son: 63

89

36

49

56

64

59

35

78

43 64 59 53

53 72 60 64

70 52 67 76

57 51 57 44

62 62 67 73

43 60 61 56

68 71 67 62

62 61 51 63

26 55 81 60

Construya la tabla de distribución de frecuencias. Solución Realizando los pasos estudiados: 1° Identifiquemos el dato mayor y dato menor Dato mayor = Xmax = 89 Dato menor = Xmin = 26 2° Hallamos el rango (R) R = Xmax – Xmin = 89 – 26 = 63 3° Hallamos el número de intervalos (K) Si: n = 45 Utilizamos la Ley de Portugal Si: n ≤ 50

K = 1 + 3.322 log(n) K = 1 + 3.322 log(45) K = 1 + 3.322(1.6532) K = 6.4919

Entonces los posibles valores de K = 6, 7 ó 8

24

Gestión Curricular Asignatura: Estadística general 4° Hallamos la amplitud o la longitud del intervalo de clase (C): Utilizamos la siguiente fórmula: 𝐶=

𝑅 𝐾

Como “K” tiene tres posibles valores: (6, 7 ó 8), hallamos tres posibles “C” 𝑅

 𝐶1 =

𝐾

 𝐶2 =

𝐾

𝑅

= =

63 6 63 7

= 10.5 = 11

aplicando

R = K.C =6.11 = 66

=9

aplicando

R = K.C =7.9 = 63 cumple

(K.C ≥ R)  𝐶3 =

𝑅 𝐾

=

63 8

= 7.875 = 8

aplicando R = K.C = 8.8 = 64

Entonces: Organizamos una tabla de 7 intervalos (K = 7) Con amplitud de 9 (C = 9) 5° Determinando los extremos de los intervalos [𝑳𝒊 − 𝑳𝑺 ] Si: Xmin = 26

C=9

K=7

I1 = [Xmin − Xmin + C[ = [26 − 26 + 9[ = [26 − 35 [ I2 = [Xmin + C − Xmin + 2C[ = [26 + 9 − 26 + 2.9[ = [35 − 44 [ I3 = [Xmin + 2C − Xmin + 3C[ = [26 + 2.9 − 26 + 3.9[ = [44 − 53 [ ..……….=………………… ………………..=………………………... Entonces el último intervalo será: I7 = [Xmin + 6. C − Xmin + 7. C[ = [26 + 6.9 − 26 + 7.9[ = [80 − 89 [ 6° Construimos la tabla de distribución de frecuencias:

Intervalos [𝑳𝒊 − 𝑳𝑺 [ [26 − 35[ [35 − 44[ [44 − 53[ [53 − 62[ [62 − 71[ [71 − 80[ [80 − 89] Total

Frecuencias simples absolutas relativas porcentaje ni hi h i% 1 0.023 2.3 4 0.089 8.9 5 0.111 11.1 14 0.311 31.1 14 0.311 31.1 5 0.111 11.1 2 0.044 4.4 N = 45 1.000 100.0

25

Gestión Curricular Asignatura: Estadística general

HISTOGRAMA 16 14 14

12

14

10

NI

8 6 4

5

4

2

5

1

2

0 26 - 35

35 - 44

44 - 53 INTERVALOS 53 - 62 62 - 71

71 - 80

80 - 89

POLÍGONO DE FRECUENCIAS 16 14

14

14

12

NI

10 8 6

4 2 0

4

5

5 2

1 26 - 35

35 - 44

44 - 53

53 - 62

62 - 71

71 - 80

80 - 89

INTERVALOS

Problemas Desarrollados 1. Los siguientes datos son los pesos en kg de 30 estudiantes del Programa BECA 18, atendidos en el mes de diciembre del 2017, en el consultorio de nutrición del Hospital ESSALUD HUANCAYO: 75.8 69.3 96.2 86.3 99.8 59.4 65.5 76.4 84.6 72.2 74.1 76.0 86.5 65.0 86.2 68.3 70.2 61.8 58.4 69.2 68.4 76.5 81.0 65.9 68.3 75.0 67.3 82.2 72.1 69.0 Determine el cuadro de distribución de frecuencias.

26

Gestión Curricular Asignatura: Estadística general



  



Solución Identifique el dato mayor y dato menor Dato mayor = Xmax = 99.8 Dato menor = Xmin = 58.4 Hallamos el rango o recorrido (R) R = Xmax – Xmin = 99.8 – 58.4 = 41.4 Hallamos el número de intervalos (K) Si: n = 30 Utilizamos la Ley de Portugal Si: n ≤ 50 K = 1 + 3,322 log(n) K = 1 + 3,322 log (30) K = 5.90 Los posibles valores de: K = 5, 6 ó 7 Hallamos la amplitud o la longitud del intervalo de clase (C): 𝐶=

𝑅 𝐾

 𝐶1 =  𝐶2 =  𝐶3 =

𝑅 𝐾 𝑅 𝐾 𝑅 𝐾

= = =

41.4 5 41.4 6 41.4 7

= 8.28 = 8.3 aplicando R = K.C = 5 x 8.3 = 41.5 = 6.9

aplicando R = K.C =6 x 6.9 = 41.4

= 5.91 = 5.9

aplicando R = K.C = 7 x 5.9 = 41.3

Organizamos una tabla de 8 intervalos (K = 6) Con amplitud (C = 6.9)  Determinemos los extremos de los intervalos [𝑳𝒊 − 𝑳𝑺 ] Si: Xmin = 58.4 C = 6.9 K=6 [58.4 I1 == − 58.4 + 6.9[ = [58.4 − 65.3[ I2 = [58.4 + 6.9 − 58.4 + 2. (6.9)[ = [65.3 − 72.2 [ I3 = [58.4 + 2. (6.9) − 58.4 + 3. (6.9)[ = [72.2 − 79.1[ I4 = [58.4 + 3(6.9) − 58.4 + 4(6.9)[ = [79.1 − 86.0[ I5 = [58.4 + 4(6.9) − 58.4 + 5(6.9)[ = [86.0 − 92.9[ I6 = [58.4 + 5(6.9) − 58.4 + 6(6.9)[ = [92.9 − 99.8[ Li - Ls [58.4 − 65.3[ [65.3 − 72.2 [ [72.2 − 79.1[ [79.1 − 86.0[ [86.0 − 92.9[ [92.9 − 99.8[

ni 4 11 7 3 3 2 N = 30

hi 0.13 0.37 0.23 0.10 0.10 0.07 1.00

hi% 13 37 23 10 10 7 100

Ni 4 15 22 25 28 30

Hi 0.13 0.50 0.73 0.83 0.93 1.00

Hi% 13 50 73 83 93 100

Problemas Propuestos

1. Se ha llevado a cabo un estudio para evaluar los volúmenes de venta (miles de soles por día) de 24 establecimientos comerciales de Huancayo y se encontraron los siguientes resultados. Elabore la tabla de frecuencias e interprete.

27

Gestión Curricular Asignatura: Estadística general 11,7 9,1 7,4 8,4

5,7 3,7 12,1 6,1

10,1 5,3 5,4 5,7

8,5 7,8 7,4 4,7

6,4 4,4 3,2 5,2

2,1 9,8 1,5 4,6

2. En la fábrica de SAZON LOPESA se hizo un estudio sobre el peso (kg) de los trabajadores con el fin de establecer una orientación sobre nutrición y buena salud. Los resultados fueron los siguientes: Elabore la tabla de frecuencias e interprete. 60 70 84 84

84 74 64,2 65

112 68 118 97,5

120 90,5 84 82

72 81 96,4 98

61 75 65 62

3. Las calificaciones finales del curso de ESTADISTICA donde las notas están sobre 10 son los siguientes. Elabore la tabla de frecuencias e interprete. 4,5 4,5 9,5

8,0 4,5 7,0

8,5 8,5 6,0

7,5 8,5 8,5

6,5 10,0 6,5

3,5 7,0 6,5

6,0 6,5 8,5

4. Elabore la tabla de frecuencias e intérprete del registró de tiempo en minutos que demoran 30 estudiantes para ejecutar una tarea, resulto los siguientes datos: 21.3

15.8

18.4

22.1

19.4

15.8

26.4

17.3

11.2

23.4

26.8

22.7

18.0

20.5

11.0

18.2

23.6

24.6

20.5

16.6

8.3

21.9

12.3

23.3

13.4

17.9

12.3

13.4

15.8

19.5

5. La puntuación final en la asignatura de Estadística de 80 estudiantes en la UC, se registra en la siguiente tabla: 68

84

75

82

68

90

62

88

76

93

73

79

88

73

60

93

71

59

85

75

61

65

75

87

74

62

95

78

63

72

66

78

82

75

94

77

69

74

68

60

96

78

89

61

75

95

60

79

83

71

79

62

67

97

78

85

76

65

71

75

65

80

73

57

88

78

62

76

53

74

86

67

73

81

72

63

76

75

85

77

Construya el cuadro de distribución de frecuencias según los pasos estudiados.

28

Gestión Curricular Asignatura: Estadística general

Video de Apoyo

Video 1: Variables Estadísticas Cualitativas y Cuantitativas, Nominales y Ordinales, Discretas y Continuas (https://www.youtube.com/watch?v=Tb3sgUSd2SQ) Video 2: Variables Discretas y Continuas - Ejemplos y Ejercicios Resueltos (https://www.youtube.com/watch?v=fMW5S6JdMzg&list=PL3KGq8pH1bFSLAzS3dccWo7Lgu caj09Km&index=3&t=0s)

29

Gestión Curricular Asignatura: Estadística general

Semana 4 GRÁFICOS ESTADÍSTICOS Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros.

William Playfair, Ingeniero mecánico y economista político escocés. Trabajó más de 36 años en el diseño de gráficos estadísticos. Se le considera pionero en el uso del gráfico lineal para representar series temporales, y fue el creador del gráfico circular, de sectores y de barras. Michael Van Langren: recogió las distintas estimaciones que se habían hecho de la distancia que separa Toledo de Roma (12 en total). C. Joseph Priestley: Utilizo gráficos estadísticos, principalmente mapas destacados en los años 1700 – 1799.

30

Gestión Curricular

LECTURA

Asignatura: Estadística general GRÁFICOS ESTADISTICA Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos. Para tener una información clara y rápida de lo obtenido en el estudio se han creado las gráficas estadísticas. Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas. Existen también varios tipos de gráficas, o representaciones gráficas, utilizándose cada uno de ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información. Entonces, algunas consideraciones que conviene tomar en cuenta al momento de realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones son: El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que representan las frecuencias. La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica deben ser iguales. El tipo de gráfico debe coincidir por sus características con el tipo de información o el objetivo que se persigue al representarla, de otra manera la representación gráfica se convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario o productor de malinterpretaciones. Por ejemplo, si se desea representar la proporción de población masculina en un país conviene más usar una gráfica de pastel o circular que una gráfica de barras al compararla contra la población femenina; por un lado se puede apreciar dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor. Hay un punto que conviene remarcar: existe software que permite la construcción rápida y eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la Estadística: la transmisión eficiente de la información. Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio determinado, ya que no siempre se puede utilizar la misma para todos los casos. Tienen una estructura distinta, lo cual les permite ser utilizados para diferentes objetivos, y es que la mayoría de las veces utilizan datos o variables distintos. G FUENTE: Stigler, Stephen M. (1999) Statistics on the Table: The History of Statistical Concepts and Methods. Harvard University Press. ISBN 0-674-83601-4

31

Gestión Curricular Asignatura: Estadística general

GRÁFICOS ESTADÍSTICOS Propósito:  Construye gráficos estadísticos, analiza e interpreta los resultados. SESIÓN 7: GRÁFICOS ESTADÍSTICOS ESPECIALES. Un gráfico estadístico es una representación visual de una serie de datos estadísticos, además es una herramienta muy eficaz, ya que un buen gráfico: 

Capta la atención del lector, ilustrando el mensaje o tema que acompaña.



Presenta la información de forma rápida, sencilla, clara y precisa.



Facilita la comparación de datos.



Destaca las tendencias y el comportamiento de los datos.

Entre las gráficas más utilizadas tenemos: 1. GRÁFICA DE BARRAS. Cada barra rectangular corresponde a una modalidad, tiene una base constante, y su altura puede ser medida en unidades de frecuencia relativa, absoluta o porcentual.

2. HISTOGRAMA. Es una gráfica de barras donde la escala horizontal representa clases de valores de datos y la escala vertical representa frecuencias. Las alturas de las barras corresponden a los valores de frecuencia y no existe separación entre las barras.

32

Gestión Curricular Asignatura: Estadística general 3. POLÍGONO DE FRECUENCIAS. Utiliza segmentos lineales conectados a puntos que se localizan directamente por encima de los valores de las marcas de clase. Las alturas de los puntos corresponden a las frecuencias de clase; en tanto que los segmentos lineales se extienden hacia la derecha y hacia la izquierda, de manera que la gráfica inicia y termina sobre el eje horizontal.

4. OJIVA. Es una gráfica lineal que representa frecuencias acumulativas. La ojiva utiliza fronteras de clase a lo largo de la escala horizontal, y que la gráfica comienza con la frontera inferior de la primera clase y termina con la frontera superior de la última clase. Las ojivas son útiles para determinar el número de valores que se encuentran por debajo de un valor específico.

5. GRÁFICA DE PUNTOS. Es aquella donde se marca cada valor de un dato como un punto a lo largo de una escala de valores. Los puntos que representan valores iguales se apilan.

33

Gestión Curricular Asignatura: Estadística general 6. GRÁFICO DE PARETO. Con el Diagrama de Pareto se pueden detectar los problemas que tienen más relevancia mediante la aplicación del principio de Pareto (pocos vitales, muchos triviales) que dice que hay muchos problemas sin importancia frente a solo unos graves. Ya que, por lo general, el 80% de los resultados totales se originan en el 20% de los elementos.

7. GRÁFICO DE TALLO Y HOJAS. Representa datos que separan cada valor en dos partes: el tallo (el dígito ubicado en el extremo izquierdo) y la hoja (el dígito del extremo derecho). Las hojas se ordenan de forma creciente y no en el orden en que aparecen en la lista original. Una gran ventaja de la gráfica de tallo y hojas radica en que nos permite ver la distribución de los datos y, al mismo tiempo, retener toda la información de la lista original. Otra ventaja es que la construcción de una gráfica de tallo y hojas implica una forma fácil y rápida de ordenar datos (acomodarlos en orden), y algunos procedimientos estadísticos requieren de un ordenamiento (como el cálculo de la mediana o de los percentiles).

3. PICTOGRAMA. También llamada gráfica de imágenes o pictografía. Es un diagrama que utiliza imágenes o símbolos para mostrar datos para una rápida comprensión. En un pictograma, se utiliza una imagen o un símbolo para representar una cantidad específica.

34

Gestión Curricular Asignatura: Estadística general

4. GRÁFICA CIRCULAR. También se utilizan para visualizar datos cualitativos. Presenta datos cualitativos como si fueran rebanadas de un pastel. Para construir una gráfica circular, se divide el círculo en las proporciones adecuadas. Cada sector corresponde a una modalidad y su correspondiente ángulo en el centro.

5. DIAGRAMA DE DISPERSIÓN. Es una gráfica de datos apareados (x, y), con un eje x horizontal y un eje y vertical. Los datos se aparean de tal forma que cada valor de un conjunto de datos corresponde a un valor de un segundo conjunto de datos. Para elaborar manualmente un diagrama de dispersión, construya un eje horizontal para los valores de la primera variable, construya un eje vertical para los valores de la segunda variable y después grafique los puntos. El patrón de los puntos graficados suele ser útil para determinar si existe alguna relación entre las dos variables.

35

Gestión Curricular Asignatura: Estadística general 6. PIRAMIDE DE POBLACIÓN. Es una representación gráfica de la distribución por edad y sexo de una población en un momento determinado. Nos pueden brindar información sobre migración de la población, mortalidad, guerras, epidemias y muchas otras situaciones que se presentan en una población. Además, que nos ayuda a comparar los resultados de diversos fenómenos.

7. CAJA Y BIGOTES. Son una representación visual que describe varias características importantes, al mismo tiempo, tales como la dispersión y simetría. Para su realización se representan los tres cuartiles y los valores mínimo y máximo de los datos, sobre un rectángulo, alineado horizontal o verticalmente.

Problemas Desarrollados

1. La empresa “La Grande” registra las horas extras de los colaboradores en un año determinado, obteniendo la siguiente tabla: Intervalos Xi fi Fi hi Hi pi [38-44> 41 7 7 0.0795 0.0795 7.95% [44-50> 47 8 15 0.0909 0.1705 9.09% [50-56> 53 15 30 0.1705 0.3409 17.05% [56-62> 59 25 55 0.2841 0.6250 28.41% [62-68> 65 18 73 0.2045 0.8295 20.45% [68-74> 71 9 82 0.1023 0.9318 10.23% [74-80] 77 6 88 0.0632 1 6.82% TOTAL 88 1 100.00% Elaborar el polígono de frecuencia y ojiva, e interpreta

Pi 7.95% 17.05% 34.09% 62.50% 82.95% 93.18% 100.00%

36

Gestión Curricular Asignatura: Estadística general Solución:

Interpretación: De los 88 colaboradores de la empresa “La Grande”,25 trabajan de 56 a menos de 62 horas haciendo el porcentaje en un 28,41%. 2. Determine la tabla de distribución de frecuencia del histograma que se muestra, donde se observa la cantidad de columnas que tienen 21 construcciones:

Solución: Intervalos [10-15>

Xi 12.5

fi 3

Fi 3

hi 0.1429

Hi 0.1429

pi% 14.29

Pi% 14.29

[15-20>

17.5

5

8

0.2381

0.3810

23.81

38.10

[20-25>

22.5

7

15

0.3333

0.7143

33.33

71.43

[25-30>

27.5

4

19

0.1905

0.9048

19.05

90.48

[30-35]

32.5

2

21

0.0952

1

9.52

100.00

TOTAL

21

1

100.00

3. A partir del grafico que se muestra elabore su tabla de distribución de frecuencia, donde se muestran el consumo de 300 comensales de “Rustica”:

37

Gestión Curricular Asignatura: Estadística general

Solución: Ventas de comida sándwiches

fi

Fi

hi

Hi

pi%

Pi%

ángulo

120

120

0.4

0.4

40

40

144

ensalada

63

183

0.21

0.61

21

61

76

sopa

45

228

0.15

0.76

15

76

54

bebidas

27

255

0.09

0.85

9

85

32

postres

45

300

0.15

1

15

100

54

TOTAL

300

1

100

360

Problemas Propuestos

1. El siguiente cuadro muestra el total de inasistencia de los alumnos del mes, de tres facultades distintas. Elabora un gráfico de barras. (elige otro gráfico que te parezca conveniente) MESES Julio Agosto Septiembre Octubre Noviembre Diciembre

Ingeniería 30 35 19 20 15 18

FACULTADES Derecho 24 30 25 19 20 22

Medicina 20 38 25 27 32 38

2. La Cámara de Comercio de Huancayo está interesada en conocer de qué manera vienen desarrollando sus actividades los restaurantes y las pollerías del centro de la ciudad. Para ello han tomado una muestra de 50 de estos establecimientos y ha revisado el libro de reclamaciones de cada uno para contabilizar el número de quejas que presentaron los clientes. Los datos se muestran a continuación:

38

Gestión Curricular Asignatura: Estadística general Número de quejas 1 2 3 4 5 6 7 TOTAL

fi

Fi

2 4 21 15 6 1 1 50

2 6 27 42 48 49 50

Construya el gráfico estadístico correspondiente tanto para las frecuencias absolutas (diagrama de bastones) y las acumuladas (diagrama de escalones). 3. La empresa ELECTROCENTRO S.A. está llevando a cabo un estudio minucioso acerca de los salarios que perciben los obreros de esta institución, con la finalidad de realizar mejoras económicas entre su personal. La siguiente tabla muestra los salarios que perciben una muestra de 26 de estos obreros: Salarios 2 4 6 7 3 3 1

Cantidad de obreros [750 − 900 > [900 − 1050 > [1050 − 1200 > [1200 − 1350 > [1350 − 1500 > [1500 − 1650 > [1650 − 1800]

Grafique el histograma, polígono de frecuencia y ojiva “Menor que” de dicha tabla. 4. El peso en gramos de 30 objetos de un mismo tipo fue como sigue: 21,3 26,8 08,3

15,8 22,7 21,9

18,4 18,0 12,3

22,7 20,5 22,3

19,6 11,0 13,4

15,8 18,5 17,9

26,4 23,0 12,2

17,3 24,6 13,4

11,2 20,1 15,1

23,9 16,2 19,1

Construir un diagrama de tallo y hojas para los datos indicados, indicar las características de la distribución. 5. En la siguiente tabla se muestran los resultados después de las evaluaciones a un grupo de estudiantes de la carrera profesional de contabilidad. (utilizar dos tipos de gráficos) CONDICIÓN Aprobado Desaprobado Retirado

ESTUDIANTES (GENERO) Varones Mujeres 65 96 25 32 10 8

39

Gestión Curricular Asignatura: Estadística general

Video de Apoyo

Video 1: Diagrama de Barras, Polígono de Frecuencias y Gráfica Circular - Ejemplos y Ejercicios (https://youtu.be/L2F2VkzsZwU) Video 2: Tabla de frecuencias para variable cualitativa, diagrama de sectores (https://www.youtube.com/watch?v=rsYCe73_q-I)

40

Gestión Curricular Asignatura: Estadística general

Unidad II

Resultado de Aprendizaje de la Unidad II: Al finalizar la unidad, el estudiante será capaz de comparar e interpretar los resultados de las distribuciones bidimensionales en acontecimientos de sus actividades diarias.

ORGANIZACIÓN DE APRENDIZAJES TEMAS Y SUBTEMAS SEMANA N° 5 9. Evaluación de la primera unidad 10. Distribuciones de Frecuencias Bidimensionales. Datos cualitativos y mixtos. Gráfico de barras agrupadas. SEMANA N° 6 11. Distribuciones de Frecuencias Unidimensionales: Variables cualitativas, grafico e interpretación. Gráficos: sectores y barras. 12. Base de datos e variables cualitativas y cuantitativas SEMANA N° 7 13. Distribuciones de Frecuencias Unidimensionales Variables cuantitativas, grafico e interpretación. Gráficos: histograma, ojiva, polígono de frecuencias. 14. Distribuciones de Frecuencias Unidimensionales: Variables cuantitativas aplicando spss. SEMANA N° 8 15. Gráficos estadísticos especiales: Pareto, tallo y hoja, pictograma, Otras gráficas. 16. Gráficos estadísticos especiales: Pareto, tallo y hoja, pictograma, otras gráficas con spss - Excel.

ACTIVIDADES Actividad N° 5 Resuelven ejercicios de la primera evaluación de Consolidado I relacionados con los temas de la unidad I.

Actividad N° 6 Elabora tabla bidimensional de dos variables cualitativas y mixtas e interpreta los resultados, a partir de la encuesta realizada a sus compañeros de clase.

EVALUCIÒN Consolidado 1: - Ejercicios para identificar alternativas de solución. Evaluación parcial: - Evaluación individual de desarrollo teórico-práctico

Actividad N° 7 Elabora tabla bidimensional de dos variables cuantitativas, interpreta la relación positiva o negativa, utilizando la guía de trabajo. Práctica calificada grupal

Actividad N° 8 Realizan las interrogantes de la evaluación parcial.

41

Gestión Curricular Asignatura: Estadística general

Semana 5 EVALUACIÓN DE LA PRIMERA UNIDAD SESIÓN 9: EVALUACIÓN DE LA PRIMERA UNIDAD

Problemas de repaso

1. Coca-Cola. Coca-Cola Company tiene 366,000 accionistas y efectúa una encuesta mediante la selección aleatoria de 30 accionistas de cada una de las 50 entidades de Estados Unidos. Se registra el número de acciones de cada accionista de la muestra. a. ¿Los valores obtenidos son discretos o continuos? b. Identifique el nivel de medición (nominal, ordinal, de intervalo, de razón) de los datos muestrales. c. ¿Qué tipo de muestreo (aleatorio, sistemático, de conveniencia, estratificado, por conglomerados) se usa? d. Si se calcula el número promedio (la media) de acciones, ¿el resultado es un estadístico o un parámetro? e. Si usted fuera el ejecutivo en jefe de Coca-Cola Company, ¿qué característica del conjunto de datos consideraría usted que es extremadamente importante? f. ¿Qué es lo que está incorrecto al evaluar la opinión de los accionistas enviando un cuestionario por correo, que éstos podrían llenar y regresar por el mismo medio? 2. El Directorio y la Gerencia de la Universidad Continental han realizado un estudio para conocer la opinión de los padres de familia de los estudiantes en general, respecto a las nuevas carreras que se vienen ofertando. Para ello, durante la semana de matrículas se aplicó una encuesta a 860 padres de familia elegidos aleatoriamente, dentro de las instalaciones del campus universitario, donde se obtuvo como resultado que el 87% de los encuestados se manifestaron en total acuerdo por la innovación en carreras profesionales que se viene impulsando (las respuestas iban de “Totalmente en desacuerdo” a “Totalmente de acuerdo”). De estudios anteriores se sabía que sólo el 55% de los padres de familia de los estudiantes de esta casa superior de estudios apoyaban la iniciativa de fomentar nuevas carreras en años pasados. Del enunciado anterior, indique: a) Población y parámetro: ________________________________________________________________ b) Muestra y estadístico: __________________________________________________________________ c) Variable: ______________________________________________________________________________ d) Tipo de variable: _______________________________________________________________________ e) Nivel de medición: _____________________________________________________________________ f) Unidad estadística: _____________________________________________________________________

42

Gestión Curricular Asignatura: Estadística general 3. Las calificaciones finales del curso de ESTADISTICA GENERAL donde las notas están sobre 10 y son los siguientes. Elabore la tabla de frecuencias e interprete. 4,5 4,5 9,5 4. Los sistemas de cómputo

8,0 8,5 7,5 6,5 3,5 4,5 8,5 8,5 10,0 7,0 7,0 6,0 8,5 6,5 6,5 fallan por muchas razones, entre ellas

6,0 6,5 8,5 las fallas de hardware o

software, errores del operador, sobrecargas del sistema mismo y a otras causas. La tabla siguiente muestra los resultados obtenidos en un estudio acerca de las causas de fallas en una muestra de 98 sistemas de cómputo. Usted debe priorizar entre las dos principales causas de falla de los sistemas de cómputo. Elabore el gráfico apropiado que permita visualizar dicho propósito. TIPO DE FALLA

FRECUENCIA

Hardware Operador

9 20

Sobrecarga

55

Software Otras

8 6

5. Como parte de un informe que deberán presentar al Ministerio de Trabajo, se ha tomado los datos referentes a los sueldos mensuales de una muestra de empleados de la Municipalidad Distrital de Huancayo. Los datos se muestran en la siguiente ojiva. Se pide reconstruir la tabla y contestar: ¿Qué porcentaje de la muestra representan los empleados que perciben de S/. 900 a menos de S/. 1200?

43

Gestión Curricular Asignatura: Estadística general

Semana 6 DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES La estadística bivariada trata de ir más allá elaborando índices y resultados estadísticos en términos de relaciones entre dos variables de interés, así como de establecer inferencias sobre una población a partir de datos que provienen de una muestra (como, por ejemplo, en los estudios mediante encuesta).

Francis Gaston Correlación R. H. Hooker

A. Francis Gaston: ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. B. H. Hooker, que efectuaron amplios estudios sobre la medida de las relaciones.

44

Gestión Curricular

LECTURA

Asignatura: Estadística general

Definición de bidimensional El adjetivo bidimensional se utiliza para calificar a aquello que tiene dos dimensiones (2D). Un cuerpo que se proyecta a lo largo y a lo ancho, por ejemplo, cuenta con dos dimensiones. En cambio, si también tiene profundidad, se trata de un objeto con tres dimensiones (3D) y recibe el calificativo de tridimensional. Por lo general las dimensiones se definen a partir de la cantidad mínima de coordenadas que se necesitan para la especificación de un punto cualquiera en ella. De este modo, podemos afirmar que una línea es unidimensional: alcanza una sola coordenada para ubicar un punto. En el caso de los elementos bidimensionales, se requieren dos coordenadas para lograr la especificación de un punto. Los polígonos, como los cuadrados o los triángulos, son bidimensionales debido a que, para situar un punto, es necesario establecer la longitud y la latitud. Siguiendo con esta lógica, la localización de un punto en un cuerpo tridimensional (como un cubo) exige conocer tres coordenadas. Cabe destacar que, aún en una superficie bidimensional, es posible simular un efecto tridimensional. Una hoja de papel es bidimensional: sin embargo, apelando a la perspectiva, es posible dibujar un cubo, dando una sensación de tridimensionalidad. Dentro del ámbito de la electricidad podemos establecer que también se utiliza el término que ahora nos ocupa. En concreto, se emplea para referirse a la característica que puede tener un elemento conductor. Así, se establece que si es bidimensional es porque en una de las direcciones del espacio es aislante mientras que en las otras dos podemos determinar que cuenta con una mayor conductividad. Además de todo lo indicado es necesario determinar que existe lo que se conoce como diseño gráico bidimensional. Este es una disciplina que se sustenta en diseñar y darle forma a figuras de dos dimensiones para diversos tipos de áreas. En concreto, para fotografías, dibujos, pinturas, imágenes de ordenador… Fuente: Julián Pérez Porto y María Merino. Publicado: 2016. Actualizado: 2018. Definición de: Definición de bidimensional (https://definicion.de/bidimensional/)

45

Gestión Curricular Asignatura: Estadística general

DATOS CUALITATIVOS Y MIXTOS Propósito:  Organiza y compara dos variables cualitativas y mixtas; elaborando sus respectivas graficas e interpretando los resultados.

SESIÓN 11: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUALITATIVOS Y MIXTOS. Se entiende por distribuciones bidimensionales a la elaboración de tablas de frecuencia en función de dos variables pareadas. 1. DATOS BIVARIADOS: Valores de dos diferentes variables que se obtienen a partir del mismo elemento de población. Cada una de las dos variables pueden ser o cualitativas o cuantitativas. Como resultado, los datos bivariados pueden formar tres combinaciones de tipos de variable:  Ambas variables son cualitativas (atributos): Es frecuente que los datos se ordenen en una tabulación cruzada o tabla de contingencia. Los resultados se presentan en un gráfico de barras agrupadas.  Una variable es cualitativa (atributo) y la otra es cuantitativa (numérico): Los valores cuantitativos se ven como muestras separadas, con cada conjunto identificado por niveles de la variable cualitativa. Sus resultados pueden mostrarse en un diagrama de puntos o en un diagrama de cajas y bigotes con una escala común.  Ambas variables son cuantitativas (ambas numéricas): Se acostumbra expresar matemáticamente los datos como pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la variable de salida (variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor de “x” siempre hay un valor correspondiente de “y” de la misma fuente. Sus resultados se presentan en un diagrama de dispersión. 2. DISTRIBUCIONES ABSOLUTAS MARGINALES: Dada una distribución de frecuencias bidimensionales, podemos obtener dos distribuciones de frecuencias absolutas marginales, una con respecto a la variable “x” y la otra respecto a la variable “y”. Ejemplo: Un grupo de estudiantes de la facultad de Ingeniería de la Universidad Continental están a punto de iniciar sus prácticas pre profesionales en diferentes regiones de nuestro país (costa,

46

Gestión Curricular Asignatura: Estadística general sierra, selva). Se ha encuestado a un grupo de ellos para conocer su género y la región elegida para llevar a cabo dichas prácticas. Los datos se muestran a continuación: GÉNERO REGIÓN GÉNERO REGIÓN GÉNERO REGIÓN M Sierra F Selva F Selva F Selva M Sierra M Selva M Sierra M Sierra F Selva M Costa M Costa F Selva F Selva F Costa M Costa M Selva M Selva M Sierra F Costa M Selva F Selva F Selva M Sierra M Sierra Organiza los datos en una tabla de contingencia (tabla cruzada). Luego elabore la distribución de frecuencias marginales y construya su gráfico de barras agrupadas. Solución: a) Construimos la tabla considerando la variable “Género” en las filas y “Región” en las columnas:

b) Completamos cada celda de la tabla con el número de veces que aparece cada dato bivariado. Para ello contamos la cantidad de estudiantes de género masculino que viajarán a la costa, que viajarán a la sierra y a la selva. Hacemos lo propio con las estudiantes de género femenino. Luego sumamos para calcular los totales de fila y columna.

(4 / 24) x 100 = 16,67%

c) Elaboramos las tablas de frecuencias marginales:

47

Gestión Curricular Asignatura: Estadística general d) Se elabora el gráfico de barras agrupadas.

Problemas Desarrollados

1. Determine la tabla cruzada y el gráfico apropiado a la variable del siguiente conjunto de datos: SEXO VARON MUJER VARON VARON MUJER MUJER VARON MUJER VARON VARON VARON MUJER MUJER VARON MUJER VARON MUJER MUJER

ESTADO CIVIL SOLTERO(A) CASADO(A) SOLTERO(A) CASADO(A) VIUDO(A) SOLTERO(A) SOLTERO(A) CASADO(A) CASADO(A) CASADO(A) SOLTERO(A) VIUDO(A) SOLTERO(A) VIUDO(A) CASADO(A) VIUDO(A) CASADO(A) SOLTERO(A)

48

Gestión Curricular Asignatura: Estadística general Solución Aplicando el programa IBM SPSS Statistics Editor para obtener la tabla cruzada: TABULACIÓN CRUZADA

VARON MUJER

SEXO

ESTADO CIVIL

Total

Total

SOLTERO(A)

CASADO(A)

VIUDO(A)

Recuento

4

3

2

9

% del total

22,2%

16,7%

11,1%

50,0%

Recuento

3

4

2

9

% del total

16,7%

22,2%

11,1%

50,0%

Recuento

7

7

4

18

% del total

38,9%

38,9%

22,2%

100,0%

Graficando:

49

Gestión Curricular Asignatura: Estadística general

Problemas Propuestos

1. La empresa PLAZA VEA como parte de su política de prestaciones de salud a sus colaboradores, ha iniciado una campaña de prevención del cáncer pulmonar entre fumadores. Para ello aplicó una encuesta en la que se preguntó, entre otras cosas, el género y si es fumador. Las respuestas se muestran a continuación: GÉNERO

FUMADOR

GÉNERO

FUMADOR

GÉNERO

FUMADOR

M



F



F



F

NO

M

NO

M



F

NO

M

NO

F

NO

F



F



M

NO

M



M

NO

F

NO

a) Elabore una tabla de contingencia para organizar los datos, considerando frecuencias absolutas y relativas conjuntas. b) Elabore la distribución de frecuencias marginales para las variables “Género” y “Fumador”. c) Construya el gráfico de barras agrupadas para presentar dicha tabla de contingencia. 2. Treinta estudiantes de nuestra universidad se identificaron y clasificaron al azar según dos variables: Género (M/F) y Especialidad: Ingeniería (I), Administración (A), Derecho (D). GENERO

ESPECIALIDAD

GENERO

ESPECIALIDAD

GENERO

ESPECIALIDAD

F

I

F

A

F

I

F

A

F

I

F

A

F

A

M

D

M

I

F

D

M

A

M

A

M

I

M

I

F

I

Elabore una tabla con tabulación cruzada o tabla de contingencia expresándola en porcentajes del gran total, y conteste las siguientes preguntas: a) ¿Qué porcentajes de estudiantes estudian derecho? b) ¿Cuántos estudiantes estudian administración? c) ¿Cuántos estudiantes estudian ingeniería y son del género femenino? d) ¿Qué porcentaje de estudiantes estudian administración y son del género masculino? 3. Se está estudiando la relación que existe entre el grado de instrucción y el número de hijos que tienen las mujeres de Huancayo. Para ello se ha entrevistado a un grupo de pobladoras y los resultados se muestran a continuación:

50

Gestión Curricular Asignatura: Estadística general GDO. INST. Nº HIJOS SIN INSTRU. 6 SECUNDARIA 4 SECUNDARIA 3 SUPERIOR 2 SIN INSTRU. 5 SUPERIOR 1

GDO. INST. Nº HIJOS SUPERIOR 1 SECUNDARIA 2 SECUNDARIA 2 SECUNDARIA 3 SUPERIOR 2 SUPERIOR 2

GDO. INST. Nº HIJOS PRIMARIA 3 SUPERIOR 1 PRIMARIA 2 SUPERIOR 2 PRIMARIA 3 SECUNDARIA 3

a) Construya una tabla de contingencia para organizar dicha información, mostrando frecuencias absolutas y relativas conjuntas. b) Elabore la distribución de frecuencias marginales para cada variable. c) Elabore el gráfico de barras agrupadas que represente a la tabla creada. d) ¿Qué conclusión puede usted obtener al analizar la información ahora que está organizada? 4. Se han aplicado 3 métodos diferentes (Métodos: A, B y C) para la enseñanza de Análisis Matemático en la facultad de Ciencias de la Empresa, luego de lo cual se aplicó una prueba para medir el tiempo (en minutos) que los alumnos empleaban en resolver un conjunto de 20 ejercicios, siendo los resultados los siguientes: Método Tiempo

A 15

B 8

B 10

A 18

C 15

B 11

B 9

A 10

C 11

B 8

B 10

C 10

B 12

A 15

B 8

Método Tiempo

B 11

A 14

C 10

C 11

B 11

C 10

A 10

A 15

B 9

C 14

A 17

B 9

B 10

A 11

C 12

a) Construya una tabla de contingencia que organice los datos. b) Elabore la distribución de frecuencias marginales para cada variable en estudio. c) ¿Qué conclusión puede usted obtener al analizar la tabla, respecto a la eficacia de los métodos aplicados? 5. Se ha observado detenidamente el número de horas que dedican al estudio un grupo de estudiantes de Ingeniería de la Universidad Continental y sus calificaciones en el curso de Matemática. Los datos se muestran a continuación. Ordenar la información proporcionada en un cuadro de distribución de frecuencias e indique: Las frecuencias absolutas y relativas conjuntas, las frecuencias marginales. Finalmente elabore el diagrama de dispersión correspondiente.

51

Gestión Curricular Asignatura: Estadística general

Video de Apoyo

Video 1: Tablas Bidimensionales o de doble entrada 1. Distribución de frecuencias bidimensionales. (https://www.youtube.com/watch?v=0HFOqZqNF_I) Video 2: Distribuciones de frecuencias bidimensionales 2 Medias y medias condicionales (https://www.youtube.com/watch?v=uYumtU1wajk)

52

Gestión Curricular Asignatura: Estadística general

Semana 7 DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

John Graunt: Compilación estadística de los recursos nacionales Sebastián Muster:

A. John Graunt: fue un estadístico inglés a quien se considera el primer demógrafo, el fundador de la bioestadística y el precursor de la epidemiología. B. Sebastián Muster: realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar.

53

Gestión Curricular

LECTURA

Asignatura: Estadística general

LA PALABRA "ESTADÍSTICA" NORMALMENTE SE UTILIZA REFIRIÉNDOSE A DOS SIGNIFICADOS DISTINTOS, A SABER: 1.- Colección de datos numéricos. Este es el significado más común de la palabra estadística. Está sobreentendido que dichos datos numéricos deben estar presentados de manera ordenada y sistemática. Una información numérica cualquiera puede no constituir una estadística, para poder darle este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemática y siguiendo un criterio de ordenación. Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por el Instituto Nacional de Estadística, El Anuario de Estadísticas del Trabajo, etc. 2.-Como ciencia. Aquí, se entiende que La Estadística estudia el comportamiento de los fenómenos de masas. Como todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento. Por ejemplo, al investigar el sexo de los nacimientos, se inicia el trabajo tomando un grupo numeroso de nacimientos y se obtiene después la proporción de varones. Frecuentemente, enfrentamos fenómenos en los que difícilmente se predice el resultado; así, no podemos dar una lista, con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo, etc. El objetivo de la estadística es detectar las regularidades que se encuentran en los fenómenos de masa. Población, elementos y caracteres. Obviamente que todo estudio estadístico debe estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que se denomina población. Las personas o cosas que forman parte de la población se denominan elementos. En el sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo. De igual forma, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella las siguientes características: Sexo, Edad, Nivel de estudios, Profesión, Peso, Estatura, Color de pelo, etc. Por lo tanto, de cada elemento de la población es posible estudiar uno o más aspectos cualidades o caracteres. La población puede ser según su tamaño de dos tipos: Población finita: cuando el número de elementos que la forman es contable, por ejemplo, el número de alumnos de un centro de enseñanza. Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita. Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson Prentice Hall.

54

Gestión Curricular Asignatura: Estadística general

DATOS CUALITATIVOS Propósito:  Elabora la tabla bidimensional de dos variables cuantitativas e interpreta la relación positiva o negativa. SESIÓN 13: DISTRIBUCIONES DE FRECUENCIAS BIDIMENSIONALES DE DATOS CUANTITATIVOS. 1. VARIABLES BIDIMENSIONALES. Ambas

variables

son

cuantitativas

(ambas

numéricas):

Se

acostumbra

expresar

matemáticamente los datos como pares ordenados (x,y), donde “x” es la variable de entrada (variable independiente) y “y” es la variable de salida (variable dependiente). Se llaman “emparejados” o “apareados” porque para cada valor de “x” siempre hay un valor correspondiente de “y” de la misma fuente. Sus resultados se presentan en un diagrama de dispersión. 2. DIAGRAMA DE DISPERSIÓN: También conocido como gráfico de dispersión, gráfico de puntos, diagrama de XY o diagrama de dispersión, consiste en la representación gráfica de dos variables para un conjunto de datos. En otras palabras, analizamos la relación entre dos variables, conociendo qué tanto se afectan entre sí o qué tan independientes son una de la otra. En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

55

Gestión Curricular Asignatura: Estadística general Ejemplo: Correlación lineal positiva: Temperatura y volumen Correlación lineal negativa: Volumen y presión No existe Correlación: inteligencia y la belleza.

Problemas Desarrollados

1. Los datos obtenidos al estudiar las variables X = “número de goles anotados” e Y = “número de goles recibidos”, en 40 partidos jugados por el equipo campeón de la liga de fútbol sala, son: (5;4)

(4;2)

(3;1)

(3;2)

(6;3)

(4;2)

(5;3)

(4;2)

(4;3)

(3;1)

(3;3)

(5;3)

(6;4)

(3;2)

(4;2)

(3;2)

(6;4)

(3;1)

(4;2)

(5;3)

(4;2)

(6;4)

(4;2)

(6;4)

(4;4)

(5;3)

(4;2)

(5;3)

(3;1)

(2;2)

(1;1)

(2;1)

(4;2)

(5;3)

(5;3)

(6;4)

(5;3)

(2;2)

(3;3)

(3;2)

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de dispersión. Solución: Construimos una tabla con tantas columnas como valores tome X y con tantas filas como valores tome Y en la distribución. Si observamos los datos, X toma los valores 1, 2, 3, 4, 5 y 6, e Y toma los valores 1, 2, 3 y 4. En este caso, la tabla constará de 6 filas y 4 columnas. − Hallamos la frecuencia absoluta de cada par de valores de la variable (X, Y). Para ello contamos el número de veces que se repite ese par de valores en la distribución y lo anotamos en la casilla correspondiente. Así, por ejemplo, observa que el par (5, 4) aparece una sola vez; el (4, 2) aparece diez veces; y el (6, 1), ninguna. Tabla bidimensional

Frecuencias marginales

56

Gestión Curricular Asignatura: Estadística general N° de goles marcados 1

1

N° de goles recibidos 1

2

3

2

15

3

10

3

12

4

11

4

7

5

9

6

6

Total

40

Total

40

Frecuencia

Frecuencia 6

Diagrama de dispersión

2. ¿Qué tipo de relación se muestra en los siguientes diagramas de dispersión? a. Gráfico 1

Relación lineal positiva. A medida que la variable en X aumenta en valor, también lo hace la variable en Y.

57

Gestión Curricular Asignatura: Estadística general b. Gráfico 2

Relación lineal negativa. A medida que la variable en X aumenta en valor, la variable en Y disminuye.

c. Gráfico 3

No presentan relación

Problemas Propuestos

1. En una clase compuesta por 30 alumnos, se ha hecho un estudio sobre el número de horas diarias de estudio X y el número de suspensos Y, obteniéndose los siguientes resultados: (2, 0), (2, 2), (0, 5), (2, 1), (1, 2), (2, 1), (3, 1) (4, 0), (0, 4), (2, 2) (2, 1), (2, 1), (4, 0), (3, 1), (2, 4), (2, 1), (1, 2), (2, 1), (2, 0), (3, 0) (3, 2), (2, 2), (2, 2), (2, 1), (0, 5), (1, 3), (2, 2), (2, 1), (1, 3), (1, 4) Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de dispersión. Luego señale el tipo de relación que existe entre ambas variables. 2. El número de horas dedicadas al estudio de una asignatura y la calificación final obtenida en el correspondiente examen por ocho personas vienen dados en la tabla. X: Horas de estudio Y: Calificaciones del examen

20 6,5

16 6,0

34 8,5

23 7,0

27 9,0

32 9,5

18 7,5

22 8,0

58

Gestión Curricular Asignatura: Estadística general

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de dispersión. Luego señale el tipo de relación que existe entre ambas variables. 3. Las personas hipertensas, conscientes de la salud consultan a menudo la información relacionada con los nutrientes que aparecen en los envases de los alimentos con el fin de evitar los que contengan grandes cantidades de grasa, sodio o colesterol. La siguiente información se tomó de ocho marcas distintas de queso americano en rebanadas: Marca Kraft Deluxe American Kraft Velveela Slices Private Selectión Ralphs Singles Kraft 2% Milk Kratl Singles American Borden Singles Lake to Lake American

Grasa (g) 7 5 8 4 3 5 5 5

Grasas saturadas (g) 4,5 3,5 5,0 2,5 2,0 3,5 3,0 3,5

Colesterol (mg) 20 15 25 15 10 15 15 15

Sodio (mg) 340 300 520 340 320 290 260 330

Calorías 80 70 100 60 50 70 60 70

Construya el diagrama de dispersión para colesterol y calorías. Observando la gráfica determine si existe algún tipo de correlación entre ambas variables. 4. Los siguientes datos representan los años de práctica profesional y el ingreso anual (en miles de soles) para un conjunto de servidores públicos: Años de práctica 5

4

Años de práctica 3

15

4

6

3

24

9

12

3

16

7

27

7

19

6

13

5

Ingreso

Ingreso 2

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de dispersión. Observando la gráfica determine si existe algún tipo de correlación entre ambas variables. 5. Un estadístico de una determinada línea aérea está estudiando la relación entre la distancia de destino con la carga de mercancía para un tamaño estándar de embalaje. Se obtuvieron los siguientes datos para una muestra aleatoria de diez facturaciones de carga:

59

Gestión Curricular Asignatura: Estadística general Distancia 22,4

Carga 6,8

36,8

10,5

14,4

4,0

27,2

7,9

16,0

8,1

35,2

9,5

8,0

3,1

19,2

7,2

9,6

4,5

25,6

9,3

Construya la tabla de frecuencias bidimensionales, las tablas de frecuencias marginales y el diagrama de dispersión. Observando la gráfica determine si existe algún tipo de correlación entre ambas variables.

Video de Apoyo

Video 1: Diagrama de Dispersión (https://youtu.be/NSh7EX83VRQ) Video 2: Diagrama de dispersión (https://youtu.be/KwtuSe1JAVQ)

60

Gestión Curricular Asignatura: Estadística general

Semana 8 EVALUACIÓN PARCIAL

61

Gestión Curricular Asignatura: Estadística general

Unidad III Resultado de Aprendizaje de la Unidad I: Al finalizar la unidad, el estudiante será capaz de calcular las medidas de tendencia central, variación, posición relativa y deformación para interpretar datos relacionados a su carrera profesional.

ORGANIZACIÓN DE APRENDIZAJES TEMAS Y SUBTEMAS SEMANA N° 9 17. Medidas de tendencia central: Media, mediana, moda Conceptos básicos y propiedades de las medidas de tendencia central. Estadística, división, objetivos, definiciones, tipos de datos. Métodos y fuentes de recolección de datos. 18. Medidas de tendencia central: Media, mediana, moda con spss. SEMANA N° 10 19. Medidas de variación o dispersión: Varianza, desviación estándar y coeficiente de variación. Medidas deformación: asimetría, interpretación. 20. Medidas de variación o dispersión: Varianza, desviación estándar, coeficiente de variación y asimetría con spss. SEMANA N° 11 21. Medidas de posición relativa: Cuartiles y percentiles. Medidas deformación: curtosis, Diagrama de Cajas y bigotes. 22. Medidas deformación: asimetría y curtosis Diagrama de Cajas y bigotes con spss. SEMANA N° 12 23. Evaluación de la tercera unidad. 24. Verificación de resultados de la evaluación de la primera unidad.

ACTIVIDADES Actividad N° 17 Calcula las medidas de tendencia central e interpreta los resultados. A partir de los datos de la encuesta. Actividad N° 18 Aplica las funciones del SPSS para calcular las medidas de tendencia central, de la base de datos de la encuesta realizada a sus compañeros e interpreta los resultados. Actividad N° 19 Calcula las medidas de dispersión apoyándose de una calculadora e interpreta los resultados. A partir de los datos de la encuesta. Actividad N° 20 Aplica las funciones del SPSS para calcular las medidas de variación, de la base de datos de la encuesta realizada a sus compañeros e interpreta los resultados. Actividad N° 21 Calcula las medidas de posición relativa e interpreta los resultados. A partir de los datos de la encuesta. Actividad N° 22 Calcula las medidas de deformación e interpreta los resultados. A partir de los datos de la encuesta. Actividad N° 23 Calcula las medidas de deformación e interpreta los resultados. A partir de los datos de la encuesta. Actividad N° 24

EVALUCIÒN Consolidado 2: Evaluación individual desarrollo teórico-práctico

de

62

Gestión Curricular Asignatura: Estadística general

Semana 9 MEDIDAS DE TENDENCIA CENTRAL Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.

Gustav Theordor Fechner: Utilizo la mediana Francis Galton

A. Gustav Theordor Fechner: usó la mediana (centralwerth) en fenómenos sociológicos y sociológicos.14 Anteriormente había sido usado solamente en astronomía y campos relacionados. B. Francis Galton en 1907 entregó un artículo a la revista Nature acerca de la utilidad de la mediana.16 El examinó la precisión de 787 intentos de adivinar el peso de un buey en una feria de campo. El peso real era de 1208: la mediana de todas las conjeturas fue 1198 libras. Las conjeturas fuern marcadamente no normales en su distribución.

63

Gestión Curricular

LECTURA

Asignatura: Estadística general

MEDIDAS DE CENTRALIZACIÓN Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones. Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar las calificaciones que se obtienen en una prueba. Volviendo a nuestro ejemplo, digamos que la calificación promedio en la prueba que hizo el alumno fue de 20 puntos. Con este dato podemos decir que la calificación del alumno se ubica notablemente sobre el promedio. Pero si la calificación promedio fue de 65 puntos, entonces la conclusión sería muy diferente, debido a que se ubicaría muy por debajo del promedio de la clase. En resumen, el propósito de las medidas de tendencia central es: Mostrar en qué lugar se ubica la persona promedio o típica del grupo. Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico. Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones. Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos. Las medidas de tendencia central más comunes son: La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una línea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribución. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se representa Mo. De estas tres medidas de tendencia central, la media es reconocida como la mejor y más útil. Sin embargo, cuando en una distribución se presentan casos cuyos puntajes son muy bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la moda. (Porque dadas las características de la media, esta es afectada por los valores extremos). Fuente: Fuente Internet: http://tgrajales.net/tendencentral.pdf

64

Gestión Curricular Asignatura: Estadística general

MEDIDAS DE CENTRALIZACIÓN Propósito:  Calcular e interpretar las medidas de tendencia central (media, mediana y moda) de datos no agrupados y agrupados.  Calcula e Grafique e interpreta la asimetría haciendo uso de las medidas de tendencia central. SESIÓN 17: MEDIDAS DE TENDENCIA CENTRAL. Al describir grupos de diferentes observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización. Entre las medidas de tendencia central tenemos: 

Media aritmética



Mediana



Moda

̅; 𝑴; 𝑴(𝒂)): 1. LA MEDIA ARITMÉTICA (𝒙; 𝒙 Es el resultado de dividir la suma de todas las observaciones entre el número de ellas. a)

M.A. para datos no agrupados: Sean: x1, x2, x3,…………xn un conjunto de datos de la variable cualitativa X, observados en una muestra. Entonces su media aritmética es: 𝑥̅ =

∑𝑛𝑖=1 𝑋𝑖 𝑥1 + 𝑥2 + 𝑥3 + ⋯ + 𝑥𝑛 = 𝑁 𝑁

Ejemplo: Un estudiante rinde 4 evaluaciones obteniendo los siguientes puntajes. x1 =10, x2 = 08, x3 =15, x4 =13 ̅): Hallar el promedio final (𝒙 𝑥̅ = b)

∑4𝑖=1 𝑋𝑖 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 10 + 08 + 15 + 13 = = = 11.5 𝑁 4 4

M.A. para datos agrupados: Sean: x1, x2, x3…………xk, las marcas de clase y n1, n2, n3, …………nm las frecuencias absolutas o simples, k es el número de clase, entonces:

̅= 𝒙

∑𝒌𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝑵

Donde hi = frecuencia relativa.

65

Gestión Curricular Asignatura: Estadística general a. De datos discretos: Ejemplo: Se tiene 50 familias y el número de sus hijos (X) que se distribuye en la siguiente forma, determina la media aritmética. X 0 1 2 3 4 5 6 7

Frecuencias 3 9 12 10 8 5 2 1 N = 50

Se aumenta una columna donde se coloca el producto del valor de cada dato por su respectiva frecuencia. X 0 1 2 3 4 5 6 7

Frecuencias 3 9 12 10 8 5 2 1 N = 50

̅= Luego, se utiliza la formula 𝒙

∑𝒌 𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝑵

𝒏𝒊 𝑿𝒊 0 9 24 30 32 25 12 7 139

̅= para hallar la M.A. 𝒙

𝟏𝟑𝟗 𝟓𝟎

= 𝟐. 𝟕𝟖

b. De datos continuos: Ejemplo: Se han registrado el peso de 50 lingotes de acero producidos por una Empresa Minera, la muestra fue obtenida de la producción semanal y las unidades están dadas en kg. Hallar la M.A. Li - Ls 91.5 – 92.5 92.5 – 93.5 93.5 – 94.5 94.5 – 95.5 95.5 – 96.5

ni 4 11 20 9 6 N = 50 Solución

Aumentamos dos columnas, uno para la marca de clase y otro para el producto de cada marca de clase con su respectiva frecuencia.

66

Gestión Curricular Asignatura: Estadística general Li - Ls 91.5 – 92.5 92.5 – 93.5 93.5 – 94.5 94.5 – 95.5 95.5 – 96.5

Xi 92 93 94 95 96

ni 4 11 20 9 6 N = 50

ni.Xi 368 1023 1880 855 576 4702

Luego: ̅= Se utiliza la formula 𝒙

∑𝒌 𝒊=𝟏 𝒏𝒊 𝑿𝒊 𝑵

̅= para hallar la M.A. 𝒙

𝟒𝟕𝟎𝟐 𝟓𝟎

= 𝟗𝟒. 𝟎𝟒

Lo cual nos indica que semanalmente la producción promedio de 50 lingotes de acero por la Minera es de 94.04 kg. 2. LA MODA (𝑴𝒐): Es el valor que en una distribución de datos ocurre con mayor frecuencia, es decir, es el dato que se repite mayor cantidad de veces que los demás. En algunas distribuciones de datos hay más de una moda y se les denomina bimodal (dos modas) o multimodal (varias modas). Cálculo de la moda: a) Moda para datos no agrupados: Ejemplo 1: En la siguiente distribución de datos se tiene las puntuaciones: 14

16

16

17

18

19

19

19

21

22

Hallar la moda. Se observa que la puntuación que más se repite es 19, por lo tanto, la moda es: Mo = 19 Ejemplo 2: En la siguiente distribución de datos se tiene las puntuaciones: 14

16

16

16

18

19

19

19

21

22

Hallar la moda: Las puntuaciones que más se repite son: 16 y 19, por lo tanto, la distribución de los datos es bimodal b) Moda para datos agrupados: i. Moda para datos de variables discretas: La moda se determina observando el valor de las variables que tiene mayor frecuencia. Ejemplo: Determina la moda de la distribución siguiente: N° de hijos por familia

N° de familias

67

Gestión Curricular Asignatura: Estadística general Xi 0 1 2 3 4 5 6 a más Total

ni 60 120 210 360 160 50 30 990

Se observa que la mayor frecuencia es 360, frecuencia que es la variable n4 =360 Como la moda es el dato de mayor frecuencia, entonces la moda es: Mo = 3 Esto nos indica que la mayor cantidad de familias tiene 3 hijos. ii. Moda para datos de variables continúas: Cuando se tienen datos, de variables continuas, agrupados en distribuciones de frecuencias, se usa la siguiente fórmula:

𝑴𝒐 = 𝑳𝒊 + ( Donde:

∆𝟏 )𝒄 ∆ 𝟏 + ∆𝟐

Li = Es el límite inferior del intervalo de clase donde se encuentra la moda. c = es la amplitud del intervalo de clase donde se encuentra la moda. ∆1 = ni – ni – 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo anterior. ∆2 = ni – ni + 1: diferencia entre la frecuencia del intervalo modal con la frecuencia del intervalo posterior. Ejemplo: En la siguiente distribución de frecuencias se dan las edades de una muestra de personas del anexo de Batanyacu. Hallar la moda de dicha distribución: Intervalos Li - Ls 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 – 70 70 – 80 80 - 90

N° de personas ni 3 7 15 28 40 31 16 8

Observando la distribución que la mayor frecuencia es 40, que se ubica en el intervalo (50 – 60), denominándolo intervalo modal. Hallamos:

68

Gestión Curricular Asignatura: Estadística general El límite inferior: Li = 50 ∆1 = ni – ni – 1

∆ 2 = ni – ni + 1

∆1 = 40 – 28

∆2 = 40 – 31

∆1 = 12

∆2 = 9

Su amplitud (c):

c = 10

Reemplazando en la fórmula: 𝑀𝑜 = 𝐿𝑖 + (

∆1 12 ) 𝑐 = 50 + ( ) 10 = 55.71 ∆1 + ∆2 12 + 9

3. LA MEDIANA (𝑴𝒆): La mediana es una medida de tendencia central, cuyo valor divide a un conjunto de datos, ordenado con respecto a la magnitud de sus valores, de tal manera que el número de datos por encima de la mediana es igual al número de datos por debajo de la misma. 3.1. Para datos no agrupados: Si se tiene un conjunto de datos ordenados en forma creciente o decreciente, la mediana se determina como el dato que está ubicado en la posición:  si el número de datos es impar

𝑴𝒆 = 𝑿(𝒏+𝟏) 𝟐

 si el número de datos es par

𝑴𝒆 =

𝑿 𝒏 +𝑿 𝒏 ( ) ( +𝟏) 𝟐 𝟐 𝟐

Ejemplo:

Sean los siguientes 11 datos obtenidos de la observación de una variable X: 0

8

1

2

9

1

3

8

4

7

6

Ordenando en forma creciente: 0 X1

1 X2

1 X3

2 X4

3 X5

4 X6

6 X7

7 X8

8 X9

8 X10

9 X11

Si: n = 11 (n es impar) Entonces su mediana será:

Me = 4

𝑀𝑒 = 𝑋(𝑛+1) = 𝑋(11+1) = 𝑋6 2

2

Significa que el 50% de los datos de la distribución son mayores que 4 y los otros 50% son menores que 4. 3.2. Para datos agrupados en distribución de frecuencias: a) Para datos de variables discretas: Ejemplo: Sean los siguientes datos correspondientes al lanzamiento de seis monedas, doscientas veces.

69

Gestión Curricular Asignatura: Estadística general N° de caras (Xi) 0 1 2 3 4 5 6

Frecuencias (ni) 2 19 46 62 47 20 4

Aumentamos una columna de las frecuencias acumuladas N° de caras (Xi) 0 1 2 3 4 5 6

Frecuencias Frec. acumuladas (ni) (Ni) 2 2 19 21 46 67 62 129 47 176 20 196 4 200 N = 200 Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos) N/2 = 200/2 = 100 Entonces: 𝑁𝑖 ≥ 100 el más cercano será Ni = 129 3 62 Por lo tanto, la mediana se ubica en X4:

129

𝑋4 = 3 → 𝑀𝑒 = 3 b) Para datos de variables continuas: Para hallar la Me en estas variables, se utiliza el mismo procedimiento anterior, pero utilizando la siguiente fórmula:

𝒏 − 𝑵𝒊−𝟏 𝑴𝒆 = 𝒍𝒊 + (𝟐 ).𝒄 𝒏𝒊 Donde: li = límite inferior donde se encuentran la mediana. c = amplitud del intervalo de clase. n = tamaño de la muestra o total de datos de la distribución. 𝑁𝑖−1 = frecuencia acumulada del intervalo anterior donde se encuentra la mediana. ni = frecuencia del intervalo donde se encuentra la mediana.

Ejemplo: Sean datos correspondientes a la medición en centímetros de 200 varillas, determine la Me:

70

Gestión Curricular Asignatura: Estadística general Li – Ls 29.5 – 30.5 30.5 – 31.5 31.5 – 32.5 32.5 – 33.5 33.5 – 34.5 34.5 – 35.5 35.5 – 36.5 36.5 – 37.5 37.5 – 38.5 38.5 – 39.5

ni 4 8 23 35 62 44 18 4 1 1

Aumentamos una columna de las frecuencias acumuladas Li – Ls 29.5 – 30.5 30.5 – 31.5 31.5 – 32.5 32.5 – 33.5 33.5 – 34.5 34.5 – 35.5 35.5 – 36.5 36.5 – 37.5 37.5 – 38.5 38.5 – 39.5

ni 4 8 23 35 62 44 18 4 1 1 N =200

Ni 4 12 35 70 132 176 194 198 199 200

Luego se busca un Ni que sea mayor o igual que N/2 (N = n° total de datos) N/2 = 200/2 = 100 Entonces: 𝑁𝑖 ≥ 100 el más cercano será Ni = 132 33.5 – 34.5

62

132

li = 33,5 c=1 n = 200 𝑁𝑖−1 = 70 ni = 62 Reemplazando en la fórmula: 𝑛

𝑀𝑒 = 𝑙𝑖 + (2

−𝑁𝑖−1 𝑛𝑖

) . 𝑐 = 33.5 + (

200 −70 2

62

) . 1 = 33.5 +

30 62

= 33,98

71

Gestión Curricular Asignatura: Estadística general 4. RELACIÓN ENTRE MEDIA ARITMÉTICA, MEDIANA Y MODA. Si la distribución de frecuencias de los datos es simétrica, entonces la media, la mediana y la moda tienen el mismo valor:

Si la distribución es asimétrica de cola derecha, entonces, la moda es menor que la mediana y esta a su vez es menor que la media:

Si la distribución es asimétrica de cola a la izquierda, entonces la media es menor que la mediana y esta a su vez menor que la moda:

Problemas Desarrollados

1.

Una persona que trabaja en forma independiente gana en un mes s/. 200; otro mes s/.600, un tercer mes s/.400 y un cuarto mes S/.440, ¿En promedio ménsula cuánto gana? 𝑋̅ =

2.

200 + 600 + 400 + 440 1640 = = 410 4 4

Se escogieron al azar 24 familias y se les pregunto por el número de hijos que tenía cada una; las respuestas obtenidas fueron las siguiente: 2,4,6,6,2,3,0,0,4,5,3,3,4,3,5,2,1,2,0,3,4,5,1,1 Hallar el promedio del número de hijos de las 25 familias. Solución Realizamos la tabla de frecuencia: Xi 0 1 2 3 4 5 6

ni 3 3 4 5 4 3 2 n= 24

Xi.ni 0 3 8 15 16 15 12 69

Remplazando en la fórmula para determinar la Ma: ̅ 𝑋=

69 = 2,875 = 2.88 24

3. Sea una distribución de frecuencias de puntuaciones obtenidas por 105 estudiantes en una prueba de estadísticas. Hallar la media aritmética.

72

Gestión Curricular Asignatura: Estadística general Realizamos un cuadro más en la tabla de frecuencia: Li - Ls 2–4 4–6 6–8 8 - 10 10 - 12 12 - 14 14 - 16 16 - 18

xi 3 5 7 9 11 13 15 17

ni 3 2 5 9 12 10 2 5 N = 48

xi.ni 9 10 35 81 132 130 30 85 512

Remplazando en la fórmula para determinar la Ma: 512 ̅ 𝑋= = 10.67 = 10.7 48

Problemas Propuestos

1. Una empresa ha realizado un test físico entre todos sus empleados para comprobar la capacidad de esfuerzo que posee cada uno de ellos. Una de las medidas que componen el test es el número de pulsaciones después de una determinada actividad física que está altamente relacionada con las que se realizan a lo largo de una jornada laboral. Los datos conseguidos han sido distribuidos en la siguiente tabla: Numero de pulsaciones

Número de empleados

[65-70> 12 [70-75> 15 [75-80> 10 [80-85> 28 [85-90] 30 [90-95] 5 a) ¿Qué porcentaje de empleados tuvo menos de 85 pulsaciones? b) Calcula la media aritmética, la mediana y la moda. Interpreta los resultados. 2. Los ingresos en dólares de 18 hombres elegidos al azar del Banco BBVA CONTINENTAL (entre un total de 1000) se muestran a continuación:

a)

45,16 83,61 79,85 22,07 76,91 65,73 88,91 99,49 62,59 34,20 88,61 41,50 68,89 92,22 54,33 53,20 16,60 62,59 Calcula la media aritmética empleando la tabla de frecuencias.

b)

Halla la mediana y moda e interpreta (en termino de dólares).

73

Gestión Curricular Asignatura: Estadística general c)

¿Se puede considerar que las poblaciones de 1000 personas tendrán la misma media que la muestra de 18 personas? ¿Por qué?

3. El grafico tallo y hoja muestra los productos vendidos de la tienda “La Moderna” en un día. Calcular las medidas de tendencia central y graficar el sesgo y, ¿la media aritmética es significativa en los productos vendidos? TALLO 2 3 4 5 6

HOJAS 2 122 2333 228 7

4. De los 46 productos vendidos de la tienda “Casa Sueldo” un día domingo. Calcular las medidas de tendencia central, asimetría e interpretar el sesgo. Elabora una tabla de frecuencias a partir del histograma.

5.

Se tiene el siguiente cuadro que corresponde quesos producidos por trabajador para la empresa SERRANITA: Litros de lácteos producidos Cantidad de trabajadores

5-11> 12

11-17> 18

17-23> 13

23-29> 9

29-35> 10

Con los datos se pide: a) Grafica el histograma b) Determine media, mediana y moda e interpreta cada uno de ellos

74

Gestión Curricular Asignatura: Estadística general

Video de Apoyo

Video 1: Media, Mediana y Moda - Ejemplos y Ejercicios Resueltos - Medidas de Tendencia Central (https://www.youtube.com/watch?v=jiceVfALmV0) Video 2: Media, Mediana y Moda para Datos Agrupados en Intervalos (https://www.youtube.com/watch?v=G3WYwknaVuc)

75

Gestión Curricular Asignatura: Estadística general

Semana 10 MEDIDAS DE VARIACIÓN O DISPERSIÓN La desviación típica cumple la llamada desigualdad de Tchebychev: según la cual, los datos que se alejan de la media una distancia igual o menor que s, multiplicado por un coeficiente k suponen más de la proporción 1-1/k2. Así, el 75% de los datos al menos, se encuentra a menos de dos desviaciones típicas y el 89% a menos de tres.

Hiparco de NIcea Telescopio para observar el cielo Galileo Galilei

A. Hiparco de Nicea: el primer catálogo de estrellas; la división del día en 24 horas de igual duración (hasta la invención del reloj mecánico en el siglo XIV las divisiones del día variaban con las estaciones B. Galileo Galilei: Fue el primer astrónomo que usó el telescopio para observar el cielo. La Inquisición lo condenó a arresto domiciliario por sus descubrimientos, el cual fue levantado 359 años después por el papa Juan Pablo II.

76

Gestión Curricular Asignatura: Estadística general

LECTURA

VARIABILIDAD Y DISPERSIÓN Las ideas de variabilidad y dispersión revisten una gran importancia en la estadística, pues dotan a esta ciencia de su razón de ser y pueden ser abordadas, tanto desde la estadística descriptiva, como de la probabilidad y la inferencia. Tanto Wild y Pfannkuch (1999), como Moore (1990) incluyen la percepción de la variabilidad aleatoria como componentes esenciales del razonamiento estadístico. Las medidas de dispersión son, además, esenciales en una distribución de datos, complementando a las de posición central, al caracterizar la variabilidad de los datos respecto a las mismas. Como sugieren Batanero, González- Ruiz, LópezMartín y Contreras (2015), es importante que los estudiantes las comprendan y diferencien las relacionadas con la distribución de datos, la distribución de probabilidad y la distribución muestral. A pesar de su importancia, la investigación didáctica sobre la comprensión de la variabilidad y la dispersión es relativamente escasa, en comparación con la existente respecto a las ideas de centro y medidas de posición central. Por este motivo me interesé en comenzar una línea de investigación al respecto, que desembocará en un estudio del tema en los libros de texto y otro estudio de evaluación amplio de la comprensión de estas ideas en estudiantes de educación secundaria y se concretará en una tesis doctoral. La finalidad del este trabajo fin de Máster es realizar una síntesis de la investigación didáctica relacionada con este tema, que sirva de fundamento para la futura tesis doctoral, ya avanzada. Para llevarla a cabo se ha realizado una extensa consulta, estudio, análisis y síntesis de dicha investigación, clasificándola y resumiéndola en esta memoria, que se organiza en los siguientes capítulos: En el primero de ellos se comienza justificando el interés de realizar este trabajo de síntesis, se presenta una síntesis de la evolución histórica de estos conceptos, se analizan los contenidos curriculares relacionados con las ideas de variabilidad y dispersión y se presentan los objetivos del trabajo. El segundo capítulo expone en forma resumida algunas ideas de nuestro marco teórico que es el enfoque ontosemiótico que consideramos de interés para nuestro trabajo actual y nuestra futura tesis doctoral. En el tercer capítulo se presenta el trabajo de síntesis de la investigación previa que se organiza a través de los significados de la dispersión, aportando a su vez estudios 5 sobre la percepción y las concepciones de estudiantes y futuros profesores de las medidas de dispersión. Fuente: (Hald, 1998, p. 33) Los errores aleatorios de las observaciones nos llevan a errores aleatorios de una función de las observaciones que pueden ser grandes, incluso si los errores de observación son pequeños.

77

Gestión Curricular Asignatura: Estadística general

MEDIDAS DE VARIACIÓN O DISPERSIÓN Propósito:  Calcular e interpretar medidas de variación o dispersión.  Describir y comparar distribuciones de datos a partir de sus medidas de dispersión.  Aplicar las medidas de dispersión para analizar la representatividad de la media aritmética. SESIÓN 19: MEDIDAS DE VARIACIÓN O DISPERSIÓN. 1.

LA VARIANZA Y LA DESVIACIÓN ESTANDAR: La varianza es la media aritmética de los cuadrados de las desviaciones de cada observación o dato con respecto a la media aritmética y se simboliza por S2 ó σ2. La desviación estándar o desviación típica es la raíz cuadrada de la varianza y se simboliza por S ó σ. Calculo de la varianza y la desviación estándar. 1.1. PARA DATOS NO AGRUPADOS: Fórmula para la varianza: 𝑺𝟐 = Donde:

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏

Xi = dato u observación. Ma = media aritmética n = número total de datos (𝑿𝒊 − 𝑴𝒂)𝟐 = desviación al cuadrado de cada dato con respecto a la media. Fórmula para la desviación estándar: ∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝑺= √ 𝒏 Ejemplo: El tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea fue la siguiente: 16; 12; 15; 18; 13; 14 minutos Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos: Solución: Hallamos la Ma: 𝑀𝑎 =

16 + 12 + 15 + 18 + 13 + 14 88 = = 14.7 6 6

78

Gestión Curricular Asignatura: Estadística general Luego calculamos la suma de las desviaciones al cuadrado (varianza) 𝑆2 =

(16 − 14,7)2 + (12 − 14,7)2 + (15 − 14,7)2 + (18 − 14,7)2 + (13 − 14,7)2 + (14 − 14,7)2 6 23.34 𝑆2 = 6 𝑆 2 = 3.89 𝑚𝑖𝑛𝑢𝑡𝑜𝑠

Calculando la desviación estándar: 𝑆 = ξ3.89 = 1.97 Por lo tanto: el tiempo utilizado por los seis niños para desarrollar la tarea, si dispersa en promedio de 3,89 minutos al cuadrado con respecto a la media aritmética. 1.2. PARA DATOS AGRUPADOS: a) Para datos de variables discretas: Formula para la varianza: ∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝒏 Fórmula para la desviación estándar: 𝑺𝟐 =

𝑺= √

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊 𝒏

Ejemplo: En la siguiente distribución de frecuencias del número de hijos de 50 familias, se pide hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos: N° de hijos Xi 0 1 2 3 4 5 6 7 Completando columnas: Xi 0 1 2 3 4 5 6 7

ni 3 9 12 10 8 5 2 1

𝒏𝒊 𝑿𝒊 0 9 24 30 32 25 12 7

N = 50

139

N° de familias ni 3 9 12 10 8 5 2 1 (𝑿𝒊 − 𝑴𝒂)𝟐 7,73 3,17 0,61 0,05 1,49 4,93 10,37 17,81

(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 23,19 28,53 7,32 0,5 11,92 24,65 20,74 17,81 134,66

79

Gestión Curricular Asignatura: Estadística general Hallando la M.A: 𝑴𝒂 =

𝟏𝟑𝟗 𝟓𝟎

= 𝟐. 𝟕𝟖

Luego: 𝑺𝟐 =

∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝟏𝟑𝟒, 𝟔𝟔 = = 𝟐. 𝟔𝟗 𝒏 𝟓𝟎

Entonces: 𝑆 = ξ2,69 = 1.64 El número de hijos de las 50 familias tienen una dispersión promedio de 1.64 hijos con respecto a la media aritmética. b)

Para datos de variables continuas: Fórmula para la varianza: ∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝒏 Fórmula para la desviación estándar: 𝑺𝟐 =

𝑺= √

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊 𝒏

Donde: Xi = marca de clase Ma = media aritmética n = número total de datos (𝑿𝒊 − 𝑴𝒂)𝟐 = desviación al cuadrado de cada dato con respecto a la media. Ejemplo: Se han registrado el peso de 50 lingotes de acero producidos por SIDERPERU, la muestra fue obtenido de la producción semanal y las unidades están dadas en kg. Hallar la varianza (S2) y la desviación estándar (S) del conjunto de datos. Li - Ls 91,5 – 92,5 92,5 – 93,5 93,5 – 94,5 94,5 – 95,5 95,5 – 96,5

ni 4 11 20 9 6 N = 50

Solución Hallando la Ma: 𝑀𝑎 =

4702 = 94.04 50

Completando la columna cinco: |𝑿𝒊 − 𝑴𝒂|𝟐 = |𝑿𝟏 − 𝑴𝒂|𝟐 = |𝟗𝟐 − 𝟗𝟒, 𝟎𝟒|𝟐 = 𝟒, 𝟏𝟔𝟏𝟔 Completando la columna seis: |𝑿𝒊 − 𝑴𝒂|𝟐 . 𝒏𝒊 = |𝑿𝟏 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝒏𝟏 = |𝟗𝟐, 𝟎 − 𝟗𝟒, 𝟎𝟒|𝟐 . 𝟒 = 𝟒, 𝟏𝟔𝟏𝟔. 𝟒 = 𝟏𝟔, 𝟔𝟒𝟔𝟒

80

Gestión Curricular Asignatura: Estadística general Aumentamos cuatro columnas: Li - Ls 91.5 – 92.5 92.5 – 93.5 93.5 – 94.5 94.5 – 95.5 95.5 – 96.5

Xi 92 93 94 95 96

ni 4 11 20 9 6 N = 50

ni.Xi 368 1023 1880 855 576 4702

(𝑿𝒊 − 𝑴𝒂)𝟐 4,1616 1,0816 0,0016 0,9216 3,8416

(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 16,6464 11,8976 0,32 8,2944 23,0496 60,2256

Hallando la varianza: ∑(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊 𝟔𝟎, 𝟐𝟐𝟓𝟔 = = 𝟏, 𝟐𝟎 𝒏 𝟓𝟎 Hallando su desviación estándar: 𝑺𝟐 =

𝑺= √

∑(𝑿𝒊 − 𝑴𝒂)𝟐 𝒏𝒊 = √𝟏, 𝟐𝟎 = 𝟏, 𝟎𝟗𝟓 𝒏

Por lo tanto, los lingotes de acero en la producción semanal de SIDER PERÚ se dispersan en promedio de 1,095 kg con respecto a la media aritmética. 2. COEFICIENTE DE VARIACIÓN: El coeficiente de variación (CV) es el cociente de la desviación estándar y la media aritmética, expresado en

porcentaje.

𝑺 𝒙𝟏𝟎𝟎% 𝑴𝒂 El coeficiente de variación es un indicador de la dispersión relativa de los datos y la unidad 𝑪𝑽 =

de medida que esta expresada en porcentaje. Ejemplo 1. Hallar el coeficiente de variación (CV) del tiempo que utilizan 6 niños de igual edad para desarrollar una misma tarea, los resultados son los siguientes: 16; 12; 15; 18; 13; 14 minutos. Solución Hallando la Ma: 𝑀𝑎 =

16 + 12 + 15 + 18 + 13 + 14 88 = = 14.7 6 6

Determinando la varianza: 𝑆2 =

(16 − 14.7)2 + (12 − 14.7)2 + (15 − 14.7)2 + (18 − 14.7)2 + (13 − 14.7)2 + (14 − 14.7)2 6 𝑆 2 = 3.89 𝑆 = ξ3.89 = 1.97

Hallando el CV: 𝑪𝑽 =

𝑺 𝟏. 𝟗𝟕 𝒙𝟏𝟎𝟎% = 𝒙𝟏𝟎𝟎% = 𝟏𝟑. 𝟒𝟎% 𝑴𝒂 𝟏𝟒. 𝟕

81

Gestión Curricular Asignatura: Estadística general Ejemplo 2. Sea la distribución de frecuencias de las notas de Estadística general de estudiantes de la Universidad Continental. Hallar S2, S, CV. Li - Ls 00 – 02 02 – 04 04 – 06 06 – 08 08 – 10 10 – 12 12 – 14 14 – 16

ni 3 5 2 12 8 3 7 10 N=50 Solución:

Completando cuadrados con los pasos estudiados: Li - Ls 00 – 02 02 – 04 04 – 06 06 – 08 08 – 10 10 – 12 12 – 14 14 – 16

Xi 1 3 5 7 9 11 13 15

Hallando la Ma: 𝑀𝑎 =

ni 3 5 2 12 8 3 7 10 N=50 458 50

Xi.ni 3 15 10 84 72 33 91 150 458

(𝑿𝒊 − 𝑴𝒂)𝟐

(𝑿𝒊 − 𝑴𝒂)𝟐 . 𝒏𝒊

66.59 37.95 17.31 4.67 0.03 3.39 14.75 34.11

199.77 189.75 34.62 56.04 0.24 10.17 103.25 341.10 934.94

= 9.16

Hallando S2: 𝑆2 =

∑(𝑋𝑖 − 𝑀𝑎)2 . 𝑛𝑖 934.94 = = 18.70 𝑛 50

Hallando

S: 𝑆 = ξ18.70 = 4.32

Hallando CV: 𝐶𝑉 =

𝑆 4.32 𝑥100% = 𝑥100 = 47.16 𝑀𝑎 9.16

82

Gestión Curricular Asignatura: Estadística general

Problemas Desarrollados

1. Las edades de 8 niños son las siguientes: 5, 6, 8, 7, 5, 6,9 y 10 años. Determine la varianza y la desviación estándar. Solución Hallamos la Ma: 𝑀𝑎 =

5 + 6 + 8 + 7 + 5 + 6 + 9 + 10 56 = =7 8 8

Halando la varianza y la desviación estándar: 𝑆2 =

(5 − 7)2 + (6 − 7)2 + (8 − 7)2 + (7 − 7)2 + (5 − 7)2 + (6 − 7)2 +(9 − 7)2 + (10 − 7)2 8 4+1+1+0+4+1+4+9 𝑆2 = 8 24 𝑆2 = =3 8 𝑆 = ξ3 = 1.73

2. Se han registrado la edad en una muestra de 53 niños que tienen problemas de salud. Hallar la varianza y la desviación estándar. Li - Ls 0-3 3-6 6-9 9 - 12 12 - 15

ni 5 12 20 10 6 Solución

Completando la tabla de frecuencias: Xi 0-3 3-6 6-9 9-12 12-15

ni 5 12 20 10 6 n =53

mi 1.5 4.5 7.5 10.5 13.5

ni.xi 7.5 54.0 150.0 105.0 81.0 397.5

(mi- Ma)2 36 9 0 9 36

(mi- Ma)2. ni 180 108 0 90 216 594

Determinamos la Ma: 397.5 = 7.5 53 Hallando la varianza y desviación estándar: 𝑀𝑎 =

𝑆2 =

594 = 11.21 53

𝑆 = ξ11.21 = 3.35

83

Gestión Curricular Asignatura: Estadística general 3. Un docente de matemática aplico una evaluación a un grupo obteniendo los siguientes resultados: 37 42 34

35 40 40

43 46 38

45 35 37

45 34 40

35 44 38

35 43 36

Hallar la varianza y la desviación estándar. Solución  Identificar el dato mayor dato menor Dato mayor = 46

Dato menor = 34

 Hallamos el rango: R= 46-34 =12  Hallamos el número de intervalos (K) Si: n ≥ 10

K = 1+3.322Log(n)

K=1+3.32 Log (21)

K=1+3.322x(1.32)

K=1+4.38

K= 5.38

Los posibles valores de: K=5,6 o 7  Hallamos la amplitud del intervalo de clase (C): C= C=

𝑅 𝐾 𝑅 𝐾

= =

12 5 12 6

= 2.4 = 2

entonces

= 2 entonces

5𝑥2 = 10

6𝑥2 = 12

Elaboramos la tabla con K = 6 y c = 2  Determinamos los extremos de los intervalos I1 = [34 – 34+2[ = [34 - 36[

I3 = [34+2x2 – 34+3x2[

I2 = [34+2 – 34+2x2[

= [38 - 40[

= [36 - 38[

= [42 - 44[

I4 = [34+3x2 – 34+4x2[ =[40 - 42[

Li - Ls [34-36[ [36-38[ [38-40[ [40-42[ [42-44[ [44-46]

ni 6 3 2 3 3 4 N=21

Xi 35 37 39 41 43 45

Ni 6 9 11 14 17 21

ni.xi 210 111 78 123 129 180 831

|𝑋𝑖 − 𝑀𝑎| 4.57 2.57 0.57 1.43 3.43 5.43

I5 = [34+4x2 – 34+5x2[ I6 = [34+5x2– 34+6x2[ =[44 - 46[

|𝑋𝑖 − 𝑀𝑎|. 𝑛𝑖 27.42 7.71 1.14 4.29 10.29 21.72 72.57

(xi - Ma)2 20.88 6.60 0.32 2.04 11.76 29.48

(xi - Ma)2.ni 125.28 19.80 0.64 6.12 35.28 117.92 305.04

 Hallando la media aritmética (Ma): 𝑋̅ =  Hallando la S2: 𝑆2 =

831 = 39.57 21

305.04 = 14.53 21

𝑆 = ξ14.53 = 3.81

84

Gestión Curricular Asignatura: Estadística general

Problemas Propuestos

1. Calcular todas las medidas de dispersión para la siguiente distribución: Xi ni

5 3

10 7

15 5

20 3

25 2

2. Calcular todas las medidas de dispersión para los datos de la siguiente distribución: Xi ni

0-100 90

100-200 140

200-300 150

300-800 120

3. Un artículo reportó los siguientes datos sobre consumo de oxígeno (ml/kg/min) para una muestra de diez bomberos que realizaron un simulacro de supresión de incendio. 29,5 26,3

49,3 33,9

30,6 29,4

28,2 23,5

28,0 31,6

Calcule lo siguiente: a) El rango muestral. b) La varianza muestral (s2) a partir de la definición (es decir, calculando primero las desviaciones y luego elevándolas al cuadrado, etcétera). c) La desviación estándar muestral. d) S2 utilizando el método más corto. (con ayuda de la formula) 4. Una compañía requiere los servicios de un técnico especializado. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales reúnen los requisitos. Para decidir cuál de los 2 se va a contratar se toman siete pruebas a cada uno de ellos. Los resultados se dan a continuación:

Puntaje obtenido por A Puntaje obtenido por B

1 57 80

2 55 40

3 54 62

Prueba 4 5 52 62 72 46

6 55 80

7 59 40

a)

Halle e interprete todas las medidas de dispersión de los dos candidatos.

b)

Estadísticamente, ¿Cuál de los candidatos debe ser contratado?, fundamente su respuesta.

5. Se tiene dos muestras de obreros, cuyos ingresos diarios son: Muestra 1: S/.138; S/.136; S/.146; S/.140 y S/.145, Muestra 2: S/.134; S/.147; S/.147; S/.145 y S/.137 Compare el coeficiente de variabilidad de ambas muestras y determine que muestra de obreros presenta ingresos diarios más homogéneos (Fundamente su respuesta).

85

Gestión Curricular Asignatura: Estadística general

Video de Apoyo

Video 1: Varianza y desviación estándar | Introducción (https://www.youtube.com/watch?v=oZRaDwnpXkY) Video 2: Varianza, Desviación Estandar y Coeficiente de Variación | Datos agrupados puntualmente (https://www.youtube.com/watch?v=fzPBAp14R98)

86

Gestión Curricular Asignatura: Estadística general

Semana 11 MEDIDAS DE POSICIÓN RELATIVA Son indicadores usados para señalar que porcentaje de datos dentro

de

una

distribución

de

frecuencias

superan

estas

expresiones, cuyo valor representa el valor del dato que se encuentra en el centro de la distribución de frecuencia

Ronald A. Fisher Biometría Universidad de Cambridge

A. Ronald A. Fisher: Fisher expresó que las desviaciones que excedían dos veces la desviación estándar eran consideradas significativas. Previamente a esto las desviaciones que excedían tres veces el error probable eran consideradas significativas. Previamente a esto las desviaciones que excedían tres veces el error probable eran consideradas significativas. Para una distribución simétrica el error probable la mitad del rango intercuantil. El cuantil superior de la distribución normal estándar está entre 0.66 y 0.67, su error probable es aproximadamente 2/3 de la desviación estándar. Parece que el criterio de Fisher del 5% tenía sus raíces en la práctica previa.

87

Gestión Curricular Asignatura: Estadística general

LECTURA

¿Qué es el percentil y para qué sirve? Imaginemos una revisión en el pediatra de un bebé cualquiera. Todo bien, los remedios estándar para la nueva temporada de mocos que todos conocemos; Mucha agua, si tiene fiebre le das el antitérmico con sabor a fresa y si ves que la cosa no mejora se lo alternas con el de sabor a naranja. El peso bien, la altura genial y un percentil por encima de lo que a su edad le corresponde... El padre o madre mira al médico, le devuelve la sonrisa que demuestra lo orgulloso que está de su bebé y sale de la consulta contentísimo sabiendo que su hijo o hija, a pesar de los mocos, tiene un percentil por encima de la media. Los padres lo comentan con las abuelas cuando les llaman para preguntar por el niño y les dejan claro que la cosa va bien porque el niño tiene un percentil por encima de la media. Están tan contentos que incluso hablan con sus hermanos y les preguntan qué percentil tenían sus hijos a la edad del suyo. Sin querer, durante la semana, el percentil se convierte en el tema de conversación con amigos y otros padres y madres. Llegan por tanto a la conclusión de que están haciendo la cosa bien porque tienen un hijo con un percentil por encima de la media. ¡Felicidades! Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía mejor, ¿para qué sirve? La cosa es sencilla, pero solo para los matemáticos, en mi caso lo he tenido que preguntar varias veces y me ha sorprendido descubrir que es un término que todos los padres y madres tenemos en cuenta, pero pocos sabemos qué es realmente. Un percentil es una medida estadística para comparar resultados, nos permite saber cómo está situado un valor en función de una muestra. Si hablamos de bebés, nos permitiría comparar los datos de nuestro bebé con otros de sus mismas características. Estas características son la edad y el sexo. Los aspectos de su desarrollo que comparamos o los que más interés despiertan en los padres son: El peso, La altura, La circunferencia de la cabeza Si nos dice nuestro pediatra que nuestro bebé de 6kg está en el percentil 25, quiere decir que hay un 25% de los bebés estudiados que están en el mismo peso o menos y un 75% que están por encima. Pongo el ejemplo, al contrario, a ver si consigo aclarar la cosa un poco más: si nuestro bebé se encuentra en el percentil 75 de peso, quiere decir entonces que de toda la muestra solo hay un 25% que pesen más que nuestro hijo. En España, los valores y las curvas utilizados para medir los percentiles (las curvas son la representación gráfica de los valores, esos papeles con líneas y puntitos que nos da siempre el pediatra al acabar la revisión) son las proporcionadas por el Sistema Público de Salud que están realizadas por el Instituto de Investigación sobre Crecimiento y Desarrollo de la Fundación Faustino Orbegozo Eizaguirre. Estas tablas hacen dos diferencias por edad, niños de 0 a 2 años y de 2 a 14 años y son diferentes para niños y para niñas. Existen 7 percentiles que agrupan las medidas que se consideran normales, del percentil 3 al 97, pasando por el 19, 25, 50 -que sería la media-, 75 y 90. Por debajo del 3 y por encima del 97, nuestro pediatra, que al fin y al cabo es quien revisa los datos, nos dirá qué pasos seguir. Los percentiles, al tratarse de una medida estadística no son iguales en todos los países, es más o menos lógico pensar que la muestra para extraer los datos no será igual aquí que en un país con grandes problemas para alimentar a su población. Por esto, nuestro hijo puede estar en un percentil en España y en otro muy diferente en otro país. El estudio de los datos y el método de elaboración de las tablas para crear los percentiles, es preciso y, posiblemente, cada vez mejor, pero hasta qué punto pueden ser concluyentes, lo vamos a determinar nosotros. Si nuestro hijo crece y se desarrolla continuamente de forma controlada por un profesional, el número que alcance en una gráfica es algo más. Fuente: BERMISON ORTEGA, Russell Frank. (2006). El Nuevo Marketing. México: Pearson Prentice Hall.

88

Gestión Curricular Asignatura: Estadística general

MEDIDAS DE POSICIÓN Propósito:  Calcular e interpretar medidas de posición relativa (cuartiles y percentiles).  Efectuar análisis exploratorio de datos haciendo uso de diagramas de caja y bigote.

SESIÓN 21: CUARTILES Y PERCENTILES. 1. CUARTILES: Son valores que dividen a un conjunto de datos ordenados en forma ascendente o descendente en cuatro partes iguales del conjunto de datos. Es decir: Xmin

Q1=25%

25%

Q2=50%

25%

Xmax

Q3=75%

25%

25%

En este caso se tiene tres puntos de división a los que se llaman: Primer cuartil (Q1) Que viene a ser un valor que se supera a no más del 25% de las observaciones o datos, y que es superado por no más del 75% de las observaciones. Segundo cuartil (Q2) Coincide con la mediana, es decir: Me = Q2 Tercer cuartil (Q3) Que viene a ser un valor que se supera a no más del 75% de las observaciones o datos y es superado por no más del 25% de las observaciones o datos. Calculo de los cuartiles: 1.1. Para datos no agrupados. ¿Cómo se calculan los cuartiles de una muestra de n observaciones? Pasos: i. Ordenar los datos de menor a mayor. ii. El cuartil inferior es el dato que ocupa la posición (n+1)/4 en la muestra ordenada. iii. El cuartil superior es el dato que ocupa la posición 3(n+1)/4 en la muestra ordenada. Si la posición resulta ser un número decimal, promediamos los datos que se encuentran a izquierda y derecha de la posición obtenida.

89

Gestión Curricular Asignatura: Estadística general Ejemplo: Consideremos los siguientes datos ordenados (n = 13). Posición Datos

1 104

2 112

3 134

4 146

5 155

6 168

7 170

8 195

9 246

10 302

11 338

12 412

13 678

Solución. Posición del cuartil inferior = (13 + 1)/4 = 3.5 Posición de la mediana = (13 + 1)/2 = 7

𝑄1 =

134+146 2

= 140

𝑀𝑒 = 𝑄2 = 170

Posición del cuartil superior = 3.(13 + 1)/4 = 10.5

𝑄3 =

302+338 2

= 320

Dentro de los cuartiles se puede observar: CINCO NÚMEROS RESÚMENES Un modo de resumir toda la distribución de los datos es informar los siguientes cinco números resúmenes: Mínimo, Cuartil inferior (Q1), Mediana (Q2), Cuartil superior (Q3), Máximo En nuestro ejemplo: Mínimo Cuartil inferior(Q1) Mediana(Q2) Cuartil superior(Q3) máximo 1.2.

= = = = =

104 140 170 320 678

25% 25% 25% 25%

Para datos agrupados Formula general:

𝒋. 𝑵 − 𝑵𝒊−𝟏 𝑸𝒋 = 𝒍𝒊 + ( 𝟒 ).𝒄 𝒏𝒊 Donde: j = 1,2,3 li = límite inferior donde se encuentra el primer cuartil c = amplitud del intervalo de clase donde se encuentra el cuartil. N = tamaño de la muestra o total de datos de la distribución. 𝑁𝑖−1 = frecuencia acumulada del intervalo anterior donde se encuentra el

90

Gestión Curricular Asignatura: Estadística general Ejemplo: Sean los siguientes datos correspondientes a la medición en centímetros de 200 varillas. Hallar el primer y el tercer cuartil. Li - Ls ni 29,5 – 30,5 4 30,5 – 31,5 8 31,5 – 32,5 23 32,5 – 33,5 35 33,5 – 34,5 62 34,5 – 35,5 44 35,5 – 36,5 18 36,5 – 37,5 4 37,5 – 38,5 1 38,5 – 39,5 1 Realizamos el mismo procedimiento que en la mediana, se aumenta una columna para la frecuencia acumulada (Ni) Li - Ls 29,5 – 30,5 30,5 – 31,5 31,5 – 32,5 32,5 – 33,5 33,5 – 34,5 34,5 – 35,5 35,5 – 36,5 36,5 – 37,5 37,5 – 38,5 38,5 – 39,5

ni 4 8 23 35 62 44 18 4 1 1 N =200

Ni 4 12 35 70 132 176 194 198 199 200

 Hallando el Q1. Luego se busca un Ni que sea mayor o igual que N/4 (N = n° total de datos) N/4 = 200/4 = 50, Entonces: 𝑁𝑖 ≥ 50 el más cercano será Ni = 70, esto nos indica que aquí esta Q1. 32,5 – 33,5

35

70

Donde: Li = 32,5 c=1 N = 200 𝑁𝑖−1 = 35 𝑛𝑖 = 35 Reemplazando en la fórmula: 𝒏 𝟐𝟎𝟎 − 𝑵𝒊−𝟏 − 𝟑𝟓 𝟒 𝑸𝟏 = 𝒍𝒊 + ( ) . 𝒄 = 𝟑𝟐. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟐. 𝟗𝟑 𝒏𝒊 𝟑𝟓  Hallando el Q3. Luego se busca un Ni que sea mayor o igual que 3N/4 (N = n° total de datos) 3N/4 = 3(200)/4 = 150,

91

Gestión Curricular Asignatura: Estadística general Entonces: 𝑁𝑖 ≥ 150 el más cercano será Ni = 176, esto nos indica que aquí esta Q3. 34,5 – 35,5

44

176

Donde: Li = 34,5 c=1 N = 200 𝑁𝑖−1 = 132 𝑛𝑖 = 44 Reemplazando en la fórmula: 𝟑𝒏 𝟑. 𝟐𝟎𝟎 − 𝑵𝒊−𝟏 − 𝟏𝟑𝟐 𝟒 𝑸𝟑 = 𝒍𝒊 + ( ) . 𝒄 = 𝟑𝟒. 𝟓 + ( 𝟒 ) . 𝟏 = 𝟑𝟒. 𝟗𝟏 𝒏𝒊 𝟒𝟒

∴ 𝑸𝟏 = 𝟑𝟐. 𝟗𝟑



𝑸𝟑 = 𝟑𝟒, 𝟗𝟏

2. PERCENTILES: Los percentiles dividen al conjunto de observaciones en cien partes iguales. Hay 99 percentiles. P1=1%

P5=5%

P50=50%

P99=99%

1% 1% 1% 1% 1% 1% 2.1. PERCENTIL PARA DATOS NO AGRUPADOS. Procedimiento: 

Ordenar los datos de menor a mayor.



Calcular el percentil utilizando la fórmula:

n = Número de valores

𝒌 𝑳=( ) 𝒙𝒏 𝟏𝟎𝟎

k = Percentil buscado 

“L” es un número entero, si el valor de k-énesimo percentil está a la mitad entre el L-énesimo valor y el siguiente valor en el conjunto ordenado de datos. Obtenga Pk sumando el L-énesimo valor y el siguiente valor, luego dividiendo el total entre 2.



No modifique L redondeando al siguiente entero más grande.



El valor de Pk es el L-énesimo valor, contando a partir del más bajo.

92

Gestión Curricular Asignatura: Estadística general Ejemplo: Determine el cuartil 3 de los siguientes valores muestrales: 25 – 18 – 47 – 35 – 32 – 19 – 20 – 26 – 35 – 30 – 28 – 30 Solución Ordene de menor a mayor los datos (n = 12) 18 – 19 – 20 – 25 – 26 – 28 – 30 – 30 – 32 – 35 – 35 – 47 Calcule el valor del localizador para el P75 = Q3 L = (75/100).12 = 9 (Se promedia el 9no y 10mo dato) Calcule el valor del P75 = Q3 P75 = (32 + 35)/2 = 33,5 INTERPRETACIÓN: El 75% de los valores son menores o iguales a 33,5, mientras que el 25% restante son mayores o iguales a 33,5 2.2. PERCENTIL PARA DATOS AGRUPADOS. Ejemplo: Se toman las pulsaciones de un equipo de atletas después de una competencia. Los datos obtenidos son: Pulsaciones N° de atletas Hallando 𝑃10 𝑦 𝑃90

70 - 75 75 - 80 3 3 Solución:

80 - 85 7

85 - 90 10

90 - 95 12

Completando la tabla: Li - Ls 70 – 75 75 – 80 80 – 85 85 – 90 90 - 95

ni 3 3 7 10 12 35

Ni 3 6 13 23 35

 Hallando P10: Si:

10𝑛 100

=

10(35) 100

= 3.5 ⟹ 𝑁𝑖 ≥ 3.5 ⟼ 𝑁𝑖 = 6

Considerando el intervalo: 75 – 80 Reemplazando en la fórmula: 𝑃10 = 𝐶10

3

6

10(35) −3 = 75 + ( 100 ) . 5 = 75.83 3

 Hallando P90: Si:

90𝑛 100

=

90(35) 100

= 31.5 ⟹ 𝑁𝑖 ≥ 31.5 ⟼ 𝑁𝑖 = 35

Considerando el intervalo: 90 – 95

12

35

93

Gestión Curricular Asignatura: Estadística general Reemplazando en la fórmula: 90(35) − 23 = 90 + ( 100 ) . 5 = 93.54 12

𝑃90 = 𝐶90

3. EQUIVALENCIA ENTRE EL CUARTIL – PERCETIL. a) Q1 = P25 25 %

Q

75 %

25%

75% P

1

25

b) Q2 = P50 = Mediana 50%

50% Q

50%

50% P

2

50%

50

50% M e

c) Q3 = P75

75%

25% Q

75%

25% P

3

75

4. RANGO INTERCUARTIL. Es una medida de dispersión estadística, la cual indica la distancia a la que se encuentra el 50% central de datos. Mediante esta medida se eliminan los valores extremadamente alejados. El rango intercuartílico es altamente recomendable cuando la medida de tendencia central utilizada es la mediana (ya que la mediana es insensible a posibles valores extremos)

R.I. = Q3 – Q1 50% central de los datos

Q

Q

1

25%

Q

2

25%

3

25%

25%

5. ANALISIS EXPLORATORIO DE DATOS. Es el proceso que consiste en utilizar herramientas estadísticas (como gráficas, medidas de tendencia central y medidas de variación) con la finalidad de investigar conjuntos de datos para comprender sus características importantes.

94

Gestión Curricular Asignatura: Estadística general VALORES EXTREMOS O DATOS DISTANTES: Se llama "valor extremo" o “dato distante” a aquel que está muy alejado de la mayor parte de los demás valores. Los valores extremos se deben considerar ya que pueden revelar información importante y afectar en gran medida el valor de la media y de la desviación estándar. Ejemplo: Datos 1:

9 – 10 – 13 – 14 – 17 – 56

Datos 2:

3 – 34 – 36 – 40 – 42 – 47

6. GRÁFICA DE CAJA Y VIGOTE. Una caja es un rectángulo que se construye sobre la base de los valores del primer cuartil, la mediana y el tercer cuartil. Permite comparar diversos conjuntos de datos simultáneamente respecto a simetría, variabilidad, centro, valores extremos y valores atípicos. 95% de los datos

Q

Muy lejanos (datos extremos)

Lejanos (datos atípicos)

1

Me

Cercanos

Q

Muy lejanos (datos extremos)

3

Cercanos

1,5RIQ

Lejanos (datos atípicos)

1,5RIQ RIC = Q3 – Q1

3RIQ

3RIQ

7. COEFICIENTE DE CURTOSIS. Curtosis es la deformación vertical de una curva de frecuencias. Se define como el grado de apuntamiento de la curva. 7.1. Clases de curtosis: a) Leptocurtica, se denomina así cuando la curva de apuntamiento es muy pronunciada.

b) Platicurtica, se denomina así cuando la curva de apuntamiento es muy achatada.

95

Gestión Curricular Asignatura: Estadística general c) Mesocurtica, se denomina así cuando la curva de apuntamiento está en el intermedio de las dos anteriores.

7.2. Coeficiente de curtosis percentílico (K): 𝑲= Donde:

𝑸𝟑 − 𝑸𝟏 𝟐(𝑷𝟗𝟎 − 𝑷𝟏𝟎 )

𝑄3 𝑦 𝑄1 : son cuartiles 𝑃90 𝑦 𝑃10 : son percentiles o centiles. Si: K=0

la curva de la distribución es mesocurtica

K>0

la curva de la distribución es leptocurtica

K