Universidad Nacional Santiago Antunez De Mayolo: Estadistica General

UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO ESTADISTICA GENERAL Mag. Dennis Gabriela Alvaron Robles PROBABILIDAD

Views 60 Downloads 0 File size 2MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD NACIONAL SANTIAGO ANTUNEZ DE MAYOLO

ESTADISTICA GENERAL

Mag. Dennis Gabriela Alvaron Robles

PROBABILIDAD Y ESTADISTICA SESIÓN N° 01

ESTADISTICA DESCRIPTIVA ➢

DEFINICIÓN,



RECOPILACIÓN Y TABULACIÓN DE DATOS



DISTRIBUCIÓN DE FRECUENCIAS



GRAFICOS ESTADÍSTICOS



MEDIDAS DE TENDENCIA CENTRAL

LOGRO: El estudiante define Conceptos fundamentales, elabora cuadros de Distribución de frecuencias, construye gráficosestadísticos, analiza las medidas estadísticas.

La Estadística: Definición, recopilación y tabulación de datos, distribución de frecuencias, gráficos estadísticos, medidas de tendencia central (Media, Mediana y Moda), medidas de dispersión (Varianza, Desviación Estándar y Coeficiente de Variación).

Caso N° 01

ESTADÍSTICA DESCRIPTIVA

El crecimiento económico en nuestro país en los últimos años, han evidenciado un creciente desarrollo en el rubro de la Construcción, situación que se puede apreciar en el medio, pues hoy en día existe una creciente oferta de casas, departamentos, dúplex, etc, en diferentes zonas urbanas. Este hecho ha propiciado que el estado norme sobre las medidas de seguridad que deben ofrecer las empresas dedicadas a la actividad, a sus diferentes trabajadores. La Empresa Liberteña “Constructora FM” dedicada exclusivamente a la edificación de Torres Habitacionales, ha sido comunicada acerca del cumplimiento de los estándares de seguridad que debe cumplir respecto a la integridad de los trabajadores y como es sabido, las edificaciones en nuestro medio permiten a los trabajadores a desplazarse en diferentes niveles y muchas veces lo hacen sobre rampas de madera y adicionalmente muchas veces deben transportar cargas y/o herramientas, es por ello que se desea determinar cómo varían los pesos en kilogramos de las trabajadores con la finalidad de reforzar o replantear dichas rampas, para ello se ha tomado una muestra de 50 trabajadores al azar sin tener en cuenta el rango operativo de función a fin de obtener sus pesos. Los datos obtenidos fueron los siguientes: 65 64 84 63 64

63 65 85 65 64

65 74 64 63 83

63 72 71 70 69

69 68 68 67 67

67 77 66 76 66

83 85 86 87 88

88 87 89 79 60

60 70 61 71 61

61 68 72 62 62

ESTADÍSTICA

Es la Ciencia que trata de la recopilación, organización, presentación, análisis e interpretación de datos numéricos, con el fin de realizar una toma de decisiones más efectivas. Sirve para la toma de decisiones en situaciones de incertidumbre, y por ello, constituye la metodología científica que permite transformar datos en información.

DIVISIÓN DE LA ESTADÍSTICA

Estadística Deductiv a Estadística descriptiva

Métodos para organizar, resumir y presentar datos de manera informativa. Se restringe a describir los datos que se analizan. Ejemplo: la edad de los trabajadores de una empresa, el número de hijos de los trabajadores de la unidad de contabilidad de la empresa XYZ, etc.

Inductiv a Estadística Inferencial

Métodos empleados para determinar “algo” acerca de una población, con base en una muestra. Ejemplo: Verificar la exactitud de todas las facturas de la compañía, pronosticar las ventas de un producto de consumo masivo, etc.

POBLACIÓN: Conjunto de individuosu objetos de interés o se obtienen partir de todos los datos que medidas aque intervienen en una investigación. Al número de elementos de una población se denota por N.

MUESTRA Porción o parte de la población de interés. Al numero de elementos de una muestra se denota por “n”. El individuo u objeto es la Unidad de Estudio. Una muestra tienen 2 principales: características ▪ Representativa. ▪ Adecuada

DEFINICIONES Unidad de estudio: •

• •

Es la persona, animal o cosa de quien se dice algo. Es quien nos va a dar la información. Es el objeto o elemento indivisible que será estudiado.

Población: •



Es el conjunto de todas las unidades de estudio que cumplen con cierta características s (criterios de de interé inclusión). s Clasificación: Extensión – Naturaleza

Muestra: Es un subconjunto de la población en estudio. • Una muestra tiene 2 características principales: a. Representativa. b. Adecuada. •

¿Qué me interesa saber de la unidad de estudio? • Ingreso mensual Client e

Unidades de estudio

Empres a

• • • • •

Edad Número de hijos Color de preferencia Gasto familiar Número de veces que va al cine

• • • •

Ventas Ganancias Gasto en publicidad Número de trabajadores Número de computadoras CARACTERÍSTIC



AS

VARIABL ES

POBLACIÓN

Medidas Estadísticas

PARÁMETRO:

ESTADISTICO (ESTIMADOR):

Es una cantidad numérica calculada sobre una población y resume los valores que esta toma en algún atributo o variable. • • • •

✓ ✓ ✓ ✓

MUESTRA

Media poblacional (μ) Desviación Estándar poblacional (σ) Varianza poblacional (σ2) Proporción poblacional (P) EJEMPLOS: Edad promedio de jefes hogar de todo el país. Tasa de desempleo en la Prov. de Trujillo. Promedio de hijos por mujer en Huanchaco El % de personas con SIDA

Es una cantidad numérica calculada sobre la muestra que resume su información sobre algún aspecto. Se usa para aproximar un parámetro. • • • •

Media Muestral ( 𝑥 ) Desviación Estándar (S) Varianza (S2) Proporción (p) EJEMPLOS: Con base en una muestra de 877 ejecutivos encuestados, se encontró que el 45% de ellos no contrataría a alguien con un error ortográfico en su solicitud de empleo.

PRESENTACIÓN DE LA INFORMACIÓN •

En la estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad de análisis y cálculos se organizan o se presentan en Cuadros de Distribución de Frecuencias y Gráficos Estadísticos, de modo que podamos distinguir patrones y llegar a conclusiones lógicas.



Cuando los datos se ordenan de manera compacta y útil, los responsables de tomar decisiones pueden obtener información confiable sobre el entorno y usarla para tomar decisiones inteligentes.



Para realizar este análisis se tienen que tener en cuenta el tipo de variable que se esta evaluando.

PRESENTACIÓN ORDENADA DE DATOS

3 0 20

1 9

2 1

Hombr e

Mujer

10 0

Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra o población.

DISTRIBUCIÓN DE FRECUENCIAS. Una distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Variables Cualitativ as

Variables Cuantitativ as

Estas observaciones deben de arreglarse u ordenarse de ser el caso. Pasos a Seguir: Colocar las características de la variable a analizar: Si es Var. Cualitativa Nominal, se escriben en el criterio personal. Si es Var. Cualitativa Ordinal, se escriben en orden ascendente o descendente. Los intervalos seráncomo tantas características se determinen de la variable.

Estas observaciones deben de arreglarse u ordenarse desde el menor valor hasta el mayor o viceversa. Pasos a Seguir: Determinación del recorrido o rango “R”. R=Vmax - Vmin Determinación del número de intervalos “k” , Donde: a) Si n >= a 30 : k=1+3.322 log n b) Si n < 30 : k= n Determinación de la amplitud de cada intervalo “A”, donde A = R / k (Inmediato superior) Determinación de los intervalos y construcción del cuadro estadístico

Frecuencia absoluta (fi) Es el número de veces que aparece repetido cada valor de la variable (categoría). La suma de las frecuencias absolutas es igual al número total de datos, que se representa por “N” ó “n” Frecuencia relativa (hi) Es el cociente ni/N; siendo N el total de las observaciones. Este cociente indica la proporción que representan los datos de una categoría o clase determinada, en relación al total de los datos (N). Frecuencia absoluta acumulada (Fi) Se obtiene sumando las frecuencia absolutas precedentes a cada clase o categoría. Frecuencia relativa acumulada (Hi) Es el cociente Ni/N; representa la proporción de datos ubicados en el extremo interior de la distribución y un valor superior. Clase o Categoría (Xi) Representan los valores diferentes de la variable, dentro de las observaciones.

Frecuencia Absoluta

Simple

Simple Acumulada

Xi o Yi Valores que asume la variable

Total

fi

∑fi= n

Frecuencia Relativa

FI

hi=fi/n

∑hi=1.00

Acumulada

Hi

hi% =hi*100

∑%=100

% Acum

PARTES DE UN CUADRO DE DISTRIBUCIÓN DE FRECUENCIAS. 1. Título

2. Encabezado

Xi o Yi Valores que asume la variable

fi

FI

hi=fi/n

Hi

hi% =hi*100

3. # de Intervalo s

4. Cuerpo

Total

5.

Fuente

6.

Elaboració n

% Acum

∑fi= n

∑hi=1.00

∑%=100

GRÁFICOS ESTADÍSTICOS • •

Una forma de visualizar la información entregada en tablas es mediante gráficos. Estos gráficos nos ayudan a ver rápidamente ciertas tendencias que se pueden estar dando en la tabla, pero que, al estar agrupadas en solo números, no nos es tan fácil ver.

Gráficos Más Usados • •

Diagrama de barras: Se utiliza habitualmente para variables cuantitativas discretas. Histograma: Se utiliza para cuantitativas continuas. variables



Polígonos frecuencias: Se utiliza en mismos casos que el histograma. de los



Diagrama de sectores: Se puede utilizar para todo tipo de variable, pero se usa habitualmente para las variables cualitativas.

Medidas de Tendencia Central • Este tipo de medidas nos permiten identificar y ubicar el punto (valor) alrededor del cual se tienden ha reunir o agrupar los datos (“Punto central”). Entre las medidas más usuales tenemos a las Medidas de Tendencia central: •

La Media Aritmética



La Mediana



La Moda

NOTA: en las poblaciones se denominan parámetros y en las muestras se les denomina estimadores o estadísticos.

LA MEDIA ARITMÉTICA •

Es la suma de todos los valores observados, dividido por el número total de observaciones para obtener un promedio.



Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos.



Solo es aplicable para el tratamiento de datos cuantitativos.

LA MEDIANA •

Con esta medida podemos identificar el valor que se encuentra en el centro de los datos, después que los elementos han sido ordenados.

• •

Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales..

LA MODA •

La medida modal nos indica el valor que más veces se repite dentro de los datos.



Indica el valor que más se repite, o la clase que posee mayor frecuencia.



En algunos casos pueden presentarse dos valores que se repiten en igualdad de veces, por lo tanto puede ser bimodal o multimodal.

FORMULAS PARA MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS (Solo aplica para variables cuantitativas) Media:

𝑥=

Mediana:

Moda:

Σ𝑋𝑓𝑖 𝑛

Para la obtención de la Media, primeramente hallamos el punto medio de cada intervalo (marca de clase) y luego por multiplicamos cada

fi.

𝑀𝑒 = 𝐿𝑖 +

2

𝑛

−𝐹

𝑖−1

𝑓𝑖(𝐴)

Para ubicar el intervalo a usar en la obtención de la Mediana nos fijamos primeramente en la columna de las Frecuencias Absolutas Acumuladas(Fi) y ubicamos cual es la

Fi que

contiene al 50% de los datos.

𝑀𝑜 = 𝐿𝑖 +

(𝑓𝑖 − 𝑓 𝑖−1) 𝑓𝑖 − 𝑓 𝑖−1 + (𝑓 𝑖 − 𝑓 𝑖+1

) (𝐴)

Para ubicar el intervalo a usar en la obtención de la Moda nos fijamos primeramente en la columna de las Frecuencias Absolutas Simple ( fi) y luego ubicamos cual es la mayor valor.

f

que tiene el

EJEMPLO Se tomó al azar la edad de 12 estudiantes de la carrera de Ingeniería Civil: 26, 35, 28, 33, 32, 25, 29, 42, 32, 30, 28, 28 Hallar las Medidas de Tendencia Central. Solución: Se recomienda ordenar los datos en forma ascendente o descendente N° de Datos

Valores Tomados

Valores Ordenados

1

26

25

2

35

26

3

28

28

4

33

28

5

32

28

6

25

29

7

29

30

8

34

32

9

32

32

10

30

33

11

28

34

12

28

35

2° Mediana:

1° Media Aritmética: -

Sumar las cantidades. Dividir la suma por el número de datos. N° de Datos 1 2 3 4 5 6 7 8 9 10 11 12

𝑋=

Valores Ordenados 25 26 28 28 28 29 30 32 32 33 34 35 Suma 360 360 : = 30

12

-

Se halla (n+1) / 2. Esa ubicación ubica al 50 %. N° de Valores Datos Ordenados 1 25 2 26 50 % 3 28 4 28 5 28 6 29 7 30 50 8 32 % 9 32 10 33 11 34 12 35 entre La mediana esta el 6° y 7° valor. Se debe hallar el promedio. Med. = (29+30)/2 Med. = 29.5

3° Moda: - Se identifica cual es el valor de los datos que más veces se repite. N° de Valores Datos Ordenados 1 25 2 26 3 28 4 28 5 28 6 29 7 30 8 32 9 32 10 33 11 34 12 35 Por lo tanto el valor modal: Mo= 28 Puede darse el caso que pueda existir más de 1 valor modal.

NOTA: este ejercicio se aplicó con datos No Agrupados.

3 vece s

Representación Gráfica

GRACIAS POR SU ATENCIÓN

Mag. Dennis Gabriela Alvaron Robles [email protected]