TRABAJO COLABORATIVO ESTADISTICA INFERENCIAL SUBGRUPO 19 Astrid Tatiana Vergara Daza Ana Lucia Botía Prieto Adriana Mi
Views 117 Downloads 1 File size 731KB
TRABAJO COLABORATIVO ESTADISTICA INFERENCIAL
SUBGRUPO 19
Astrid Tatiana Vergara Daza Ana Lucia Botía Prieto Adriana Milena Peña Parra Jorge Daniel Martínez Manjarrez Yesica Alejandra Pérez Ruíz
COD. COD. COD. COD. COD.
1820650104 1821980271 1821980262 1821980427 1811980183
Tutor Manuel Alvarado Martínez
Institución Universitaria Politécnico Gran Colombiano Modalidad Virtual Ingeniería Industrial 2019
1
TABLA DE CONTENIDO
1. INTRODUCCION………………………………………………………………3 2. OBJETIVO GENERAL………………………………………………………...3 2.1. OBJETIVOS ESPECIFICOS……………………………………………..3 3. DESARROLLO DEL PROYECTO…………………………………………...4 4. INTERVALOS DE CONFIANZA………………………….. 5. CONLUSIONES…………………………………………… 6. CIBERGRAFIA…………………………………………….
2
INTRODUCCIÓN
La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de datos importantes para el estudio de situaciones que se presentan a diario y permite dar respuesta a los problemas de una forma útil y significativa, se centra en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.
3
OBJETIVO GENERAL
Desarrollar a totalidad los ejercicios propuestos mediante el análisis de datos suministrados Black Friday mediante los conocimientos obtenidos de la materia estadística inferencial.
Analizar y comprender todos los conceptos relacionados con la estadística inferencial a través del desarrollo de la actividad Black-Friday.
OBJETIVOS ESPECIFICOS
Resolver
estadísticamente
variables
y promedios
a
través
del
comportamiento de la población
Desarrollar e identificar los parámetros mediante el uso de intervalos de confianza.
Aplicar y comprender los términos relacionados a estadística descriptiva e inferencial.
4
1. DESARROLLO DEL TRABAJO Descripción El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información contenida en las otras variables.
Las variables del archivo adjunto son las siguientes:
User_ID
Identificador único del comprador
Product_ID
Identificador único del producto.
Gender
Sexo del comprador
Age
Edad del comprador dividida en contenedores
Occupation
Ocupación del comprador.
City_Category
Lugar de residencia del comprador.
Stay_In_Current_City_Years Número de años en la ciudad actual. Marital_Status
Estado civil del comprador
Product_Category_1
Categoría de producto de compra
Product_Category_2
El producto puede pertenecer a otra categoría
Product_Category_3
El producto puede pertenecer a otra categoría
5
Purchase
Valor de la compra en dólares
Por lo anterior se sugiere que realice la siguiente:
Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:
1.1.
Realice un histograma y explique la forma y la curtosis según el contexto.
De acuerdo a la base de datos y tomando únicamente los datos de compras (purchase) comportamiento que queremos analizar, se obtiene el siguiente histograma.
Se realiza tabla de frecuencias y en base a ella obtenemos los datos estadísticos:
6
Al ver la forma del gráfico puede determinarse que la distribución de los datos es normal. El resultado obtenido de la curtosis es >que 0 pero como no es tan alejado a 0. Puede decirse que es ligeramente Leptocúrtica.
2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.
Media: es el promedio de la sumatoria de los valores purchase dados en el archivo dividido entre la población total.
Desviación estándar: Es un conjunto de datos (precios en el caso del mercado de valores) es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al promedio (media). Respuesta: 334147,36
Coeficiente de variación: Es la relación entre la desviación típica de una muestra y su media. 7
Respuesta: 2,588
En relación a las variables dadas en la tabla anterior, responda y justifique los resultados: Se observa que la media es la suma de datos dividido el número de datos, por otra parte, el dato que más se repite en este se denomina moda. La medida de dispersión o desviación estándar en este caso nos indica que tan dispersos están los datos con respecto a la media o promedio.
3.1. ¿Cuál es la categoría de edades que más realiza compras en el friday?
8
black-
En la imagen anterior podemos observar que el rango de edad que más compras realiza es de 26-35.
3.2¿Cuál es promedio de gatos de la categoría de la edad que más compra?
9
La categoría de 51 a 55 años es la que tiene el promedio de gasto más elevado con 9620,61 Euros por compra. seguido de la categoría 55+, con un promedio de gasto de 9453,89 Euros.
3.3 ¿La proporción de hombres que compran es mayor que la de las mujeres?
GENERO
VALOR DE COMPRA
HOMBRES
405380
MUJERES
132197
TOTAL USUARIOS
537577
La proporción de hombres que compran si es mayor que el de las mujeres, la cantidad de hombres son 405.380 y las mujeres son 132.197.
10
3.4. ¿Cuánto es el promedio de gasto de los hombres y las mujeres?
Del total de gastos 5.017.668.378; los hombres gastan 3853044357 que equivale al 76.78% y las mujeres gastan 1.164.624.021 que equivale al 23;22%
11
4.INTERVALOS DE CONFIANZA
4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error relativo del 2% y un nivel de confianza del 95% 𝑵 ∗ 𝒛𝟐 ∗ 𝒑 ∗ 𝒒 𝒏 = 𝟐∗(𝑵−𝟏)+ 𝟐 𝒆 𝒛 ∗𝒑∗𝒒
El tamaño de la muestra con un error relativo del 2% y un nivel de confianza de 95% es de 2390 datos.
4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.
12
Con un intervalo de confianza del 95%, la diferencia de gastos promedio entre los hombre y mujeres, esta entre 665.2 dólares y 724.8 dólares. Como es un resultado positivo nos damos cuenta que los hombres gastaron mucha más que las mujeres.
13
CONCLUSIONES
Podemos concluir que a partir del estudio de la estadística inferencial y descriptiva podemos analizar variables que afectan a grupos de poblaciones estudiadas obteniendo así, información relevante con respecto a sus comportamientos en diferentes escenarios y fenómenos.
La estadística nos ayuda a obtener e interpretar información clara a partir de datos, con dicha información se puede tomar decisiones.
14
2. CIBERGRAFIA
Carla Caraballo ‘’Introducción a la estadística inferencial‘’ (consultado el 29 de septiembre de 2019) Disponible en:http://estadisticaiiiuba.blogspot.com/p/blog-page_8525.html.
https://www.netquest.com/blog/es/blog/es/muestreo-que-es-porque-funciona
15
16