Consolidado Trabajo Colaborativo

TRABAJO COLABORATIVO ESTADISTICA INFERENCIAL SUBGRUPO 19 Astrid Tatiana Vergara Daza Ana Lucia Botía Prieto Adriana Mi

Views 117 Downloads 1 File size 731KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

TRABAJO COLABORATIVO ESTADISTICA INFERENCIAL

SUBGRUPO 19

Astrid Tatiana Vergara Daza Ana Lucia Botía Prieto Adriana Milena Peña Parra Jorge Daniel Martínez Manjarrez Yesica Alejandra Pérez Ruíz

COD. COD. COD. COD. COD.

1820650104 1821980271 1821980262 1821980427 1811980183

Tutor Manuel Alvarado Martínez

Institución Universitaria Politécnico Gran Colombiano Modalidad Virtual Ingeniería Industrial 2019

1

TABLA DE CONTENIDO

1. INTRODUCCION………………………………………………………………3 2. OBJETIVO GENERAL………………………………………………………...3 2.1. OBJETIVOS ESPECIFICOS……………………………………………..3 3. DESARROLLO DEL PROYECTO…………………………………………...4 4. INTERVALOS DE CONFIANZA………………………….. 5. CONLUSIONES…………………………………………… 6. CIBERGRAFIA…………………………………………….

2

INTRODUCCIÓN

La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de datos importantes para el estudio de situaciones que se presentan a diario y permite dar respuesta a los problemas de una forma útil y significativa, se centra en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.

3

OBJETIVO GENERAL 

Desarrollar a totalidad los ejercicios propuestos mediante el análisis de datos suministrados Black Friday mediante los conocimientos obtenidos de la materia estadística inferencial.



Analizar y comprender todos los conceptos relacionados con la estadística inferencial a través del desarrollo de la actividad Black-Friday.

OBJETIVOS ESPECIFICOS



Resolver

estadísticamente

variables

y promedios

a

través

del

comportamiento de la población 

Desarrollar e identificar los parámetros mediante el uso de intervalos de confianza.



Aplicar y comprender los términos relacionados a estadística descriptiva e inferencial.

4

1. DESARROLLO DEL TRABAJO Descripción El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información contenida en las otras variables.

Las variables del archivo adjunto son las siguientes:

User_ID

Identificador único del comprador

Product_ID

Identificador único del producto.

Gender

Sexo del comprador

Age

Edad del comprador dividida en contenedores

Occupation

Ocupación del comprador.

City_Category

Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual. Marital_Status

Estado civil del comprador

Product_Category_1

Categoría de producto de compra

Product_Category_2

El producto puede pertenecer a otra categoría

Product_Category_3

El producto puede pertenecer a otra categoría

5

Purchase

Valor de la compra en dólares

Por lo anterior se sugiere que realice la siguiente:

Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

1.1.

Realice un histograma y explique la forma y la curtosis según el contexto.

De acuerdo a la base de datos y tomando únicamente los datos de compras (purchase) comportamiento que queremos analizar, se obtiene el siguiente histograma.

Se realiza tabla de frecuencias y en base a ella obtenemos los datos estadísticos:

6

Al ver la forma del gráfico puede determinarse que la distribución de los datos es normal. El resultado obtenido de la curtosis es >que 0 pero como no es tan alejado a 0. Puede decirse que es ligeramente Leptocúrtica.

2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.

Media: es el promedio de la sumatoria de los valores purchase dados en el archivo dividido entre la población total.

Desviación estándar: Es un conjunto de datos (precios en el caso del mercado de valores) es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al promedio (media). Respuesta: 334147,36

Coeficiente de variación: Es la relación entre la desviación típica de una muestra y su media. 7

Respuesta: 2,588

En relación a las variables dadas en la tabla anterior, responda y justifique los resultados: Se observa que la media es la suma de datos dividido el número de datos, por otra parte, el dato que más se repite en este se denomina moda. La medida de dispersión o desviación estándar en este caso nos indica que tan dispersos están los datos con respecto a la media o promedio.

3.1. ¿Cuál es la categoría de edades que más realiza compras en el friday?

8

black-

En la imagen anterior podemos observar que el rango de edad que más compras realiza es de 26-35.

3.2¿Cuál es promedio de gatos de la categoría de la edad que más compra?

9

La categoría de 51 a 55 años es la que tiene el promedio de gasto más elevado con 9620,61 Euros por compra. seguido de la categoría 55+, con un promedio de gasto de 9453,89 Euros.

3.3 ¿La proporción de hombres que compran es mayor que la de las mujeres?

GENERO

VALOR DE COMPRA

HOMBRES

405380

MUJERES

132197

TOTAL USUARIOS

537577

La proporción de hombres que compran si es mayor que el de las mujeres, la cantidad de hombres son 405.380 y las mujeres son 132.197.

10

3.4. ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

Del total de gastos 5.017.668.378; los hombres gastan 3853044357 que equivale al 76.78% y las mujeres gastan 1.164.624.021 que equivale al 23;22%

11

4.INTERVALOS DE CONFIANZA

4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error relativo del 2% y un nivel de confianza del 95% 𝑵 ∗ 𝒛𝟐 ∗ 𝒑 ∗ 𝒒 𝒏 = 𝟐∗(𝑵−𝟏)+ 𝟐 𝒆 𝒛 ∗𝒑∗𝒒

El tamaño de la muestra con un error relativo del 2% y un nivel de confianza de 95% es de 2390 datos.

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.

12

Con un intervalo de confianza del 95%, la diferencia de gastos promedio entre los hombre y mujeres, esta entre 665.2 dólares y 724.8 dólares. Como es un resultado positivo nos damos cuenta que los hombres gastaron mucha más que las mujeres.

13

CONCLUSIONES



Podemos concluir que a partir del estudio de la estadística inferencial y descriptiva podemos analizar variables que afectan a grupos de poblaciones estudiadas obteniendo así, información relevante con respecto a sus comportamientos en diferentes escenarios y fenómenos.



La estadística nos ayuda a obtener e interpretar información clara a partir de datos, con dicha información se puede tomar decisiones.

14

2. CIBERGRAFIA 

Carla Caraballo ‘’Introducción a la estadística inferencial‘’ (consultado el 29 de septiembre de 2019) Disponible en:http://estadisticaiiiuba.blogspot.com/p/blog-page_8525.html.

 

https://www.netquest.com/blog/es/blog/es/muestreo-que-es-porque-funciona

15

16