Consolidado Trabajo Colaborativo

CONSOLIDADO TRABAJO COLABORATIVO Manuel Alvarado Martínez Tutor Institución Universitaria Politécnico Gran Colombiano

Views 335 Downloads 1 File size 277KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

CONSOLIDADO TRABAJO COLABORATIVO

Manuel Alvarado Martínez Tutor

Institución Universitaria Politécnico Gran Colombiano Estadística Inferencial - Grupo – Subgrupo 19 Modalidad Virtual Ingeniería Industrial

1

2019

2

TABLA DE CONTENIDO

3

INTRODUCCIÓN

La Estadística es una ciencia formal que estudia la recolección, análisis e interpretación de datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo, la estadística es más que eso, es decir, es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica. La Estadística Inferencial puede dar respuesta a muchas de las necesidades que la sociedad actual puede requerir. Su tarea fundamental es el análisis de los datos que se obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla. Permite la recolección de datos importantes para el estudio de situaciones que se presentan a diario y permite dar respuesta a los problemas de una forma útil y significativa, se centra en tomar una pequeña muestra representativa de la población y a partir de ésta, infiere que el resto de la población tiene el mismo comportamiento.

Objetivo General Desarrollar los ejercicios referente a la base de datos Black Friday y de esta manera aplicar los diferentes conceptos de la estadística inferencial. Objetivos específicos

4

DESARROLLO DEL TRABAJO

A continuación se consolidan los ejercicios realizados durante el transcurso del desarrollo del foro: Descripción El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información contenida en las otras variables. Las variables del archivo adjunto son las siguientes: User_ID

Identificador único del comprador

Product_ID

Identificador único del producto.

Gender

Sexo del comprador

Age

Edad del comprador dividida en contenedores

Occupation

Ocupación del comprador.

City_Category

Lugar de residencia del comprador.

Stay_In_Current_City_Years Número de años en la ciudad actual. Marital_Status

Estado civil del comprador

Product_Category_1

Categoría de producto de compra

Product_Category_2

El producto puede pertenecer a otra categoría

Product_Category_3

El producto puede pertenecer a otra categoría

Purchase

Valor de la compra en dólares

Por lo anterior se sugiere que realice la siguiente: Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

5

1. Realice un histograma y explique la forma y la curtosis según el contexto.

6

2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.

Desviación estándar: Es un conjunto de datos (precios en el caso del mercado de valores) es una medida de dispersión, que nos indica cuánto pueden alejarse los valores respecto al promedio (media). Respuesta: 334147,36 Coeficiente variación: Es la relación entre la desviación típica de una muestra y su media.

Respuesta: 2,588

7

3. En relación a las variables dadas en la tabla anterior, responda y justifique los resultados: 3.1 ¿Cuál es la categoría de edades que más realiza compras en el blackfriday? EDADES 0-17 18-25 26-35 36-45 46-50 51-55 55+

COMPRAS 14.707 97.634 21.466 107.477 4.452 37.618 20.902

En la imagen anterior podemos observar que las edades de 36-45 es donde se realizan mayor compra del Black Friday, seguido de las edades de 18-25.

8

3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra?

9

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres?

10

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres?

11

4. Intervalos de confianza 4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error relativo del 2% y un nivel de confianza del 95% Vamos a realizar una expresión cuadrática:

√ P (1− p) ≤ 2% Z*x n Procedemos a buscar en la tabla Z el porcentaje que tenga una cola del 2.5%, en donde se3 ubica la Z correspondiente al 97.5%. En general es importante mencionar que para un nivel de confianza del 95% el valor correspondiente es de:

^ + P-

1.96 = Referencia tabla Z ^ + P-

Z* x

√ P (1− p) n

≤ 2%

Vamos a elegir una proporción muestral entonces elegimos un valor que maximice la expresión: ^

P = 0.5 Valor crítico: 1.96

1.96 x

x

√ 0.5(0.5)

≤ 2%

n

0.5 n

1.96

Podemos concluir que la muestra mínima es 2401 para obtener un margen de error del 2%. Como resultado final nos dio un número entero.

12

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido.

13

14

15

CONCLUSIONES

Se solucionaron cada uno de los ejercicios propuestos en el foro, mediante la aplicación de las diferentes funciones de la estadística inferencial obteniendo resultados racionales.

16

BIBLIOGRAFIA 1. Carla Caraballo ‘’Introducción a la estadística inferencial‘’ (consultado el 29 de septiembre de 2019) Disponible en:http://estadisticaiiiuba.blogspot.com/p/blog-page_8525.html.

17

18