Trabajo Colaborativo Estadistica Inferencial

Trabajo Colaborativo Estadística Inferencial Tutor: Edwin Hernando Zapata Cifuentes Integrantes: Kevin David De Hoyos

Views 265 Downloads 2 File size 254KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Trabajo Colaborativo

Estadística Inferencial

Tutor: Edwin Hernando Zapata Cifuentes

Integrantes: Kevin David De Hoyos Gaviria Calos Alberto Pérez Silvas Wilfredo Ortega Conrado

POLITECNICO GRANCOLOMBIANO 2019

Objetivos



Aplicar adecuadamente las medidas de tendencia central.



Calcular acertadamente intervalos de confianzas.



Analizar e interpretar las diferentes técnicas de la estadística inferencial.



Elaborar gráficas de representación de la distribución de frecuencia.

DESCRIPCION DEL PROBLEMA El conjunto de datos en el archivo “black-friday” (Dagdoug, 2019) es una muestra de las transacciones realizadas en una tienda minorista. La tienda quiere conocer mejor el comportamiento de compra del cliente frente a diferentes productos. Específicamente, el problema que estamos tratando de predecir la variable dependiente (el monto de la compra) con la ayuda de la información contenida en las otras variables. Por lo anterior se sugiere que realice la siguiente: Utilizando la variable del valor de la compra (Purchase), realice lo siguiente:

DESARROLLOS DE LA ACTIVIDAD 1. Para realizar un histograma con una gran cantidad de datos, Excel nos ofrece una herramienta que nos facilita este proceso, la cual se llama ANÁLISIS DE DATOS, esta herramienta nos permite identificar las diferentes clases de datos que hay y con qué frecuencia estos se repiten; y así poder trabajar de una manera rápida y fácil en la creación de un histograma. PASOS: En la parte superior de Excel 1. clic en DATOS 2. ANÁLISIS DE DATOS 3. seleccionamos HISTOGRAMA 4. ACEPTAR 5. seleccionamos el RANGO DE ENTRADA, que en nuestro caso son todos los datos de la columna PURCHASE 6. seleccionamos EN UNA HOJA NUEVA, para que nos muestre los datos en otra hoja. 7. Aceptar; y en una nueva hoja de Excel, se verán reflejados todas las clases de datos que hay con su respectiva frecuencia de repetición. 8. luego hacemos clic en INSERTAR 9. seleccionamos el gráfico deseado.

2. Para calcular la media, mediana, moda, desviación estándar, coeficiente de variación, seguimos los mismos pasos que el ejercicio anterior, pero, en vez de seleccionar HISTOGRAMA, seleccionamos Resumen Estadístico. Columna1 Media Error típico Mediana Moda Desviación estándar Varianza de la muestra Curtosis Coeficiente de asimetría Rango Mínimo Máximo Suma Cuenta

9333.859853 6.793571207 8062 6855 4981.022133 24810581.49 -0.343121373 0.624279732 23776 185 23961 5017668378 537577

3. 3.1 Para calcular, cual es la categoría que más realiza compra en el black-Friday Primero se debe identificar cuantas categorías de edades existen en la base de datos BLACKFRIDAY; las cuales son 7 categorías, y con a formula =contar. Si, hallamos las edades que mas compran en el black-friday Categoría de edades

frecuencia

0-17

14,707

18-25

97,634

26-35

214,690

36-45

107,499

46-50

44,526

51-55

37,618

55+

20,903

3.2 Para calcular el promedio de la categoría que mas compra, utilizamos la función =promedio. Si 3.3 Para calcular la proporción de hombre y mujeres, utilizamos la función =contar. Si 3.4 Para calcular el gasto total tanto de hombre y mujeres utilizamos la función =suma. Si y para calcular el promedio la función =promedio. Si

4. 4.1 Para halla el tamaño de la muestra utilizamos la siguiente formula:

n=

𝑁∗𝑍 2 𝛼∗𝑃∗𝑄 𝑒 2 ∗ሺ𝑁−1ሻ+𝑍 2 𝛼∗𝑃∗𝑄

Donde:

n= N= Z= e= P= Q=

Tamaño de la muestra buscado Tamaño de la población Parámetro Estadístico (nivel de Confianza) Error de estimación máximo aceptado Probabilidad de que ocurra el evento 1-q probabilidad de que no ocurra el evento

RESULTADOS 1. Realice un histograma y explique la forma y la curtosis según el contexto.

HISTOGRAMA 6000 5000 4000 3000 2000 1000

185 866.1678035 1547.335607 2228.503411 2909.671214 3590.839018 4272.006821 4953.174625 5634.342428 6315.510232 6996.678035 7677.845839 8359.013643 9040.181446 9721.34925 10402.51705 11083.68486 11764.85266 12446.02046 13127.18827 13808.35607 14489.52387 15170.69168 15851.85948 16533.02729 17214.19509 17895.36289 18576.5307 19257.6985 19938.8663 20620.03411 21301.20191 21982.36971 22663.53752 23344.70532

0

Según su curtosis la distribución se llama platicúrtica y hay una menor concentración de datos en torno a la media. sería más achatada. 2. Calcular: la media, mediana, moda, desviación estándar, coeficiente de variación e interprete los resultados.



Media

9333.85

Interpretación: El promedio del valor de las compras en el BLACKFRIDAY es de 9.333,85 dólares. •

Mediana

8062

Interpretación: El 50% del valor de las compras en el BLACKFRIDAY es menor o igual a 8.062 dólares.



Moda

6855

Interpretación: El valor de las compras con más frecuencia es de 6.855 dólares. •

Desviación Estándar

4981.02

Interpretación: La desviación del valor de las compras en el BLACKFRIDAY con respecto a su media es de 4981,02 dólares en promedio. •

Coeficiente de variación

0.53365 (53.36%)

Los datos del valor de las compras tienen un alto porcentaje de variación del 53.36%.

3. CON RELACIÓN A LAS VARIABLES DADAS EN LA TABLA ANTERIOR, RESPONDA Y JUSTIFIQUE LOS RESULTADOS:

3.1 ¿Cuál es la categoría de edades que más realiza compras en el black-friday? La categoría que más realiza compra en un black-friday es de 26-35 años.

3.2 ¿Cuál es promedio de gatos de la categoría de la edad que más compra? El promedio de gastos de las personas con edades entre 26-35 años es de 9,315 dólares durante el black-friday.

3.3 ¿La proporción de hombres que compran es mayor que la de mujeres? Si, la proporción de hombre que compran es mayor que la de las mujeres. La cantidad de hombres que compran es de 405.380 (75%) y la cantidad de mujeres que compran es de 132.197 (25%).

3.4 ¿Cuánto es el promedio de gasto de los hombres y las mujeres? Los gastos totales de los hombres son: 3,853,044,357.00 dólares, en promedio ellos se están gastando 9,504.77 dólares. Los gastos totales de las mujeres son: 1,164,624,021.00 dólares, en promedios ellas se están gastando 8,809.76 dólares.

4. INTERVALOS DE CONFIANZA

4.1 ¿Cuál es el tamaño de la muestra que se requiere? Si se exige un error al calcular la media del 2% y un nivel de confianza del 95% El tamaño de la muestra requerida es de 2390.32 personas.

4.2 Asumiendo que los datos son normales, calcule un Intervalo de confianza al 95% para la diferencia de los gastos para los hombres y mujeres e interprete el resultado obtenido. El intervalo da como resultado (18063.783