FACULTAD DE INGENIERÍA ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS TRABAJO DE INVESTIGACIÓN “Creación de D
Views 131 Downloads 0 File size 1MB
FACULTAD DE INGENIERÍA
ESCUELA ACADÉMICO PROFESIONAL DE INGENIERÍA DE SISTEMAS
TRABAJO DE INVESTIGACIÓN “Creación de Datamart en el área de Ventas en la empresa Grupo San Nicolás”
Autores Casas Mendoza, Frank Daniel Huamanteca Damian, Henry Frank Montalvo Celis, James Stiven Romero Falcón, Cesar Augusto Gómez Sánchez Gonzales, Jair Velasco Santiago, Franco Joel
Asesor Ordoñez Pérez, Adilio Christian
LIMA – PERÚ 2016 – II
INTRODUCCION El trabajo a desarrollar está enfocado en el departamento de ventas de la empresa Grupo San Nicolás S.A.C., entre sus funciones evalúa a los cliente, sus pedidos, a su vez realizar el seguimiento de los productos que solicitan y como cumplir con las expectativas de gerencia.
Se busca la “Creación de un Datamart en el área de ventas en la empresa Grupo San Nicolás S.A.C.”, alineado a sus objetivos estratégicos y que ayude como fuente de información consistente única, uniforme, confiable y por consiguiente brindar oportunamente la información necesaria para el apoyo a la toma de decisiones. Para esto primero se debe saber cuál es la situación actual de los procesos de la empresa, cuales son los problemas que se generan y si estos están alineados con los objetivos de la organización.
El presente informe se desarrollará en tres capítulos: el primer capítulo presenta los aspectos de la organización, tales como la visión, la misión, objetivos, descripción e identificación de sus principales macro procesos y áreas de la empresa mencionada. El segundo capítulo se hace referencia hacia los aspectos del negocio, por ello se realizará el análisis correspondiente de los principales procesos del área de estudio del negocio, identificando el proceso crítico en la toma de decisiones en el área de ventas; por los cual se realizarán encuestas, cuestionarios, entrevista y la presentación de documentos necesarios para el análisis adecuado de la empresa. En el tercer capítulo se abordará el diseño metodológico de la investigación; para ello se utilizará la metodología Hefesto, que será estructurado con el análisis de requerimiento, análisis OLTP, modelo lógico del Datamart, integración de datos y diseño de interfaces y reportes, con los cual se desarrollará cada ítem mencionado.
Finalmente se presentan las conclusiones y recomendaciones como resultado de investigación, así como la bibliografía consultada y algunos anexos que se consideraron de vital importancia.
2
ÍNDICE Pág. Introducción
2 CAPÍTULO I ASPECTOS DE LA ORGANIZACIÓN
1.1. Visión 1.2. Misión 1.3. Objetivos 1.4. Antecedentes 1.5. Organigrama 1.6. Ámbito del proyecto 1.6.1. Área 1.6.2. Recursos humanos 1.6.3. Software 1.6.4. Hardware 1.6.5. Cronograma de actividades
6 6 6 6 7 8 8 8 8 9 10
CAPITULO II ASPECTOS DEL NEGOCIO 2.1. Descripción de funciones y procesos del negocio 2.1.1. Problemática actual o análisis situacional 2.1.2. Catálogo de reglas del negocio 2.2. Documentación utilizada
12 12 12 13
2.2.1. Encuestas
13
2.2.2. Cuestionarios
13
2.2.3. Revisión documentaria
14
3
CAPITULO III METODOLOGÍA 3.1. Análisis de requerimientos
18
a) Identificar preguntas b) Identificar indicadores y perspectivas de análisis c) Modelo conceptual 3.2. Análisis OLTP a) b) c) d)
19
Conformación de indicadores Relaciones identificadas Nivel de granularidad Modelo conceptual ampliado
20 20 23 24
3.3. Modelo lógico del Datamart a) b) c) d)
18 18 19
25
Tipo de modelo lógico del Datamart Tablas de dimensiones Tabla de hechos Uniones
25 25 27 28
3.4. Integración de Datos
30
a) Carga de datos b) Actualización
30 31
3.5. Diseño de interfaces y reportes CONCLUSIONES Y RECOMENDACIONES ANEXOS FUENTES DE INFORMACIÓN
4
CAPÍTULO I ASPECTOS DE LA ORGANIZACIÓN
1.1.Visión Según la empresa del Grupo San Nicolás, su visión es consolidar un servicio de alta calidad y renombre internacional, expandiendo la marca “Cómprale al Perú, calidad y servicio Premium”.
5
1.2.Misión Grupo San Nicolás, tiene como misión ser la empresa peruana más importante en la exportación de Capsicum, Granos Andinos en el mundo. Alcanzar el reconocimiento de los mercados internacionales, brindar sostenibilidad laboral, económica a toda nuestra cadena de colaboradores y equipo humano por muchos años. 1.3.Objetivo El objetivo de la empresa Grupo San Nicolás S.A.C. como empresa exportadora es lograr el posicionamiento no solo en el mercado nacional, sino en el mercado internacional, siendo una empresa peruana reconocida a nivel mundial. 1.4.Antecedentes La empresa Grupo San Nicolás S.A.C. con un tiempo de 6 años de creación y administrado por el Gerente General, Sr. Wilfredo Padilla Barrenechea, es una de las empresas peruanas que se ubica en los primeros puestos del Ranking de empresas exportadoras. Somos una empresa peruana exportadora de Capsicum, Granos y Especias peruanas. Contamos con la diversificación de campos de producción propia, articulación de cadenas productivas y con más de 15 centros de acopio estratégicamente instalados para el abastecimiento constante de nuestros productos de exportación los cuales son cultivados en toda la Costa y Sierra peruana. Hoy con más de 12 años de experiencia exportadora, la empresa Grupo San Nicolás fortalece y enriquece todos los días su oferta exportable con las diversificaciones de productos primarios e ingredientes de consumo masivo para la industria de alimentos. Nuestros principales productos son la Paprika Entera y Quinua de Grano, los mismos son abastecidos durante todo el año a los mercados internacionales en sus diferentes presentaciones.
6
1.5.Organigrama Empresa peruana exportadora de Capsicum, Granos y Especies Peruanas. Cuenta con la diversificación de campos de producción propia, articulación de cadenas productivas y con más de 15 centros de acopio estratégicamente instalados para el abastecimiento constante de sus productos de exportación, para el buen desarrollo de los objetivos planteados. En la Empresa Grupo San Nicolás se muestra como está estructurado internamente la empresa mostrando las áreas y sus responsables, como se evidencia en la siguiente figura: Figura 1
Fuente: Elaboración Propia. 7
1.6.Ámbito del proyecto 1.6.1. Área El área elegida para la implementación del proyecto será el área de ventas donde se manejan los datos de los clientes que generan compras para la empresa Grupo San Nicolás S.A.C. 1.6.2. Recursos humanos Tabla 1: Lista de personal y sus cargos. INTEGRANTES
DESCRIPCIÓN
Casas Mendoza, Frank Daniel
Coordinador de Proyecto
Montalvo Celis, James Stiven
Creación de Base de Datos
Romero Falcón, Cesar Augusto
Creación de encuestas y cuestionarios
Gómez Sánchez Gonzales, Jair
Apoyo con los recursos físicos (Hardware)
Huamanteca Damian, Henry Frank
Diagramación del Proyecto (Ms Proyect)
Velasco Santiago, Franco Joel
Digitación del proyecto completo
Fuente: Elaboración propia
1.6.3. Software Tabla 2:
Lista de software y su aplicación PROGRAMA
UTILIDAD
SQL Server 2008 R2
Administración de la Base de Datos
Office Word 2016
Redacción del informe
Office Excel 2016
Creación de Cronogramas y tablas estadísticos
Google Forms
Creación de cuestionarios
Visual Studio 2008
Programación
Fuente: Elaboración propia
1.6.4. Hardware Tabla 3: Lista de materiales y su utilidad 8
MATERIALES
UTILIDAD
Computadora
Digitación de la información
Laptop
Digitación de la información en 2do Plano
Impresora
Impresión de los avances del proyecto
Fuente: Elaboración propia
9
1.6.5. Cronograma de actividades
10
CAPÍTULO II ASPECTOS DEL NEGOCIO
2.1. Descripción de funciones y procesos del negocio a. Problemática actual o análisis situacional La empresa Grupo San Nicolás S.A.C., a pesar de ser una gran empresa exportadora, presenta en su área de ventas un desorden de información por lo mismo que no tienen las herramientas para poder medir las ventas realizadas a todos sus clientes en el exterior. La posible solución que propone el equipo de proyecto para una mejor administración de la información de sus clientes en la empresa Grupo San Nicolás S.A.C., es la implementación de un Datamart que les permita evitar la pérdida los datos de sus clientes
potenciales para formar una óptima estructura que facilite el análisis de la información al detalle.
b. Catálogo de reglas del negocio 95% de ventas se realizan al exterior 5% de ventas son locales (Nacionales) Política de venta (Exterior): Las facturas de nuestros clientes del exterior son al crédito de 30 a 90 días; pero la empresa tiene un contrato con un banco del exterior el cual compra las facturas de nuestros clientes (Factoring), entregándonos al momento de la recepción de toda la documentación el 80% del importe total de la factura. La diferencia que es el 20% nos entregan al momento que el cliente realiza su compra. Política de venta (Nacional): Las facturas de nuestros clientes nacionales se realizan al crédito de 30 a 60 días.
2.2. Documentación utilizada 2.2.1. Encuesta 1. ¿Cuenta la empresa con los siguientes elementos? (puede marcar más de 1 opción): o
Política de ventas
o
Procedimientos escritos de ventas
o
Sistemas de Asignación de Crédito
o
Sistema de Gestión de ventas
2. Con clientes nuevos, la empresa (puede marcar más de 1 opción) o
Lo da de alta en el sistema
o
Le solicita documentación comercial tributaria y que complete un formulario
o
Realiza análisis crediticio y determina condiciones comerciales
o
Todas las anteriores 12
3. Con clientes actuales, la empresa (debe marcar 1 sola opción) o
No tienen asignado límite de crédito.
o
Tiene asignado límite de crédito, pero esta desactualizado
o
Tiene asignado límite de crédito y lo actualiza periódicamente
4. Al gestionar las ventas, la empresa (debe marcar 1 sola opción) o
Lo hace cuando necesita información
o
Lo hace periódicamente, sin método y sin registro de la gestión realizada
o
Lo hace periódicamente, con método y sin registro de la gestión realizada
o
Lo hace periódicamente, sin método y con registro de la gestión realizada
5. ¿Cuantos clientes gestiona la empresa? (debe marcar 1 sola opción) o
1 a 50
o
51 a 300
o
Más de 300
2.2.2. Cuestionario
¿Cuenta la empresa con estadísticas referentes a las ventas? *Se desea saber cuántas ventas se emiten por mes.
¿Se tiene un stock actualizado de los productos solicitados por un cliente? *Se necesita de un stock de los productos solicitados por un cliente mensualmente.
¿Existe algún registro histórico sobre las ventas de la empresa? *Se desea saber la cantidad de ventas por año.
¿Cuentan con alguna estadística global sobre los productos vendidos? *Se necesita saber que producto fue el más comprado por mes y año.
¿Cuenta con Información sobre las compras por cliente? 13
*Se desea saber qué productos pueden ser potenciales para una futura venta por la empresa.
¿Cuenta con registros de queja de los clientes? *Se desea saber y monitorear el nivel de satisfacción del cliente.
2.2.3. Revisión documentaria
14
Fuente: Empresa Grupo San Nicolás
15
Fuente: Empresa Grupo San Nicolás
16
CAPÍTULO III METODOLOGÍA HEFESTO
1.-
ANÁLISIS DE REQUERIMIENTOS
1.1.-Identificar Preguntas 1.2.- Identificar indicadores y perspectivas de análisis 1.3.-Modelo conceptual
Análisis de Requerimientos En esta etapa buscamos conocer los procesos de la organización y recoger los requerimientos de los usuarios recolectándolos a partir de preguntas.
17
1.1.- Identificar preguntas
¿Cuenta con un registro del de importe de ventas por un cliente en un tiempo determinado?
¿Cuenta con algún registro del importe de costo de los productos?
¿Cuenta con el importe de ventas realizadas de un determinado producto?
¿Se conoce los clientes con los que trabaja la empresa?
¿Cuenta con registro del importe total de ventas a un cliente de un producto en un tiempo determinado?
¿Cuenta con registro del importe de ventas realizadas de un producto por cliente?
1.2.-Identificar Indicadores y perspectivas de análisis
Importe de ventas por cliente en un tiempo determinado.
Importe de costo de un producto.
Importe de ventas de un producto.
Cantidad de clientes.
Importe de ventas a un cliente de un producto en un tiempo determinado.
Importe de ventas de un producto por un cliente.
Tabla 4 Lista de indicadores y perspectivas. INDICADORES IMPORTE DE VENTAS IMPORTE DE COSTO CANTIDAD DE CLIENTES
PERSPECTIVAS CLIENTE PRODUCTO TIEMPO RESULTADO
Fuente: Elaboración propia
18
2.3.- Modelo Conceptual
IMPORTE DE VENTAS
CLIENTE
PRODUCTO IMPORTE DE COSTO VENTAS
TIEMPO CANTIDAD DE CLIENTES RESULTADO
2.-
ANÁLISIS DE LOS OLTP 2.1.-Determinacion de indicadores 2.2.-Establecer correspondencias 2.3.-Nivel de granularidad 2.4.-Modelo conceptual ampliado
2.1. Análisis OLTP Se analizó las fuentes OLTP para determinar cómo fueron calculados los indicadores y para establecer las respectivas correspondencias entre el modelo conceptual creado y las fuentes de datos. Luego, de la definición, los campos se incluyeron en cada perspectiva. Finalmente, se determinó el modelo conceptual ampliado con la información obtenida, a continuación, se detalla paso a paso desde la conformación de los indicadores hasta obtener el modelo conceptual ampliado.
19
a. Conformación de Indicadores Se explicará cómo se calcularán los indicadores, definiendo los siguientes conceptos para cada uno de ellos: a) Determinación de indicadores
Importe de ventas
Hechos: cantidad de pedidos
Función: SUM
Aclaración: El indicador importe de ventas representa la sumatoria de la cantidad de ventas que se ha realizado,
Importe de costo
Hechos: (importe de producto)*(cantidad de pedidos)
Función: SUM
Aclaración: el indicador importe de costo representa la sumatoria del importe de costo y se obtiene al multiplicar la cantidad de pedidos por el importe de cada producto.
Cantidad de clientes
Hechos: (Unidades vendidas) * (Precio de producto)
Función: SUM
Aclaración: el indicador cantidad de clientes representa la sumatoria de todos los clientes.
2.2.-Relaciones Identificadas
20
El objetivo de este paso, es el de examinar los OLTP disponibles que contengan la información requerida, como así también sus características, para poder identificar las correspondencias entre el modelo conceptual y las fuentes de datos.
IMPORTE DE VENTAS 21
CLIENTE
IMPORTE DE COSTOS VENTAS
PRODUCTO
TIEMPO CANTIDAD DE CLIENTES RESULTADOS
La tabla “cliente” se relaciona con la perspectiva “cliente”. La tabla “Producto” se relaciona con las perspectiva “Producto” La tabla “Resultados” se relaciona con la perspectiva “RESULTADOS” El campo “FECHA_HORA_CONFORME” de la tabla “Pedidos” se relaciona con la perspectiva “Tiempo” (debido a que es la fecha principal en el proceso de
venta). El campo “IMP_PRODUCTOS” de la tabla “Producto” multiplicado con el campo “COD_PEDIDO” de la tabla pedido se relaciona con el indicador
“IMPORTE COSTOS”. El campo “COD_CLIENTE” de la tabla “CLIENTE” se relaciona con el indicador
“CANTIDAD DE CLIENTES”. El campo “COD_PEDIDO” de la tabla “PEDIDO” se relaciona con el indicador “IMPORTE VENTAS”.
2.3.-Nivel de granularidad Para ello, basándose en las correspondencias establecidas en el paso anterior, se debe presentar al usuario los datos de análisis disponibles para cada perspectiva. Es muy importante conocer en detalle que significa cada campo y/o valor de los datos encontrados en los OLTP, por lo cual, es conveniente investigar su sentido, ya sea a través de diccionarios 22
de datos, reuniones con los encargados del sistema, análisis de los datos propiamente dichos, etc. Luego de exponer frente al usuario los datos existentes su significado, valores posibles y características, este debe decidir cuáles son los que considera relevantes para consultar los indicadores y cuáles no.
Con respecto a la perspectiva “Cliente”, los datos disponibles son los siguientes:
- COD_CLIENTE: Es la clave primaria de la tabla “Cliente” y representa unívocamente a un cliente en particular. Este campo es calculado de acuerdo a una combinación de iniciales del nombre del empleado, así como el área a donde pertenece y un número incremental.
- NOM_CLIENTE: Nombres del cliente. - TIPO_PERSONA: Se determina si el tipo de persona es Jurídica o Natural. - COD_CLIENTE_TIP: Código que representa el tipo de cliente. Con respecto a la perspectiva “RESULTADOS”, los datos disponibles son los siguientes:
- TIPO_RESULTADOS: Es la clave primaria de la tabla “RESULTADOS” y representa unívocamente a al tipo de resultado. - COD_RESULTADOS: Código del resultado. - DES_RESULTADOS: Descripción del resultado.
23
Con respecto a la perspectiva “Producto”, los datos disponibles son los siguientes:
- COD_PRODUCTOS: Es la clave primaria de la tabla “producto” y representa unívocamente a una producto en particular.
- COD_CLASE_PRODUCTO: código que representa la clase del producto. - COD_TIPO_PRODUCTO: código que representa el tipo de producto. - DES_PRODUCTOS: descripción del producto. - IMP_PRODUCTOS: precio del producto. - IMP_COSTO: precio para realizar un producto. Con respecto a la perspectiva “Tiempo”, que es la determinará la granularidad del depósito de datos, los datos más típicos que pueden emplearse son los siguientes:
- Año. - Trimestre. - mes
Una vez que se recolectó toda la información pertinente y se consultó con los usuarios cuales eran los datos que consideraban de interés para analizar los indicadores ya expuestos, los resultados obtenidos fueron los siguientes:
24
En la perspectiva “Cliente”, se tomará en cuenta COD_CLIENTE NOM_CLIENTE, COD_TIPO_PERSONA, DES_TIPO_PERSONA, COD_CLIENTE_VIP
En la perspectiva “Tiempo”, se seleccionaron los campos “Semana”, “Mes” (referido al nombre del mes), “Trimestre” y “Año”. En la perspectiva “producto” se utilizará el campo que hace referencia al producto COD_PRODUCTOS,DES_PRODUCTOS, COD_TIPO_PRODUCTO, DES_TIPO_PRODUCTO, COD_CLASE_PRODUCTO Y DES_CLASE_PRODUCTO En la perspectiva “resultado” se utilizara el campo que hace referencia al tipo de resultado
COD_TIPO_RESULTADO,
DES_TIPO_RESULTADO,
DES_RESULTADOS
Y
“COD_RESULTADO”
2.4.-Modelo Conceptual Ampliado En el paso, y con el fin de graficar los resultados obtenidos en los pasos anteriores, se ampliará el modelo conceptual, colocando bajo cada perspectiva los campos elegidos y bajo cada indicador su respectiva fórmula de cálculo. Gráficamente: CLIENTE COD_CLIENTE NOM_CLIENTE COD_TIPO_PERSONA DES_TIPO_PERSONA COD_CLIENTE_VIP
CANTIDAD DE CLIENTES SUM(cantidad de clientes)
TIEMPO Año Trimestre Mes Semana
IMPORTE DE VENTAS SUM(Cantidad de Ventas)
VENTAS
PRODUCTO COD_PRODUCTOS DESC_PRODUCTOS COD_TIPO_PRODUCTO DES_TIPO_PRODUCTO COD_CLASE_PRODUCTO
IMPORTE DE COSTO
SUM (importe de productos) * (cantidad de ventas)
RESULTADOS COD_RESULTADOS DESC_RESULTADOS COD_TIPO_RESULTADOS DES_TIPO_RESULTADOS 3.-
MODELO LÓGICO DEL DM
a 25
3.1.-Tipo de modelo lógico del DM 3.2.-Tablas de dimensiones 3.3.-Tablas de hechos 3.3.-Uniones
3.1.- Tipo del modelo lógico del DM El esquema que se utilizará, será en estrella, debido a sus características, ventajas y diferencias con los otros esquemas.
3.2.- Tabla de dimensiones A continuación, se diseñarán las tablas de dimensiones a partir de las perspectivas encontradas en el modelo conceptual.
Para ello se realizarán los siguientes procesos: Se elegirá un nombre que identifique la tabla de dimensión. Se añadirá un campo que represente su clave principal. Se redefinirán los nombres de los campos si no son suficientemente intuitivos.
CLIENTE La nueva tabla de dimensiones tendrá el nombre de “DCLIENTE” Se le agregará una clave principal llamada “ID_CLIENTE” Los nombres de los campos no serán modificados.
DCLIENTE
CLIENTE COD_CLIENTE LOCAL NOM_CLIENTE COD_TIPO_PERSONA DES_TIPO_PERSONA COD_CLIENTE_VIP
26
ID_CLIENTE COD_CLIENTE NOM_CLIENTE COD_TIPO_PERSONA DES_TIPO_PERSONA COD_CLIENTE_VIP
TIEMPO La nueva tabla de dimensiones tendrá el nombre de “DTIEMPO” Se le agregará una clave principal llamada “ID_TIEMPO” Los nombres de los campos no serán modificados.
DTIEMPO
TIEMPO Año Trimestre Mes Semana
ID_TIEMPO Año Trimestre Mes PRODUCTO La nueva tabla de dimensiones tendrá el nombre deSemana “DPRODUCTO” Se le agregará una clave principal llamada “ID_PRODUCTO” Los nombres de los campos no serán modificados.
DPRODUCTO
PRODUCTO
COD_PRODUCTOS ID_PRODUCTO DESC_PRODUCTOS RESULTADO COD_PRODUCTOS COD_TIPO_PRODUCTO La nueva tabla de dimensiones tendrá el nombre de “DRESULTADO” DES_TIPO_PRODUCTO DESC_PRODUCTOS Se le agregará una clave principal llamada “ID_RESULTADO” COD_CLASE_PRODUCTO COD_TIPO_PRODUCTO
Los nombres de los campos no serán modificados. RESULTADOS COD_RESULTADOS DESC_RESULTADOS COD_TIPO_RESULTADOS DES_TIPO_RESULTADOS
DES_TIPO_PRODUCTO COD_CLASE_PRODUCT DRESULTADO ID_RESULTADO COD_RESULTADOS DESC_RESULTADOS COD_TIPO_RESULTADOS DES_TIPO_RESULTADOS
3.3.-Tabla de hechos
La tabla de hechos tendrá por nombre “DVENTAS” Su clave principal estará compuesta por la combinación de las claves principales de las tablas de dimensiones antes definidas: “ID_RESULTADO”, “ID_CLIENTE”, “ID_PRODUCTO” y “ID_TIEMPO”. se crearán 3 hechos que corresponden con los 3 indicadores y serán renombrados asi “IMPORTE DE VENTAS” pasaria a llamarse “IMP_VENTA”, “IMPORTE DE COSTO” pasaría a llamarse “IMP_COSTO”, “CANTIDAD DE CLIENTES” pasaría a llamarse “CAN_CLIENTES”.
CANTIDAD DE CLIENTES 27 SUM(cantidad de clientes)
DVENTAS
ID_CLIENTE ID_PRODUCTO ID_TIEMPO ID_RESULTADO
IMPORTE DE VENTAS SUM(Cantidad de Ventas)
IMPORTE DE COSTO
VENTAS
CAN_CLIENTES IMP_COSTO IMP_VENTA
SUM (importe de productos) * (cantidad de ventas)
3.4.-Uniones
DCLIENTE DRESULTADO ID_RESULTADO COD_RESULTADOS DESC_RESULTADOS COD_TIPO_RESULTADOS DES_TIPO_RESULTADOS
1 n
n
ID_CLIENTE COD_CLIENTE NOM_CLIENTE COD_TIPO_PERSON A DES_TIPO_PERSONA COD_CLIENTE_VIP
n
DVENTAS
ID_CLIENTE ID_PRODUCTO ID_TIEMPO ID_RESULTADO n
ID_PRODUCTO COD_PRODUCTOS 1 DESC_PRODUCTOS COD_TIPO_PRODUCTO DES_TIPO_PRODUCTO DPRODUCTO COD_CLASE_PRODUCTO
CAN_CLIENTES IMP_COSTO IMP_VENTA
n
28
1 ID_TIEMPO Año Trimestre DTIEMPO Mes Semana
3.4. Integración de datos. a) Carga de datos Aquí se buscara combinar los datos que están almacenados en diferentes fuentes y permitir tener una única vista de ella. Proceso ETL – Carga Inicial Mediante este paso se procede a probar los datos a través de procesos ETL. Para realizar la compleja actividad de extraer datos de diferentes fuentes, para luego integrarlos, filtrarlos y depurarlos, por lo cual este paso se centrará solo en la generación de las sentencias SQL que contendrán los datos que serán de interés. PROCESO: INICIO – CARGA DE DIMENSION – CARGA DE DIMENSION – CARGA DE TABLA DE HECHOS PROCESO DEL ETL
29
30
31
32
33
34
35
36
II.- luego ir a inicio/ entrar a la carpeta del SQL SERVER SERVER 2008 R2 y activar el SQL server Business Intelligence Development Studio. 1.- crear un nuevo proyecto en Analysis services con el nombre de “VENTAS_SN”
37
38
2.- Creamos el origen de Datos, para ello nos Vamos A la pestaña “Origenes de datos”/clic derecho/Nuevo origen de datos.
3.- se cargara el asistente para el origen de datos, Dar clic en siguiente.
39
4.- selecionaremos una nueva conexión.
5.-Ponemos el nombre del servidor :”SOPORTE-PC”; seleccionar “usar autenticación de Sql server” esto se pone siempre y cuando se tenga el usuario y contraseña. Y buscamos nuestra base de datos “prueba_2”
40
6.- probamos la conexión.
41
7.- seleccionar la conexiones de datos y dar clic en siguiente.
42
8.- selecianamos Heredar del asistente y dar clic en siguiente
43
9.-poner el nombre de origen de datos “SA N _NICO” Y finalizar
44
nu 10.- dar clic derecho en nueva vista de origen de datos
11.- en el asistente de en vistas del origen de datos dar siguiente 45
12.-selecionamos el origen de datos creado y dar siguiente.
46
13.-pasamos al lado derecho los objetos
47
14.-selecioanmos D-TIEMPO, DCLIENTE,DPRODUCTO,D,RESULTADO,HVENTA.
48
49
15.- CREAMOS EL CUBO
16.- clic derecho en asistente de cubo y dar clic }
50
17.-al abrir el asistente de cubos dar siguiente.
51
18.-seleccionar la tabla de hecho HVENTA.Ydar siguiente
52
53
19.-seleionar las dimensiones
54
55
20.-procesar
56
57
58
59
b) Actualización. 60
Las políticas de actualización que se ha convenido con la empresa son las siguientes: Se debería actualizar la información todos los días a las 7 de la noche. Los datos de las tablas dimensiones “EMPLEADO” y “CLIENTE” serán cargados
totalmente. Los datos de la tabla de dimensión “TIEMPO” se cargaran de manera incremental,
tomando en cuenta la fecha de la última actualización. Estas acciones deberían realizarse mediante un periodo de prueba, para analizar cuál es la manera más eficiente de generar las actualizaciones, las cuales estarán basadas en el estudio de los cambios que se producen en los OLTP y que afectaran al contenido del DataWareHouse.
Proceso ETL: Inicio: Se iniciara la ejecución de los pasos todos los días a las siete de la noche. Establecer variables “FECHA_INICIO” y “FECHA_TERMINO”. La variable “FECHA_INICIO” obtendrá el valor resultante de restarle a la fecha actual
30 días. La variable “FECHA_TERMINO” obtendrá el valor de la fecha actual. Carga de dimensión DTIEMPO, en vez de recibir el valor de la variable “FECHA_INICIO” se tomara la fecha del último registro cargado en la dimensión
DTIEMPO. Carga de tabla de Hechos DCOBRANZA: a la serie de tareas que se realizan aquí, se le podría anteceder un nuevo paso que borrara los datos de la tabla de HECHOS correspondientes al intervalo entre “FECHA_INICIO” y ”FECHA_TERMINO”.
CONCLUSIONES
Se elaboró un plan de proyecto según la metodología hefesto, se usó la herramienta de ofimática Microsoft Word 2013 para su desarrollo.
Se identificaron y listaron 6 requerimientos de usaron los cuales se graficaron para un mejor entendimiento obteniendo como resultado un grafico del datamart mediante el visual studio.
Se analizó tanto el nivel de datos como el nivel técnico. En el primer acontecimiento, se analizó la única base de datos transaccional para la venta diaria hecha en Microsoft Excel 2013. En el segundo acontecimiento se estableció un enfoque panorámico del funcionamiento del datamart. 61
Se identificó un datamart a implemente el cual pertenece al área de ventas; también se identificó una tabla de hechos y el objetivo del mismo, así como también, se identificaron 4 dimensiones realizando por último el modelo estrella.
Se creó un ETL usando SQL Managment Studio, con la finalidad de poblar cada una de las tablas del datamart. Se crearon reportes para dar solución a los requerimientos con los que se inició el proyecto.
RECOMENDACIONES
Desarrollar interfaces de usuario final fáciles de usar con la finalidad de poder realizar una captura de datos estandarizada.
Utilizar el gestor de base de datos de SQL Server para la creación e implementación de una base de datos robusta que soporte la migración de los datos registrados desde su actual base de datos transacción hecha en Microsoft Excel 2013 hacia la nueva base de datos hecha en el SQL server.
Actualizar cada 7 días el Datamart con la finalidad de que el usuario final pueda acceder a la información mas actual posible.
ANEXOS
ETL INSERT INTO dcliente ( cod_cliente, nom_cliente, cod_tipo_persona ) SELECT cod_cliente, nom_cliente, 62
tipo_persona FROM clientes INSERT INTO d_tiempo ( fec_tiempo, dia_Semana, cod_mes, des_mes, cod_trimestre, des_trimestre, cod_anio ) SELECT fecha_recepcion AS f_r, DATENAME(weekday, fecha_recepcion) AS dia_semana, MONTH(fecha_recepcion) AS cod_mes, DATENAME(month, fecha_recepcion) AS des_mes, DATEPART(quarter, fecha_recepcion) AS cod_trimestre, 'Trimestre ' + LTRIM(STR(DATEPART(quarter, fecha_recepcion))) AS des_trimestre, DATEPART(year, fecha_recepcion) AS cod_anio FROM pedidos WHERE fecha_recepcion IS NOT NULL GROUP BY fecha_recepcion ORDER BY f_r INSERT INTO DRESULTADO ( cod_tipo_resultado, des_tipo_resultado, cod_resultados, des_resultados ) SELECT tipo_resultados, CASE WHEN tipo_resultados = 'S' THEN 'satisfecho' ELSE 'Insatisfecho' END des_tipo_resultado, cod_resultados, des_resultados FROM resultados
INSERT INTO dproducto ( COD_PRODUCTOS, des_productos, cod_tipo_producto, des_tipo_producto, cod_clase_producto, DES_CLASE_PRODUCTO ) SELECT PR.cod_productos, PR.des_productos, PR.cod_tipo_producto, TPR.des_tipo_producto, 63
PR.cod_clase_producto, CPR.des_clase_producto FROM productos PR, CLASE_DE_PRODUCTO CPR, TIPO_DE_PRODUCTO TPR WHERE PR.cod_tipo_producto = CPR.COD_TIPO_PRODUCTO AND PR.cod_clase_producto = CPR.COD_CLASE_PRODUCTO AND CPR.COD_TIPO_PRODUCTO = TPR.COD_TIPO_PRODUCTO INSERT INTO hventa ( id_cliente, id_resultado, id_producto, id_tiempo, imp_costo, imp_venta, can_clientes ) SELECT DC.ID_CLIENTE, DS.ID_RESULTADO, DA.ID_PRODUCTO, DT.ID_TIEMPO, SUM(G.imp_costo) AS imp_costo, SUM(G.imp_venta) AS imp_venta, COUNT(DISTINCT DC.ID_CLIENTE) AS Clientes FROM (SELECT P.COD_CLIENTE, P.TIPO_RESULTADOS, P.COD_RESULTADOS, P.COD_TIPO_PRODUCTO, P.COD_CLASE_PRODUCTO, P.FECHA_RECEPCION AS fecha, DATEDIFF(minute, P.FECHA_HORA_RECEPCION, P.FECHA_HORA_CONFIRMACION) AS min_conf, DATEDIFF(minute, P.FECHA_HORA_CONFIRMACION, P.FECHA_HORA_DESPACHO) AS min_desp, DATEDIFF(minute, P.FECHA_HORA_DESPACHO, P.FECHA_HORA_ENTREGA) AS min_entr, DATEDIFF(day, P.FECHA_HORA_ENTREGA, P.FECHA_HORA_RESULTADOS) AS dias_satis, PR.IMP_PRODUCTOS * 0.8 AS imp_costo, PR.IMP_PRODUCTOS AS imp_venta FROM PEDIDOS AS P INNER JOIN PRODUCTOS AS PR ON P.COD_TIPO_PRODUCTO = PR.COD_TIPO_PRODUCTO AND P.COD_CLASE_PRODUCTO = PR.COD_CLASE_PRODUCTO INNER JOIN CLASE_DE_PRODUCTO AS CPR ON PR.COD_TIPO_PRODUCTO = CPR.COD_TIPO_PRODUCTO AND PR.COD_CLASE_PRODUCTO = CPR.COD_CLASE_PRODUCTO INNER JOIN TIPO_DE_PRODUCTO AS TPR ON CPR.COD_TIPO_PRODUCTO = TPR.COD_TIPO_PRODUCTO INNER JOIN CLIENTES AS C ON P.COD_CLIENTE = C.COD_CLIENTE INNER JOIN RESULTADOS AS R ON P.TIPO_RESULTADOS = R.TIPO_RESULTADOS AND R.COD_RESULTADOS = R.COD_RESULTADOS WHERE (P.FECHA_HORA_RESULTADOS IS NOT NULL)) AS G INNER JOIN DCLIENTE AS DC ON G.COD_CLIENTE = DC.COD_CLIENTE INNER JOIN DRESULTADO AS DS ON G.TIPO_RESULTADOS = DS.COD_TIPO_RESULTADO AND G.COD_RESULTADOS = DS.COD_RESULTADOS INNER JOIN
64
DPRODUCTO AS DA ON G.COD_TIPO_PRODUCTO = DA.COD_TIPO_PRODUCTO AND G.COD_CLASE_PRODUCTO = DA.COD_CLASE_PRODUCTO INNER JOIN D_TIEMPO AS DT ON G.fecha = DT.FEC_TIEMPO GROUP BY DC.ID_CLIENTE, DS.ID_RESULTADO, DA.ID_PRODUCTO, DT.ID_TIEMPO
FUENTES DE INFORMACIÓN López Gonzáles, R. G., & Urbina Palomino, L. A. (2007). tesis.pucp. Recuperado el 06 de Agosto de 2012, de http://tesis.pucp.edu.pe/repositorio/bitstream/handle/123456789/348/L %C3%93PEZ_ROSARIO_CONSTRUCCI %C3%93N_Y_PRUEBAS_DE_UNA_HERRAMIENTA_DE_DESARROLLO_DE_SOLUCIONES_PARA_INTELI GENCIA_DE_NEGOCIOS_AN%C3%81LISIS_DIMENSIONAL.pdf?sequence=1 Pérez, S. (2006). edutecne. Recuperado el 06 de Agosto de 2012, de http://www.edutecne.utn.edu.ar/sistemas-informacion/Data%20MiningDataWarehouse.pdf Sinnexus. (2011). sinnexus. Recuperado el 12 de 09 de 2012, de http://sinnexus.es/business_intelligence/datamart.aspx usr.code. (2008). Tipos de Base de Datos. Conceptos Generales, 22. Peralta, V. (2001). fing. Recuperado el 06 de Agosto de 2012, de http://www.fing.edu.uy/inco/pedeciba/bibliote/tesis/tesis-vperalta.pdf
65