Grupo 10 DW

UNIVERSIDAD MAYOR DE SAN SIMÓN FACULTAD DE CIENCIAS Y TECNOLOGÍA CARRERA DE INGENIERÍA DE SISTEMAS Data Warehouse – Pen

Views 86 Downloads 3 File size 592KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

UNIVERSIDAD MAYOR DE SAN SIMÓN FACULTAD DE CIENCIAS Y TECNOLOGÍA CARRERA DE INGENIERÍA DE SISTEMAS

Data Warehouse – Pentaho Proyecto Supermercado DW

Integrantes:    

Castro Mamani Andres Marcos Rodriguez Christian Martinez Ramirez Ricardo Rojas Rojas Ariel

Grupo: N° 10: Docente: Lic. Calancha Navia Boris Marcelo Materia: Data Warehouse Carrera: Ing. De Sistemas Fecha de Entrega: 05/01/2021

Cochabamba - Bolivia

2

1. Introducción Para el presente trabajo se utilizará una herramienta denominada “Pentaho”, la cual está escrita en el lenguaje Java, es open source desde su versión 2.2.0 Pentaho es una herramienta muy potente, se trata de un software de Gestión de Inteligencia Empresarial (Business Intelligence y Big Data) que permite la mejora de la toma de decisiones, gracias a su capacidad de generar cuadros de mandos, analíticas y mucho más. Uno de los componentes de Pentaho, es Pentaho Data Integration (PDI) también

llamado Kettle(Acrónimo

de

“Kettle

Extraction,

Transformation,

Transportation and Load Environment”). - el cual contiene, a su vez, componentes muy interesantes como Spoon, que convierten a Pentaho en una herramienta muy útil y completa.

Spoon a su vez es el diseñador gráfico de transformaciones y trabajos del sistema de ETTLs de Pentaho Data Integration (PDI), la cual está diseñada para ayudar en los procesos ETTLs que incluyen Extracción, Transformación, Transporte y Carga de datos. Spoon es una interfaz gráfica de Usuario (GUI), que permite diseñar transformaciones y trabajos que se pueden ejecutar con las herramientas de Kettle (Pan y Kitchen).

2. Objetivos I. Primero, completar la tabla Ventas con el campo totalVenta que incluye el cálculo de Kilos vendidos por el Precio de los Productos (Ventas.Kilos*Productos.Precio) para todos los datos asociados en Ventas. Esta parte ya se analizó en la tarea de Power BI. II. Realizar el proceso ETL usando la herramienta spoon de Pentaho, para obtener el Data Warehouse o Datamart) SupermercadoDW en MySQL.

3

III. Para obtener el DW SupermercadoDW se debe modelar el modelo estrella que involucre las dimensiones y hechos necesarios para responder las consultas: IV. Usando la herramienta de Pentaho Schema Workbench modelar el Data cubo, tal como se muestra en el esquema siguiente, encerrado en verde: Visualizar usando las herramientas de visualización de Pentaho

3. Desarrollo

1. Primeramente, se procede a completar la tabla Ventas con el campo TotalVenta que incluye el cálculo de Kilos vendidos por el Precio de los Productos (Ventas.Kilos*Productos.Precio) para todos los datos asociados en Ventas como se ve a continuación en la siguiente imagen:

4

2. Para el proceso ETL se utilizara MySql y el diseñador gráfico de transformaciones y trabajos del sistema de ETTLs de Pentaho Data Integration

Se procede a crear una base de datos en MySql a la cual se le llamará “supermercadodw” :

Luego lo que procede es utilizar Spoon de pentaho y crear una nueva transformación:

Extraccion: Para extraer los datos del archivo VERDULEROS.mdb se crean entradas para cada tabla:

5

Se procede a agregar el directorio donde esta ubicado el archivo VERDULEROS.mdb, haciendo doble click:

Transformación: Para el paso de la transformacion se usará select values:

Se procede a unir con el proceso de Entrada:

6

Para el proceso de transformación se van a seleccionar los valores que van a migrar del archivo fuente a nuestra DataWarehouse denominada “supermercadodw”, más específicamente a la tabla “dimVendedores”

Para el paso de Carga: Se procede a poner outputs que son las salidas mediante las que se ejecutara el código sql para pasar las tablas a MySql:

7

Para cada salida se procede a ejecutar “SQL”:

8

Como resultado de esas operaciones tenemos los siguiente:

Se procede a verificar que hay conexión con MySql:

Una vez finalizado los pasos, es hora de”correr” el proceso ETL, para esta tabla:

9

Se verifica que se crearon las tablas en la base de datos supermercadodw en MySql:

10

4. Conclusiones

11

Pentaho es una potente herramienta capaz de manipular y transformar información en todos aquellos proyectos dónde sea necesario trabajar con datos. Su solución para cubrir las necesidades de extracción, manipulación, validación y carga de datos desde múltiples fuentes de origen y en diferentes entornos puede resolver muchos problemas.

12