M2 Procesos ETL

Diseño multidimensional Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González Índice  Necesidades

Views 191 Downloads 5 File size 1MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Diseño multidimensional Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González

Índice  Necesidades de los analistas y herramientas OLAP  Multidimensionalidad  Diseño lógico

Necesidades de los analistas ¿Los sistemas relacionales son adecuados para los analistas?

¿

Cómo han evolucionado las ventas de los diferentes productos durante el mes de marzo respecto al mismo mes del año pasado

?

Necesidades de los analistas ¿Los sistemas relacionales son adecuados para los analistas?

¿

Cómo han evolucionado las ventas de los diferentes productos durante el mes de marzo respecto al mismo mes del año pasado

?

El sistema decisional no debe ayudar a vender, comprar, producir o transportar, sino a evaluar, comparar, presupuestar, planificar, proyectar, etc.

Hojas de cálculo, ¿son la solución? Excel es una de las herramientas de reporting y análisis de datos más utilizadas en BI. Modelo tridimensional: hoja x fila x columna celda Muy útil para análisis de tipo what if

Hojas de cálculo, ¿son la solución? Excel es una de las herramientas de reporting y análisis de datos más utilizadas en BI. Modelo tridimensional: hoja xNo filason x columna celda apropiados para Muy útil para análisis de tipo what if cantidades de datos. grandes  No aportan semántica a los datos (las celdas se identifican por sus coordenadas).  La creación de informes es compleja  No facilitan las jerarquías de agregación. Por ejemplo ventas por día, por mes, por año.

Entonces, ¿cuál es la solución? Necesitamos un sistema híbrido que proporcione flexibilidad y potencia de cálculo y la facilidad de consulta de las bases de datos.

Herramientas OLAP

Herramientas OLAP: características  Herramientas con la capacidad de procesar consultas en línea con el objetivo de analizar datos que cumplan con las propiedades FASMI. FAST Trespuesta = 5 seg. (20 seg. excepcionalmente) ANALYSIS Herramientas de análisis estadístico para responder preguntas del tipo: why y what if

SHARED Mecanismos de seguridad, concurrencia y compartición de datos

INFORMATION Almacenar y gestionar gran cantidad de datos y de información (metadatos)

Herramientas OLAP: multidimensionalidad Objetivos:  Que los usuarios no dependan del departamento de informática

 Que se puedan formular nuevas preguntas de forma dinámica  Presentar los datos de la manera que los analistas están acostumbrados a verlos

 Hechos: datos métricos a analizar - Qué se quiere analizar  Dimensiones: datos descriptivos - Quién, a quién, dónde cuándo, cómo, etc.  La posición de una celda de información define su significado.

Índice  Necesidades de los analistas y herramientas OLAP  Multidimensionalidad  Diseño lógico

Multidimensionalidad  Hechos: datos métricos a analizar - Qué se quiere analizar  Dimensiones: datos descriptivos - Quién, a quién, dónde cuándo, cómo, etc.  La posición de una celda de información define su significado.

Se representa como

Dimensión

Hecho (Fact)

Dimensión

Hipercubos  Cubo Ventas de lápices en Zamora durante el mes de marzo del año 2000

Operaciones  Las operaciones permitidas sobre los hipercubos son: - Slice (o sesgo) -

Dice (o dado)

-

Roll–up (o generalización)

-

Drill down (o especialización)

-

Drill across (o navegación entre cubos)

Operaciones Inversas

 Estas operaciones pueden encadenarse para satisfacer la necesidades analíticas de los usuarios.

Operaciones: slice Hace un “corte” en el hipercubo para reducir el número de dimensiones.

Operaciones: dice Selecciona un subconjunto del hipercubo sin reducir el número de dimensiones.

Nivel de detalle y jerarquías de agregación Supongamos que después de ver el cubo anterior nos interesa consultar la información por comunidad autónoma en vez de por ciudad. ¿Cómo puede tratarse el cambio en el nivel de detalle?

Definiendo jerarquías de agregación

Operaciones: roll-up Reduce el detalle en que se ven los datos según una jerarquía de

agregación previamente definida.

Operaciones: roll-up Reduce el detalle en que se ven los datos según una jerarquía de

agregación previamente definida.

Sólo es posible si la jerarquía de agregación está definida

Operaciones: drill down Operación inversa a roll-up. Aumenta el nivel de detalle en que se ven los datos según una jerarquía de agregación previamente definida.

Operaciones: drill down Operación inversa a roll-up. Aumenta el nivel de detalle en que se ven los datos según una jerarquía de agregación previamente definida.

Sólo es posible si: 1) La jerarquía de agregación está definida. 2) Los datos están definidos en el suficiente nivel de detalle.

Operaciones: drill across Cambian en tema/hecho de análisis. Después de la operación continuamos teniendo las mismas dimensiones pero un hecho distinto.

Ventas

Producción

Ejercicio  Información sobre las compras del mes de abril del 2000 de portaminas, gomas y tizas agrupadas por comunidad autónoma. No queremos obtener los resultados sobre la población de Tarragona.

Ejercicio  Información sobre las compras del mes de abril del 2000 de portaminas, gomas y tizas agrupadas por comunidad autónoma. No queremos obtener los resultados sobre la población de Tarragona. Solución:  Dice(Portaminas, Gomas, Tizas)  Dice(Todo menos Tarragona)  Roll-up (Día Mes)

 Roll-up (Población  Comunidad Autónoma)  Slice(Abril 2000)

Índice  Necesidades de los analistas y herramientas OLAP  Multidimensionalidad  Diseño lógico

Diseño multidimensional: un problema difícil  La consulta de información utilizando el modelo multidimensional es muy sencillo, pero: – El diseño multidimensional es un proceso complejo. – La creación y mantenimiento del data warehouse es un proceso altamente crítico. – La implantación y mantenimiento de una herramienta OLAP es complicado. Para abordar un proyecto de data warehouse es necesario contar con el soporte profesional adecuado. Implicando profesionales con gran

conocimiento y experiencia en el tema.

Ejemplo de diseño lógico

¿Esquema conceptual?

Ejemplo de diseño lógico