Diseño multidimensional Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González Índice Necesidades
Views 191 Downloads 5 File size 1MB
Diseño multidimensional Jordi Conesa i Caralt Isabel Guitart Hormigo M. Elena Rodríguez González
Índice Necesidades de los analistas y herramientas OLAP Multidimensionalidad Diseño lógico
Necesidades de los analistas ¿Los sistemas relacionales son adecuados para los analistas?
¿
Cómo han evolucionado las ventas de los diferentes productos durante el mes de marzo respecto al mismo mes del año pasado
?
Necesidades de los analistas ¿Los sistemas relacionales son adecuados para los analistas?
¿
Cómo han evolucionado las ventas de los diferentes productos durante el mes de marzo respecto al mismo mes del año pasado
?
El sistema decisional no debe ayudar a vender, comprar, producir o transportar, sino a evaluar, comparar, presupuestar, planificar, proyectar, etc.
Hojas de cálculo, ¿son la solución? Excel es una de las herramientas de reporting y análisis de datos más utilizadas en BI. Modelo tridimensional: hoja x fila x columna celda Muy útil para análisis de tipo what if
Hojas de cálculo, ¿son la solución? Excel es una de las herramientas de reporting y análisis de datos más utilizadas en BI. Modelo tridimensional: hoja xNo filason x columna celda apropiados para Muy útil para análisis de tipo what if cantidades de datos. grandes No aportan semántica a los datos (las celdas se identifican por sus coordenadas). La creación de informes es compleja No facilitan las jerarquías de agregación. Por ejemplo ventas por día, por mes, por año.
Entonces, ¿cuál es la solución? Necesitamos un sistema híbrido que proporcione flexibilidad y potencia de cálculo y la facilidad de consulta de las bases de datos.
Herramientas OLAP
Herramientas OLAP: características Herramientas con la capacidad de procesar consultas en línea con el objetivo de analizar datos que cumplan con las propiedades FASMI. FAST Trespuesta = 5 seg. (20 seg. excepcionalmente) ANALYSIS Herramientas de análisis estadístico para responder preguntas del tipo: why y what if
SHARED Mecanismos de seguridad, concurrencia y compartición de datos
INFORMATION Almacenar y gestionar gran cantidad de datos y de información (metadatos)
Herramientas OLAP: multidimensionalidad Objetivos: Que los usuarios no dependan del departamento de informática
Que se puedan formular nuevas preguntas de forma dinámica Presentar los datos de la manera que los analistas están acostumbrados a verlos
Hechos: datos métricos a analizar - Qué se quiere analizar Dimensiones: datos descriptivos - Quién, a quién, dónde cuándo, cómo, etc. La posición de una celda de información define su significado.
Índice Necesidades de los analistas y herramientas OLAP Multidimensionalidad Diseño lógico
Multidimensionalidad Hechos: datos métricos a analizar - Qué se quiere analizar Dimensiones: datos descriptivos - Quién, a quién, dónde cuándo, cómo, etc. La posición de una celda de información define su significado.
Se representa como
Dimensión
Hecho (Fact)
Dimensión
Hipercubos Cubo Ventas de lápices en Zamora durante el mes de marzo del año 2000
Operaciones Las operaciones permitidas sobre los hipercubos son: - Slice (o sesgo) -
Dice (o dado)
-
Roll–up (o generalización)
-
Drill down (o especialización)
-
Drill across (o navegación entre cubos)
Operaciones Inversas
Estas operaciones pueden encadenarse para satisfacer la necesidades analíticas de los usuarios.
Operaciones: slice Hace un “corte” en el hipercubo para reducir el número de dimensiones.
Operaciones: dice Selecciona un subconjunto del hipercubo sin reducir el número de dimensiones.
Nivel de detalle y jerarquías de agregación Supongamos que después de ver el cubo anterior nos interesa consultar la información por comunidad autónoma en vez de por ciudad. ¿Cómo puede tratarse el cambio en el nivel de detalle?
Definiendo jerarquías de agregación
Operaciones: roll-up Reduce el detalle en que se ven los datos según una jerarquía de
agregación previamente definida.
Operaciones: roll-up Reduce el detalle en que se ven los datos según una jerarquía de
agregación previamente definida.
Sólo es posible si la jerarquía de agregación está definida
Operaciones: drill down Operación inversa a roll-up. Aumenta el nivel de detalle en que se ven los datos según una jerarquía de agregación previamente definida.
Operaciones: drill down Operación inversa a roll-up. Aumenta el nivel de detalle en que se ven los datos según una jerarquía de agregación previamente definida.
Sólo es posible si: 1) La jerarquía de agregación está definida. 2) Los datos están definidos en el suficiente nivel de detalle.
Operaciones: drill across Cambian en tema/hecho de análisis. Después de la operación continuamos teniendo las mismas dimensiones pero un hecho distinto.
Ventas
Producción
Ejercicio Información sobre las compras del mes de abril del 2000 de portaminas, gomas y tizas agrupadas por comunidad autónoma. No queremos obtener los resultados sobre la población de Tarragona.
Ejercicio Información sobre las compras del mes de abril del 2000 de portaminas, gomas y tizas agrupadas por comunidad autónoma. No queremos obtener los resultados sobre la población de Tarragona. Solución: Dice(Portaminas, Gomas, Tizas) Dice(Todo menos Tarragona) Roll-up (Día Mes)
Roll-up (Población Comunidad Autónoma) Slice(Abril 2000)
Índice Necesidades de los analistas y herramientas OLAP Multidimensionalidad Diseño lógico
Diseño multidimensional: un problema difícil La consulta de información utilizando el modelo multidimensional es muy sencillo, pero: – El diseño multidimensional es un proceso complejo. – La creación y mantenimiento del data warehouse es un proceso altamente crítico. – La implantación y mantenimiento de una herramienta OLAP es complicado. Para abordar un proyecto de data warehouse es necesario contar con el soporte profesional adecuado. Implicando profesionales con gran
conocimiento y experiencia en el tema.
Ejemplo de diseño lógico
¿Esquema conceptual?
Ejemplo de diseño lógico