Arquitecturas OLAP

ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN INGENIERÍA EN SISTEMAS E INFORMÁTICA TECNOLO

Views 100 Downloads 5 File size 526KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

ESCUELA POLITÉCNICA DEL EJÉRCITO DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN INGENIERÍA EN SISTEMAS E INFORMÁTICA TECNOLOGÍAS AVANZADAS DE BASES DE DATOS INGENIERO MAURICIO CAMPAÑA

TEMA: ARQUITECTURAS OLAP INTEGRANTES: JOEL RIVERA DIEGO TERÁN FECHA: 07-02-2017

OCTUBRE 2016-FEBRERO 2017

Contenido 1. ARQUITECTURAS OLAP......................................................................................3 1.1.

DEFINICIÓN....................................................................................................3

1.2 CLASIFICACIÓN.................................................................................................4 1.2.1 ROLAP.............................................................................................................4 1.2.2 MOLAP (Multidimensional online analytical processing).................................6 1.2.3 HOLAP.............................................................................................................7 1.2.4 DOLAP.............................................................................................................9 1.2.5 LOLAP............................................................................................................10 Bibliografía..................................................................................................................10

2

1. ARQUITECTURAS OLAP 1.1.

DEFINICIÓN

Los sistemas OLAP son una de las herramientas más utilizadas en el campo de las soluciones Business Intelligence, ya que brinda la posibilidad de disponer de una base de datos multidimensional que permite llevar a cabo el procesamiento analítico de la información de manera online. Con el paso de los años y el avance de las tecnologías informáticas al servicio de las empresas, que han logrado convertirse en la solución adecuada para la realización de negocios inteligentes, la herramienta OLAP ha dado lugar al nacimiento de diversos sistemas basados en su arquitectura que pueden ofrecer respuestas a las necesidades de las distintas compañías. De acuerdo a su forma de funcionamiento y a su estructura, los sistemas OLAP han sido clasificados en distintas categorías, tales como ROLAP, MOLAP, HOLAP, DOLAP,LOLAP. Esto se debe a que las distintas aplicaciones en las que se ha utilizado el sistema OLAP requieren de servicios y funcionalidades precisas y concretas para tareas puntuales, relacionadas a determinadas compañías. Se plantea DIEZ reglas bajo el concepto FASMI que los productos OLAP deben cumplir; el concepto FASMI proviene de las siglas de las iniciales en inglés: 1. FAST (Rápido): Debe ser rápido, necesitamos lanzar consultas y ver los resultados inmediatamente. 2.

ANALYSIS (Análisis): Debe soportar la lógica de negocio y análisis estadísticos que sean necesarios para los usuarios.

3. SHARED (Compartido): Tiene que manejar múltiples actualizaciones de forma segura y rápida. 4. MULTIDIMENSIONAL (Multidimensional): Tiene que proveer de una visión conceptual de la información a través de distintas dimensiones. 5. INFORMATION (Información): Debe poder manejar toda la información relevante y la información derivada. La funcionalidad de los sistemas OLAP se caracteriza por ser un análisis multidimensional de datos corporativos, que soportan los análisis del usuario y unas posibilidades de navegación, seleccionando la información a obtener. Normalmente este tipo de selecciones se ve reflejada en la visualización de la estructura multidimensional, en unos campos de selección que nos permitan elegir el nivel de agregación (jerarquía) de la dimensión, y/o la elección de un dato en concreto, la visualización de los atributos del sujeto, frente a una(s) dimensiones en modo tabla, pudiendo con ello realizar, entre otras las siguientes acciones:

3

6. Rotar (Swap): Alterar las filas por columnas (permutar dos dimensiones de análisis). 7. Bajar (Down): Bajar el nivel de visualización en las filas a una jerarquía inferior. 8. Detallar (Drilldown): Informar para una fila en concreto, de datos a un nivel inferior. 9. Expandir (Expand): Anterior sin perder la información a nivel superior para éste y el resto de los valores. 10. Colapsar (Collapse): Operación inversa de la anterior. Dentro de la tecnologia OLAP se muestran tres enfoques principales para la implementación de almacenes de datos, y están relacionadas con el modelo lógico utilizado para representar los datos: 

ROLAP significa relacional OLAP, una implementación basada en los DBMS relacionales.



MOLAP significa multidimensionales OLAP, una implementación basada en DBMS multidimensionales.



HOLAP significa OLAP híbrido, una implementación usando técnicas tanto relacionales y multidimensionale.

1.2 CLASIFICACIÓN 1.2.1 ROLAP Es una forma de procesamiento analítico en línea (OLAP) que ejecuta análisis multidimensional sobre datos almacenados en una base de datos relacional, en vez de una base de datos multidimensional, como se considera el estándar de OLAP. Utiliza una arquitectura de tres niveles. La BD relacional maneja el almacenamiento de datos, el motor OLAP proporciona la funcionalidad analítica, y alguna herramienta especializada es empleada para el nivel de presentación. El nivel de aplicación es el motor OLAP, que ejecuta las consultas de los usuarios. El motor OLAP se integra con el nivel de presentación a través del cual los usuarios realizan los análisis OLAP. Después de que el modelo de datos para el DW se ha definido, los datos se cargan desde los sistemas transaccionales. Los usuarios finales ejecutan sus análisis multidimensionales, a través del motor OLAP, el cual transforma sus datos a

4

consultas en SQL ejecutadas en las BD relacionales y sus resultados son devueltos a los usuarios. Los esquemas más comunes sobre los que se trabaja son estrella o copo de nieve, aunque es posible trabajar sobre cualquier base de datos relacional.

Ventajas:   



ROLAP es escalable ya que maneja grandes volúmenes de datos. Existe una gran variedad de herramientas de carga de datos para sistemas relacionales. Los datos se almacenan en una base de datos relacional estándar que puede ser accedida por cualquier herramienta de generación de informes SQL (reporting). Estas herramientas no tienen que ser necesariamente de tipo OLAP. Obviando el almacenamiento de datos del modelo multidimensional, es posible modelar datos con éxito que de otro modo no se ajustarían en un modelo dimensional estricto.

Desventajas: 





El proceso de carga de tablas agregadas debe ser gestionado por código ETL personalizado. Las herramientas ROLAP no disponen de mecanismos automáticos para realizar esta tarea, lo significa que se necesita más tiempo de desarrollo de código. Muchos desarrolladores de modelos dimensionales ROLAP ignoran el paso de crear tablas agregadas. En este caso el rendimiento de una consulta se ve afectado porque entonces se necesita consultar las tablas con datos más detallados. Los sistemas ROLAP se construyen sobre bases de datos de propósito general, por lo que hay algunas funcionalidades especiales propias de las herramientas MOLAP que no están disponibles en los sistemas ROLAP (tales como el indexado jerárquico especial). Sin embargo, las herramientas ROLAP modernas van supliendo estas carencias con las últimas mejoras en el lenguaje SQL tales como los operadores CUBE y ROLLUP, las vistas de cubo DB2, así como otras extensiones SQL OLAP. 5



Ya que las herramientas ROLAP se basan en SQL para todos los cálculos, no son apropiadas cuando el modelo realiza muchos cómputos que no se traducen bien en SQL (por ejemplos: presupuestos, asignaciones, informes financieros y otros escenarios).

1.2.2 MOLAP (Multidimensional online analytical processing) Proceso analítico en línea (OLAP) que indexa directamente en una base de datos multidimensional. Por lo general una aplicación OLAP considera los datos en forma multidimensional, el usuario es capaz de ver diferentes aspectos o facetas de agregados de datos, como las ventas por tiempo, geografía y modelo del producto. Si la información se almacena en una base de datos relacional, se puede ver en forma multidimensional, pero solo mediante el acceso secuencial y el procesamiento de una tabla para cada dimensión o aspecto que se quiera ver. El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de datos multidimensionales y el motor analítico.  

La base de datos multidimensional es la encargada del manejo, acceso y obtención del dato. El nivel de aplicación es el responsable de la ejecución de los requerimientos OLAP. El nivel de presentación se integra con el de aplicación y proporciona un interfaz a través del cual los usuarios finales visualizan los análisis OLAP. Una arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de datos multidimensional.

Ventajas:    

Ayuna el funcionamiento de la pregunta debido al almacenaje optimizado, a la indexación de direcciones multidimensional y a depositar. Un tamaño más pequeño del en-disco de datos comparó a los datos almacenados adentro base de datos emparentada debido a las técnicas de la compresión. Cómputo automatizado de los agregados de alto nivel de los datos. Es muy compacto para los módems bajos de la dimensión.

6



El modelo del arsenal proporciona la indexación de direcciones natural

Desventajas: 

 



El paso de proceso (carga de los datos) puede ser absolutamente muy largo, especialmente en volúmenes grandes de los datos. Esto es remediada generalmente haciendo solamente el proceso incremental, es decir, procesando solamente los datos que ha cambiado (generalmente los nuevos datos) en vez de tratar de nuevo el modem entero. Las herramientas de MOLAP tienen tradicionalmente dificultad el preguntar de modelos con dimensiones con muy arriba cardinality (es decir, millones de miembros). Ciertas herramientas de MOLAP (e.g., Essbase) tenga dificultad el poner al día y el preguntar de modelos con más de diez dimensiones. Este límite diferencia dependiendo de la complejidad y cardinality de las dimensiones en la pregunta. También depende del número de los hechos o de las medidas almacenadas. Otras herramientas de MOLAP (e.g., Servicios del análisis de Microsoft o Applix TM1) puede manejar centenares de dimensiones. El acercamiento de MOLAP introduce redundancia de datos.

1.2.3 HOLAP Un desarrollo un poco más reciente ha sido la solución OLAP híbrida (HOLAP), la cual combina las arquitecturas ROLAP y MOLAP para brindar una solución con las mejores características de ambas: desempeño superior y gran escalabilidad. Un tipo de HOLAP mantiene los registros de detalle (los volúmenes más grandes) en la base de datos relacional, mientras que mantiene las agregaciones en un almacén MOLAP separado. Los datos agregados y pre calculados se almacenan en estructuras multidimensionales y los de menor nivel de detalle en el relacional. Requiere un buen trabajo de análisis para identificar cada tipo de dato. La arquitectura HOLAP está compuesta por un servidor de base de datos Relacional y un motor OLAP en un servidor dedicado. Esta arquitectura permite que el espacio físico, la performance de las consultas y el procesamiento sea menor que MOLAP y mayor que ROLAP.

7

Ventajas: 

 



Tomando los parámetros más ventajosos de MOLAP y ROLAP, las herramientas HOLAP utiliza dos tipos de base de datos para almacenar la información, es decir una base relacional y una multidimensional, utilizando cada una de ellas de acuerdo a los requerimientos de cada uno de los datos que deben ser procesados. Este es uno de los sistemas más utilizados en la actualidad por gran cantidad de empresas, ya que en general presenta ventajas operativas, debido a la utilización de dos tipos de bases de datos diferentes. Mediante la correcta fusión entre los sistemas ROLAP y MOLAP, las herramientas HOLAP permiten lograr un veloz preprocesamiento de la información, ofreciendo un escalado de datos adecuado y proporcionando un excelente apoyo de consultas en su base de datos. Algunas de las herramientas más difundidas del tipo HOLAP han sido en los últimos años Microsoft Analysis Services, MicroStrategy y SAP AG BI Accelerator.

Desventajas:     

Cuando se Volúmenes de datos más grandes en la base de datos relacional. Volúmenes de datos más grandes en la base de datos relacional La arquitectura provoca una significativa redundancia de los datos y puede causar problemas en las redes que soporten muchos usuarios. La capacidad de cada usuario para construir un cubo de datos personalizado puede provocar una falta de coherencia entre los datos de los diferentes usuarios. Sólo puede mantenerse de manera eficiente una cantidad limitada de datos.

Niveles

MOLAP

ROLAP









La base de datos multidimensio nal: manejo, acceso y obtención del dato. El nivel de aplicación: ejecución de los requerimientos OLAP. El nivel de presentación: interfaz a



HOLAP

El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtención del dato. El nivel de aplicación es el motor que ejecuta las consultas multidimensiona les de los usuarios.

8

través del cual los usuarios finales visualizan los análisis OLAP.



El motor ROLAP se integra con niveles de presentación, a través de los cuales los usuarios realizan los análisis OLAP.

Almacenamien to de las Agregaciones

Modelo Multidimensional B

Base de datos relacional

Modelo Multidimension al

Facilidad de creación

Sencillo

Muy Sencillo

Sencillo

Almacenamien to de los datos

Modelo Multidimensional

Base de datos relacional

Base de datos relacional

Velocidad de respuesta

Buena

Regular o baja

Buena para consultas que posean agregaciones, Regular para datos de bajo nivel

Escalabilidad

Problemas de escalabilidad

Son más escalables

Recomendado s para

Cubos con usos frecuentes.

Datos que no son frecuentemente usados

Si el cubo requiere una rápida respuesta

1.2.4 DOLAP Es una tecnología OLAP de capa simple, basada en desktop, es capaz de descargar un pequeño hipercubo desde un punto central, usualmente desde una data mart o un data warehouse y ejecutar análisis multidimensionales cuando esta desconectado de la fuente. Los data sets son limitados a los fines definidos por el usuario que no tiene acceso a los datos granulares. En general los cubos contienen datos sumarizados, organizados en una estructura fija de dimensiones. Es ideal para preguntas y reportes recurrentes y bien entendidos.

9

Ventajas:     

Amigable con el usuario, e usuario puede manipular los datos localmente desde el resultado retornado almacenado en desktop. Excelente desempeño en sentencias, recolecta, agrega, y calcula los datos antes del análisis. Bajo costo Útil para usuarios móviles que no pueden conectarse siempre al datawarehouse Fácil de implementar entre todos los enfoques OLAP.

Desventajas: 

Funcionalidad y capacidad de datos limitada

1.2.5 LOLAP LOLAP (Local Online Analytical Processing) permite el procesamiento en la máquina del cliente (que puede ser una PC común) y no presentan problemas de tráfico en la red ni problemas de escalabilidad. Estas herramientas envían al servidor una instrucción SQL (Structure Query Language - lenguaje de consulta para acceder a sistemas de bases de datos) desde una máquina cliente cualquiera (como una simple PC, por ejemplo) y reciben el micro cubo de vuelta para ser analizado en la PC. Ventajas:   

No presentan problemas de tráfico en la red ni problemas de escalabilidad. Permiten el análisis en una estación de trabajo cliente, aunque esté desconectada de la red. Solo un proceso puede obtener acceso al archivo de cubo local porque el motor de cubo local bloquea exclusivamente un archivo de cubo local cuando establece una conexión al cubo local.

Desventajas:  

El micro cubo no puede ser muy grande. En un proceso se permiten hasta cinco conexiones simultáneas.

Bibliografía     

http://www.1keydata.com/datawarehousing/molap-rolap.html http://es.slideshare.net/enavarrete24/capitulo-2-introduccin-al-businessintelligence http://www.informatica-hoy.com.ar/informatica-tecnologia-empresas/Unsistema-OLAP-para-cada-necesidad.php http://www.interaktiv.cl/blog/wp-content/uploads/2012/04/8Esquema_FisicoMolap-Rolap-Holap.pdf https://juan2510.wordpress.com/2010/05/13/olap-molap-y-rolap/

10

11