Data Warehouse

DATAWAREHOUSE INTRODUCCIÓN Cuando una empresa o institución almacena de manera centralizada, toda la información que pro

Views 224 Downloads 4 File size 170KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

DATAWAREHOUSE INTRODUCCIÓN Cuando una empresa o institución almacena de manera centralizada, toda la información que provienen de sus diferentes sistemas en un solo archivo, permitiendo que determinados usuarios efectúen consultas particulares y realicen un análisis partiendo desde niveles generales hacia niveles específicos, entonces nos encontramos frente a un sistema denominado “almacén de datos” o “Datawarehouse”.

DATAWAREHOUSE La pieza fundamental de un sistema Business Intelligence es el DWH porque todos los listados y análisis que se hagan se harán a partir de esta única base de datos, permitiendo analizar complejos volúmenes de información de interés desde diversos puntos de vista. “Un sistema Datawarehouse define un nuevo concepto para el almacenamiento de datos, integra la información generada en todos los ámbitos de una actividad de negocio (Ventas, Producción, Finanzas, Marketing, etc.) y permite un acceso y explotación de la información contenida en las bases de datos, facilitando un amplio abanico de posibilidad de análisis multivariables que permitirán la toma de decisiones estratégicas.” (Argos, 2011) Características 

Administra grandes cantidades de información



Guarda histórico de datos



Condesa y agrega información



Integra y asocia información de muchas fuentes

El proceso de implantación de un sistema Datawarehouse, puede adaptarse de forma gradual o departamental creando soluciones específicas para cada área con el objetivo de conseguir resultados operativos a corto plazo. Esta solución departamental se denomina Datamart.

Este tipo de modelo de datos consta principalmente de dos tipos de elementos: Dimensiones: Representan factores por lo que se analiza un determinado área del negocio. Son pequeñas y usualmente están des normalizadas. “Aquellos datos que nos permiten filtrar, agrupar o seccionar la información.” (Vicenteño, 2011) Hechos: Son el objeto de los análisis y están relacionados con las dimensiones. “Colecciones de datos relacionados compuestas por medidas y un contexto.” (Berzal, 2011) Medidas Atributos numéricos asociados a los hechos (lo que realmente se mide).

Tipos de Modelo “Un modelo multidimensional que no tiene jerarquías, se denomina modelo en estrella, si tuviera jerarquías, se denominaría modelo copo de nieve.” (García, 2013) Esquema en estrella (star) Una tabla de hechos y una tabla adicional por cada dimensión Esquema en copo de nieve (snowflake) Refleja la organización jerárquica de las dimensiones Constelaciones de hechos Los esquemas en estrella y bola de nieve pueden generalizarse con la inclusión de distintas tablas de hechos que comparten todas o algunas de las dimensiones. ETL

Para poder explotar la información existente en los diferentes sistemas empresariales, hay que extraerla de ellos, transformarla y llevarla al Data Warehouse. Una herramienta ETL está pensada expresamente para estas funciones (extraer, transformar y cargar). “La extracción consiste en leer los datos de la base de datos original. La transformación se refiere al hecho de limpiar la información incoherente o no válida, adaptar los tipos de datos, los valores de los campos, etc. Por último la carga se refiere al hecho de guardar los datos en el formato adecuado dentro del Data Warahouse.” (Zepeda, 2011) OLAP “Olap es procesamiento analítico en línea, para ello utiliza estructuras multidimensionales llamadas “Cubos OLAP”, permite jugar con la información del negocio, obteniendo distintas vistas de la información “ (Bottini, 2009) Un sistema Datawarehouse soporta también sofisticadas operaciones de análisis que se conocen con el término de Data Mining (Minería de datos). Cubos OLAP Contienen datos resumidos de Datamart u otros tipos de Bases de Datos, en un formato para Análisis, son bases de datos multidimensionales. “este tipo de base de datos esta optimizada para las consultas (query), a diferencia de las bases de datos relacionales que están orientadas a la transaccionalidad (OLTP)” (Team, 2012)

Metodologías Bill Inmon Bill Inmon ve la necesidad de transferir la información de los diferentes OLTP (Sistemas Transaccionales) de las organizaciones a un lugar centralizado donde los datos puedan ser utilizados para el analisis (sería el CIF o Corporate Information Factory). Insiste ademas en que ha de tener las siguientes características:



Orientado a temas



Integrado



No volátil



Variante en el tiempo

“Los Dw departamentales o datamarts son tratados como subconjuntos de este Dw corporativo, que son construidos para cubrir las necesidades individuales de análisis de cada departamento, y siempre a partir de este Dw Central” (Bustos, 2005)

Ilustración 1. Paradigma Bill Inmon

Ralph Kimball.

Por un lado tenemos tablas para las representar las dimensiones y por otro lado tablas para los hechos (las facts tables). Los diferentes Data Marts estan conectados entre si por la llamadabus structure, que contiene los elementos anteriormente citados a traves de las dimensiones conformadas “que permiten que los usuarios puedan realizar querys conjuntos sobre los diferentes data marts, pues este bus contiene los elementos en común que los comunican”. (Rivadera, 2010)

Ilustración 2. Paradigma Ralph Kimball

CONCLUSIÓN Conforme se puede apreciar, un Datawarehouse es una herramienta que permite mejorar la gestión de una empresa o una institución, ya que se podrán tomar mejores decisiones sobre determinados temas, evitando la emisión de cuantiosos reportes, permitiendo además que los mandos medios puedan tomar decisiones sin necesidad de recurrir constantemente a la Alta Dirección, con la ventaja que se formarán líderes dentro de la organización.

REFERENCIAS BIBLIOGRÁFICAS Argos, J. M. (2011). Modelos de construcción de Data Warehouses. Novática, 26-29. Berzal, F. (2011). Data Warehousing. Bottini, L. (2009). OLAP. Bustos, J. (2005). Business Inteligence y Data Warehousing en Windows. DanySoft. García, J. (2013). Diseño data warehouse. Business Intelligence. PROFIN. (s.f.). ProfinMexico. Rivadera, G. R. (2010). La Metodología de Kimball para el Diseño de almacenes. Team, S. A. (2012). SO Aagenda. Obtenido de http://soaagenda.com

Vicenteño, J. (2011). ORACLE. Obtenido de http://www.oracle.com/technetwork/es/articles/datawarehouse/i ntegracion-de-datos-en-linea-1427526-esa.html Zepeda, I. C. (2011). GUÍA METODOLÓGICA PARA LA DEFINICIÓN Y DESARROLLO DE UN DATA WAREHOUSE . Nicaragua.