Las herramientas de ETL

Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tip

Views 99 Downloads 1 File size 3MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tipos de herramientas a medida que la tecnología ha ido evolucionando. Estas pueden ser catalogadas en cuatro grandes categorías, abordando en esta entrada dos de ellas, las herramientas ‘Enterprise’ y las ‘Open Source’. Hay varias compañías de software que se especializan exclusivamente en vender soluciones de ETL, como Informática, IBM, Oracle y Microsoft mientras que, por otro lado, destacan también herramientas ETL de código abierto. A continuación mostramos las principales diferencias entre estas dos categorías.

Enterprise Software ETL Varias compañías de software venden productos de software comercial. Estos tienden a ser los más maduros en adopción y funcionalidad. Se trata de productos que proporcionan interfaces gráficas para diseñar y ejecutar procesos de ETL, proporcionando conexiones con prácticamente todas las bases de datos relacionales. Algunos de estos productos tienen también soporte para fuentes de datos no relacionales, como JSON y XML. Este tipo de herramientas de software empresarial generalmente son utilizadas por grandes empresas y, en comparación con otras herramientas, tienden a ser más caras. Algunos ejemplos de herramientas de ETL de software empresarial son: Este producto es posiblemente el producto de ETL más maduro del mercado. Es parte de una gran cartera de productos, incluida como plataforma de Informática. Informática es menos maduro que otros productos para fuentes semiestructuradas y no estructuradas IBM Infosphere A diferencia de muchas otras herramientas ETL, proporciona capacidades sólidas para DataStage trabajar con computadoras mainframe Utiliza una arquitectura diferenciada frente a otros productos. En lugar de realizar las Oracle Data transformaciones empleando el motor de la propia herramienta ETL, a través de los Integrator recursos de hardware, envía los datos al destino y luego realiza las transformaciones utilizando el motor de la base de datos Microsoft SQL Tiene un costo menor que otras herramientas ETL empresariales y es bastante intuitiva Server Integration y fácil de usar. Sin embargo, está limitada a implementaciones bajo el sistema operativo Services de Windows -SSISEs una herramienta ETL diseñada principalmente para mover datos entre aplicaciones SAP Data Services SAP. No tiene un uso amplio fuera de estos entornos SAS ha desarrollado un producto ETL con fuerte soporte para Hadoop, transmisión de SAS Data Manager datos y aprendizaje automático Informática PowerCenter

Open Source ETL Durante la última década, se han creado varios productos de código abierto ETL con la ventaja de ser de uso gratuito para cualquier persona. Su código fuente también está disponible de forma gratuita, permitiendo a cualquier desarrollador ampliar o mejorar sus capacidades. Estas herramientas varían significativamente en calidad, integraciones, facilidad de uso,

adopción y disponibilidad de soporte. Al igual que las herramientas ETL empresariales, muchas de estas proporcionan una interfaz gráfica para diseñar y ejecutar los procesos. Algunos ejemplos de herramientas ETL de código abierto son: Open Studio emplea código Java para el desarrollo y ejecución de los procesos ETL, Talend Open Studio enfoque que le da algunas ventajas de rendimiento y cierta libertad de programación para la construcción de los procesos Pentaho Data PDI es una herramienta ETL de código abierto ampliamente conocida por su interfaz Integration gráfica Spoon. PDI exporta los proceos en archivos XML y estos son ejecutados a -anterior Kettle– través de su motor ETL Se trata de una plataforma distribuida empleada para almacenar, manipular y analizar datos de cualquier estructura. Es un ecosistema complejo de proyectos de código abierto que alberga más de 20 tecnologías diferentes. Hadoop Algunos de estos sub-productos se utilizan para desarrollar tareas de ETL, como Pig, MapReduce y Spark

En la siguiente entrada abordaremos las otras dos grandes categorías de herramienta de ETL: las personalizadas y las Cloud Services.

Saad Khalid Temas relacionados



CÓDIGO ABIERTO ETL



ENTERPRISE SOFTWARE



ETL



OPEN SOURCE ETL



SOFTWARE COMERCIAL



SOFTWARE EMPRESARIAL ARTÍCULO ANTERIOR SIGUIENTE ARTÍCULO

TE PUEDE INTERESAR

VER PUBLICACIÓN 

PROCESAMIENTO DE DATOS



TRATAMIENTO DE DATOS

¿Qué son las User Defined Functions (UDFs)? 

POSTED ON12 JUNIO, 2018



BYSALVADOR

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



TRATAMIENTO DE DATOS

Optimizaciones PowerCenter: Particionamiento de datos 

POSTED ON29 MAYO, 2018



BYSALVADOR

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



TRATAMIENTO DE DATOS

Denormalización: Informatica PowerCenter 

POSTED ON22 MAYO, 2018



BYCARLOS SOSA

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



EXPLOTACIÓN DE DATOS

¿Cómo organizar Tableau Server? 

POSTED ON8 MAYO, 2018



BYALBERTO VÁZQUEZ

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



TRATAMIENTO DE DATOS

Workflow Manager: Informática PowerCenter 

POSTED ON1 MAYO, 2018



BYMAYRON FONSECA

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



TRATAMIENTO DE DATOS

Normalización: Informática PowerCenter 

POSTED ON24 ABRIL, 2018



BYCARLOS SOSA

VER PUBLICACIÓN 

BUSINESS INTELLIGENCE



EXPLOTACIÓN DE DATOS

QlikView para principiantes 

POSTED ON10 ABRIL, 2018



BYCARLOS SOSA

VER PUBLICACIÓN 

BIG DATA



BUSINESS INTELLIGENCE



PROCESAMIENTO DE DATOS



TRATAMIENTO DE DATOS

Principales categorías de herramientas ETL – Parte II 

POSTED ON3 ABRIL, 2018



BYSAAD KHALID

SUSCRÍBETE A LA NEWSLETTER

NOMBRE APELLIDO He leído y acepto la Política de Privacidad SUSCRÍBETE

EMAIL

ENTRADAS DESTACADAS



1

Arquitecturas Basadas en Microservicios : Spring Cloud Ribbon o

POSTED ON12.03.19

O

3 MIN



2

Arquitecturas basadas en Microservicios: Spring Cloud Feign o

POSTED ON27.02.19

O

4 MIN



3

2gether, the first collaborative bank o

POSTED ON16.01.19

O

7 MIN



4

MongoDB – Querying II o

POSTED ON07.11.18

O

4 MIN



5

Arquitecturas basadas en microservicios: Spring Cloud Gateway o

POSTED ON19.09.18

O

3 MIN

ENTRADAS ALEATORIAS

Blockchain: Introducción 

POSTED ON29.05.17 



4 MIN

JAVIER DE LA ROSA FERNÁNDEZ

VER PUBLICACIÓN

Transformaciones PowerCenter: Joiner 

POSTED ON16.05.17 



2 MIN

JUAN CARLOS FERNÁNDEZ

VER PUBLICACIÓN

Denormalización: Informatica PowerCenter 

POSTED ON22.05.18 

2 MIN



CARLOS SOSA

VER PUBLICACIÓN

Arquitecturas basadas en microservicios: Spring Cloud 

POSTED ON06.11.17  

3 MIN RAFA RÍOS

VER PUBLICACIÓN

2gether, the first collaborative bank 

POSTED ON16.01.19  

7 MIN BI GEEK

VER PUBLICACIÓN