Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tip
Views 99 Downloads 1 File size 3MB
Las herramientas de ETL han existido durante más de 30 años y a lo largo de este tiempo han ido surgiendo diferentes tipos de herramientas a medida que la tecnología ha ido evolucionando. Estas pueden ser catalogadas en cuatro grandes categorías, abordando en esta entrada dos de ellas, las herramientas ‘Enterprise’ y las ‘Open Source’. Hay varias compañías de software que se especializan exclusivamente en vender soluciones de ETL, como Informática, IBM, Oracle y Microsoft mientras que, por otro lado, destacan también herramientas ETL de código abierto. A continuación mostramos las principales diferencias entre estas dos categorías.
Enterprise Software ETL Varias compañías de software venden productos de software comercial. Estos tienden a ser los más maduros en adopción y funcionalidad. Se trata de productos que proporcionan interfaces gráficas para diseñar y ejecutar procesos de ETL, proporcionando conexiones con prácticamente todas las bases de datos relacionales. Algunos de estos productos tienen también soporte para fuentes de datos no relacionales, como JSON y XML. Este tipo de herramientas de software empresarial generalmente son utilizadas por grandes empresas y, en comparación con otras herramientas, tienden a ser más caras. Algunos ejemplos de herramientas de ETL de software empresarial son: Este producto es posiblemente el producto de ETL más maduro del mercado. Es parte de una gran cartera de productos, incluida como plataforma de Informática. Informática es menos maduro que otros productos para fuentes semiestructuradas y no estructuradas IBM Infosphere A diferencia de muchas otras herramientas ETL, proporciona capacidades sólidas para DataStage trabajar con computadoras mainframe Utiliza una arquitectura diferenciada frente a otros productos. En lugar de realizar las Oracle Data transformaciones empleando el motor de la propia herramienta ETL, a través de los Integrator recursos de hardware, envía los datos al destino y luego realiza las transformaciones utilizando el motor de la base de datos Microsoft SQL Tiene un costo menor que otras herramientas ETL empresariales y es bastante intuitiva Server Integration y fácil de usar. Sin embargo, está limitada a implementaciones bajo el sistema operativo Services de Windows -SSISEs una herramienta ETL diseñada principalmente para mover datos entre aplicaciones SAP Data Services SAP. No tiene un uso amplio fuera de estos entornos SAS ha desarrollado un producto ETL con fuerte soporte para Hadoop, transmisión de SAS Data Manager datos y aprendizaje automático Informática PowerCenter
Open Source ETL Durante la última década, se han creado varios productos de código abierto ETL con la ventaja de ser de uso gratuito para cualquier persona. Su código fuente también está disponible de forma gratuita, permitiendo a cualquier desarrollador ampliar o mejorar sus capacidades. Estas herramientas varían significativamente en calidad, integraciones, facilidad de uso,
adopción y disponibilidad de soporte. Al igual que las herramientas ETL empresariales, muchas de estas proporcionan una interfaz gráfica para diseñar y ejecutar los procesos. Algunos ejemplos de herramientas ETL de código abierto son: Open Studio emplea código Java para el desarrollo y ejecución de los procesos ETL, Talend Open Studio enfoque que le da algunas ventajas de rendimiento y cierta libertad de programación para la construcción de los procesos Pentaho Data PDI es una herramienta ETL de código abierto ampliamente conocida por su interfaz Integration gráfica Spoon. PDI exporta los proceos en archivos XML y estos son ejecutados a -anterior Kettle– través de su motor ETL Se trata de una plataforma distribuida empleada para almacenar, manipular y analizar datos de cualquier estructura. Es un ecosistema complejo de proyectos de código abierto que alberga más de 20 tecnologías diferentes. Hadoop Algunos de estos sub-productos se utilizan para desarrollar tareas de ETL, como Pig, MapReduce y Spark
En la siguiente entrada abordaremos las otras dos grandes categorías de herramienta de ETL: las personalizadas y las Cloud Services.
Saad Khalid Temas relacionados
CÓDIGO ABIERTO ETL
ENTERPRISE SOFTWARE
ETL
OPEN SOURCE ETL
SOFTWARE COMERCIAL
SOFTWARE EMPRESARIAL ARTÍCULO ANTERIOR SIGUIENTE ARTÍCULO
TE PUEDE INTERESAR
VER PUBLICACIÓN
PROCESAMIENTO DE DATOS
TRATAMIENTO DE DATOS
¿Qué son las User Defined Functions (UDFs)?
POSTED ON12 JUNIO, 2018
BYSALVADOR
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
TRATAMIENTO DE DATOS
Optimizaciones PowerCenter: Particionamiento de datos
POSTED ON29 MAYO, 2018
BYSALVADOR
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
TRATAMIENTO DE DATOS
Denormalización: Informatica PowerCenter
POSTED ON22 MAYO, 2018
BYCARLOS SOSA
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
EXPLOTACIÓN DE DATOS
¿Cómo organizar Tableau Server?
POSTED ON8 MAYO, 2018
BYALBERTO VÁZQUEZ
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
TRATAMIENTO DE DATOS
Workflow Manager: Informática PowerCenter
POSTED ON1 MAYO, 2018
BYMAYRON FONSECA
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
TRATAMIENTO DE DATOS
Normalización: Informática PowerCenter
POSTED ON24 ABRIL, 2018
BYCARLOS SOSA
VER PUBLICACIÓN
BUSINESS INTELLIGENCE
EXPLOTACIÓN DE DATOS
QlikView para principiantes
POSTED ON10 ABRIL, 2018
BYCARLOS SOSA
VER PUBLICACIÓN
BIG DATA
BUSINESS INTELLIGENCE
PROCESAMIENTO DE DATOS
TRATAMIENTO DE DATOS
Principales categorías de herramientas ETL – Parte II
POSTED ON3 ABRIL, 2018
BYSAAD KHALID
SUSCRÍBETE A LA NEWSLETTER
NOMBRE APELLIDO He leído y acepto la Política de Privacidad SUSCRÍBETE
EMAIL
ENTRADAS DESTACADAS
1
Arquitecturas Basadas en Microservicios : Spring Cloud Ribbon o
POSTED ON12.03.19
O
3 MIN
2
Arquitecturas basadas en Microservicios: Spring Cloud Feign o
POSTED ON27.02.19
O
4 MIN
3
2gether, the first collaborative bank o
POSTED ON16.01.19
O
7 MIN
4
MongoDB – Querying II o
POSTED ON07.11.18
O
4 MIN
5
Arquitecturas basadas en microservicios: Spring Cloud Gateway o
POSTED ON19.09.18
O
3 MIN
ENTRADAS ALEATORIAS
Blockchain: Introducción
POSTED ON29.05.17
4 MIN
JAVIER DE LA ROSA FERNÁNDEZ
VER PUBLICACIÓN
Transformaciones PowerCenter: Joiner
POSTED ON16.05.17
2 MIN
JUAN CARLOS FERNÁNDEZ
VER PUBLICACIÓN
Denormalización: Informatica PowerCenter
POSTED ON22.05.18
2 MIN
CARLOS SOSA
VER PUBLICACIÓN
Arquitecturas basadas en microservicios: Spring Cloud
POSTED ON06.11.17
3 MIN RAFA RÍOS
VER PUBLICACIÓN
2gether, the first collaborative bank
POSTED ON16.01.19
7 MIN BI GEEK
VER PUBLICACIÓN