AWS Data-Lake Ebook ES

Red de socios LIBRO ELECTRÓNICO: Creación de un lago de datos en AWS Contenido ¿Qué es un lago de datos? ..........

Views 76 Downloads 0 File size 446KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Red de socios

LIBRO ELECTRÓNICO:

Creación de un lago de datos en AWS

Contenido ¿Qué es un lago de datos?

............................................................... 2

Beneficios asociados al uso de lagos de datos en AWS Creación de un lago de datos en AWS

............................................. 4

Socios destacados en el ámbito de lagos de datos Introducción

..................... 3 ........................... 5

.................................................. 7

LIBRO ELECTRÓNICO: CREACIÓN DE UN LAGO DE DATOS EN AWS

1

¿Qué es un lago de datos? Las organizaciones se ven obligadas a gestionar volúmenes de datos cada vez más grandes, provenientes de más fuentes y con más tipos de datos que nunca. Ante unos volúmenes de datos enormes y heterogéneos, muchas organizaciones están descubriendo que, para poder proporcionar la información empresarial oportuna que deben proveer, precisan de una solución de almacenamiento y análisis que les pueda brindar más velocidad y más flexibilidad que las obtienen de los sistemas heredados. Los lagos de datos, cada vez más utilizados, ofrecen una novedosa manera de almacenar y analizar datos abordando muchos de estos desafíos gracias a la posibilidad para las organizaciones de almacenar todos sus datos en un único repositorio centralizado. Al poder almacenarse en su formato original, no es necesario convertir los datos a esquemas predefinidos antes de adquirirlos, lo cual permite almacenar todos los datos tanto de manera estructurada como sin estructurar, y en unos plazos mínimos. Al contar con un lago de datos en AWS ya no tendrá que saber qué preguntas deberá hacerse sobre sus datos antes de almacenarlos, y dispondrá de una plataforma flexible para analizarlos. En el núcleo de los lagos de datos basados en AWS está Amazon Simple Storage Service (S3), un servicio que proporciona capacidad de almacenamiento en la nube seguro, rentable, duradero y escalable. AWS ofrece igualmente una amplia gama de servicios que le ayudarán a implementar un robusto sistema de seguridad para su lago de datos, como, entre otros, controles de acceso, aislamiento virtual, cifrado de 256 bits y registro y monitorización. Los datos se pueden transferir al lago de datos de varias maneras; por ejemplo, a través de servicios como Amazon Kinesis, que le permite adquirir datos en tiempo real, AWS Import/Export, un servicio mediante el cual podrá enviar a AWS un dispositivo de almacenamiento portátil con sus datos, AWS Import/Export Snowball, un dispositivo seguro que AWS le envía para adquirir los datos por lotes, AWS Storage Gateway, que le permite conectarse a dispositivos de software locales con su sistema de almacenamiento basado en la nube de AWS, o AWS Direct Connect, que le brinda conectividad de red dedicada entre su centro de datos y AWS.



Al contar con un lago de datos en AWS ya no tendrá que saber qué preguntas deberá hacerse sobre sus datos antes de almacenarlos, y dispondrá de una plataforma flexible para analizarlos.



LIBRO ELECTRÓNICO: CREACIÓN DE UN LAGO DE DATOS EN AWS

2

Beneficios asociados al uso de lagos de datos en AWS Alojar su lago de datos en AWS le aporta distintos beneficios, entre ellos: Almacenamiento rentable de los datos Amazon S3 proporciona un sistema de almacenamiento rentable y duradero que le permite almacenar cantidades de datos casi ilimitadas, de cualquier tipo y de cualquier fuente. Dado que al almacenar los datos en Amazon S3 no se precisa aplicar transformaciones antes, dispondrá de flexibilidad para aplicar esquemas para realizar análisis de datos bajo demanda. Esto le permitirá responder más fácilmente a nuevas preguntas a medida que vayan surgiendo, y mejorar los plazos de valoración. Fácil recopilación y adquisición de los datos Los datos que irán al lago de datos se pueden adquirir de varias maneras; por ejemplo, a través de servicios como Amazon Kinesis, que le permite adquirir datos en tiempo real; AWS Import/Export, un servicio mediante el cual podrá enviar a AWS un dispositivo de almacenamiento portátil con sus datos; AWS Import/Export Snowball, un dispositivo seguro que AWS le envía para adquirir los datos por lotes; AWS Storage Gateway, que le permite conectarse a dispositivos de software locales con su sistema de almacenamiento basado en la nube de AWS; o AWS Direct Connect, que le brinda conectividad de red dedicada entre su centro de datos y AWS. Seguridad y conformidad Alojar su lago de datos en AWS le permite obtener acceso a una infraestructura de nube muy segura, así como a una exhaustiva oferta de servicios de seguridad diseñados para proteger sus datos en todo momento. Como cliente de AWS, se beneficiará de una arquitectura de red y un centro de datos diseñados para satisfacer los requisitos de seguridad de las organizaciones más exigentes. AWS gestiona también activamente decenas de programas de conformidad normativa en su infraestructura, lo cual ayuda a las organizaciones a cumplir fácilmente con los estándares de conformidad normativa, como PCI DSS, HIPAA y FedRAMP. La plataforma más completa para big data AWS le proporciona capacidad de acceso rápido a recursos de TI tanto flexibles como económicos para que pueda ampliar virtualmente cualquier aplicación de big data, incluidas aquellas de almacenamiento de datos, análisis de secuencias de clics, detección de fraudes, motores de recomendaciones, ETL basada en eventos, informática sin servidor y procesamiento en el ámbito de Internet de las cosas. Con AWS ya no será necesario invertir mucho tiempo y dinero para empezar a construir y mantener una infraestructura. En su lugar, podrá aprovisionar exactamente el tipo y el tamaño de recursos que necesite para dar potencia a aplicaciones de análisis de big data. LIBRO ELECTRÓNICO: CREACIÓN DE UN LAGO DE DATOS EN AWS

3

Creación de un lago de datos en AWS La solución de lago de datos en AWS hace uso central de Amazon Simple Storage Service (S3) para poder brindar un almacenamiento seguro, rentable, duradero y escalable. Puede agregar rápidamente y recopilar fácilmente datos en Amazon S3 desde una amplia variedad de fuentes mediante servicios como AWS Snowball o flujos de entrega Amazon Kinesis Firehose. Amazon S3 ofrece también un amplio conjunto de características que le ayudarán a garantizar un robusto sistema de seguridad para su lago de datos, como, entre otros, controles y políticas de acceso, transferencia de datos sobre SSL, cifrado en reposo y registro y monitorización. Para administrar los datos puede usar servicios como Amazon DynamoDB y Amazon ElasticSearch para catalogar e indexar los datos en Amazon S3. El uso de funciones de AWS Lambda que activa directamente Amazon S3 en respuesta a eventos como la carga de nuevos datos le permiten mantener su catálogo al día fácilmente. Con Amazon API Gateway podrá crear una API que actúe como “puerta principal” para que las aplicaciones puedan obtener acceso a los datos rápidamente y de manera segura autorizando este acceso a través de AWS Identity and Access Management (IAM) y Amazon Cognito. AWS proporciona capacidad de acceso rápido y servicios de bajo costo, como Amazon EMR, Amazon Redshift y Amazon Machine Learning, para analizar los datos almacenados en Amazon S3 y obtener acceso a ellos, pudiendo escalar rápidamente cualquier solución analítica. Este tipo de soluciones podrían ser, por ejemplo, aquellas de almacenamiento de datos, análisis de secuencias de clics, detección de fraudes, motores de recomendaciones, ETL basada en eventos y procesamiento en el ámbito de Internet de las cosas. El uso de AWS permite aprovisionar fácilmente exactamente los recursos y la escala que se necesite para dar potencia a cualquier aplicación de big data, cumplir con la demanda y mejorar en innovación.

Catálogo y búsqueda

Interfaz de usuario y acceso

Obtenga acceso a y busque metadatos

Proporcione a sus usuarios un acceso seguro y fácil

DynamoDB

ElastiSearch

API Gateway

Identity and Access Management

Cognito

Adquisición de datos

Procesamiento y análisis

Introduzca sus datos en S3 de forma rápida y segura

Sírvase de análisis predictivos y prescriptivo para comprender sus datos mejor

Kinesis

Almacenamiento central

Machine Learning

Almacenamiento seguro y rentable en Amazon S3

Direct Connect

QuickSight

S3

Snowball

EMR

Database Migration Service

Redshift

Protección y seguridad

Utilice el sistema de concesión de derechos para proteger sus datos y asegurarse de que se verifican las identidades de los usuarios STS

Identity and Access Management

Security Token Service

CloudWatch

CloudTrail

Key Management Service

LIBRO ELECTRÓNICO: CREACIÓN DE UN LAGO DE DATOS EN AWS

4

Introducción Para obtener más información acerca de los lagos de datos en AWS, visite: > Sitio web de Amazon Web Services > Big Data en AWS > Creación de un lago de datos en AWS (vídeo) Acerca de AWS Amazon Web Services ha sido durante 10 años la plataforma de nube más completa y geográficamente más utilizada del mundo. AWS ofrece más de 70 servicios con todas las características necesarias para computación, almacenamiento, bases de datos, análisis, dispositivos móviles, Internet de las cosas (IoT) y aplicaciones empresariales desde 33 zonas de disponibilidad (AZ) en 13 regiones geográficas ubicadas en EE. UU., Australia, Brasil, China, Alemania, Irlanda, Japón, Corea y Singapur. Más de un millón de clientes activos en todo el mundo (incluidas las empresas emergentes de más rápido crecimiento, las empresas más grandes y entidades gubernamentales de primer orden) confían en los servicios de AWS para dar potencia a sus infraestructuras, hacerlas más ágiles y reducir costos. Para obtener más información acerca de AWS, visite aws.amazon.com.

LIBRO ELECTRÓNICO: CREACIÓN DE UN LAGO DE DATOS EN AWS

7

Red de socios

© 2017, Amazon Web Services, Inc. o sus empresas afiliadas. Todos los derechos reservados.