Clase 05 - Data Governance y Data Security aplicado a Big Data

Valorización de proyectos Big Data Clase 5: Data Governance y Data Security aplicado a Big Data 1. Introducción al Go

Views 67 Downloads 1 File size 322KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

  • Author / Uploaded
  • Tito
Citation preview

Valorización de proyectos Big Data Clase 5: Data Governance y Data Security aplicado a Big Data

1.

Introducción al Gobierno de Datos 1.1. ¿Qué es gobierno de datos?

En la actualidad los datos que gestionan las empresas constituyen un activo importantísimo para generar un diferenciador en el mercado, pero esto no se consigue sin una gestión que forme parte de un programa o proceso continuo de gobernabilidad que permita establecer normas y políticas claras y documentadas apalancando el control de los datos. Para poder establecer programas de Gobierno de Datos es recomendable establecer en las organizaciones un área formal dentro de las compañías llamadas ODG (Oficina de Data Governance) la cual es la responsable de establecer en conjunto con las áreas de negocio las políticas y normas de calidad de datos, definición de roles de custodia, seguimiento de las métricas para la calidad de los datos. Esta oficina alinea a todo la empresa en una estrategia de datos consistente con la estrategia de negocio. Para la gestión de los datos es fundamental seguir los diez componentes principales de la gestión de datos: 1. Gobierno de los datos: El ejercicio de la autoridad y el control (planificación, supervisión y aplicación) a través de la gestión de activos de datos. El gobierno de datos es la planificación y control de gestión de datos de alto nivel. 2. Datos Administración de Arquitectura: Definición de las necesidades de datos de la empresa, y el diseño de los planos maestros para satisfacer esas necesidades. Esta función incluye el desarrollo y mantenimiento de la arquitectura de datos de la empresa, dentro del contexto de toda la arquitectura de la empresa, y su conexión con las soluciones de sistemas de aplicación y proyectos que implementan la arquitectura empresarial. 3. Desarrollo de datos: diseño, implementación y mantenimiento de soluciones para satisfacer las necesidades de datos de la empresa. Las actividades centradas en datos dentro del ciclo de vida de desarrollo de sistemas (SDLC), incluyendo el modelado de datos, el análisis de los requisitos de datos, y el diseño, implementación y mantenimiento de los componentes de las soluciones relacionadas con los datos bases de datos. 4. Administración de Operaciones de datos: Planificación, control y apoyo a los activos de datos estructurados en todo el ciclo de vida de los datos, desde la creación y la adquisición a través de archivos y de purga. 5. Gestión de la Seguridad de Datos: Planificación, desarrollo y ejecución de las políticas y procedimientos de seguridad para proporcionar la debida autenticación, autorización, acceso y auditoría de datos e información. 6. Referencia y Gestión de datos maestros: planificación, implementación y actividades de control para garantizar la coherencia con una “versión de oro” de los valores de datos contextuales.

7. Almacenamiento de Datos y Gestión de Inteligencia de negocios: planificación, ejecución y control de procesos para proporcionar datos de soporte de decisiones y el apoyo a los trabajadores del conocimiento que participan en la presentación de informes, consultas y análisis. 8. De documentos y gestión de contenidos: planificación, implementación y actividades de control para almacenar, proteger y acceder a datos que se encuentran dentro de los archivos electrónicos y registros físicos (incluyendo textos, gráficos, imágenes, audio y vídeo). 9. Gestión de metadatos: planificación, implementación y actividades de control para facilitar el acceso a la alta calidad, la meta-dato integrada. 10. Gestión de la Calidad de datos: las actividades de planificación, ejecución y control que se aplican las técnicas de gestión de calidad para medir, evaluar, mejorar y asegurar la idoneidad de los datos para su uso. 1.2. Roles de Data Governance El Gobierno del Dato no es un reto exclusivo de IT, y requiere de una visión de negocio tanto para identificar y controlar los datos clave corporativos como para adaptar los procesos de negocio a una gestión más unificada de los datos maestros de la organización. ➢ Data Owner: El Data Owner es el responsable de los Datos Maestros donde este rol pertenece al área de Negocio, dentro de las funciones del rol este debe: definir los requerimientos de los datos maestros asociados a cada ámbito del Gobierno Dato, Velar por el cumplimiento de las normas y procesos del Gobierno del Dato, Definir criterios de calidad del Dato Maestro, Definir las consideraciones para gestionar el ciclo de vida del Dato Maestro (Historia, Activación, Desactivación). ➢ Data Steward: Es el responsable de las orquestación técnica en cada dominio funcional, la definición de políticas, normas, estándares, procesos y servicios del GD, auditoria de calidad, seguridad y ciclo de vida. Por lo general este rol pertenece más al ámbito tecnológico, donde debe: Definir las políticas, normas, estándares, procedimiento, procesos y servicios en su ámbito de actuación, Definir las auditorias en su ámbito de actuación, Comunicar las incidencias de los DMs y sus planes de actuación, Plantear mejores en la definición de los DMs (calidad, seguridad, modelado, trazabilidad). ➢ Chief Data Officer (CDO): Es el responsable de la Oficina de Gobierno del Dato el cual coordina y facilita esfuerzos del área del gobierno del dato, este rol ejecutivo debe entre otras funciones debe: Definir los objetivos del modelo de gestión y actividades de la DGO, Administrar, dirigir, y controlar la oficina del gobierno del dato, Definir la estrategia de prioridades de administración y entrega del DM (Dato Maestro) en la compañía. Identificar las oportunidades de negocio producto del análisis de los DMs. Evangelizar el valor del DM y Gobierno de Datos como un activo estratégico del negocio. Enfatizar la ejecución eficiente de los procesos del Gobierno de Datos

implementado. Solucionar los problemas de alineación con un gobierno del dato más integrado y estrategias de gestión de calidad. En el Gobierno de Datos no todos los roles son obligatorios y de hecho existen otros como el Data Custodian y Data Manager, y su necesidad de designación dependerá de la complejidad, tamaño de la organización, cantidad de sistemas, en cuanto a los datos a gobernar.

1.3. ¿por qué es importante para las organizaciones? Los datos y la información generada a partir de datos, son ampliamente reconocidos como activos de la empresa. -

Ninguna empresa puede ser eficaz sin datos de alta calidad. Las organizaciones de hoy dependen de sus activos de datos para tomar decisiones más informadas y más eficaces. Los líderes del mercado están aprovechando sus activos de datos mediante la creación de ventajas competitivas a través de: o Un mayor conocimiento de sus clientes, los usos innovadores de información, y la eficiencia operativa. o Las empresas están utilizando datos para ofrecer mejores productos y servicios, reducir los costos y los riesgos de control. o Las agencias gubernamentales, instituciones educativas y organizaciones sin fines de lucro también necesitan datos de alta calidad para guiar sus actividades operacionales, tácticas y estratégicas. o A medida que las organizaciones necesitan y cada vez más dependen de los datos, el valor comercial de los activos de datos se puede establecer con mayor claridad. - La cantidad de datos disponibles en el mundo está creciendo a una velocidad asombrosa. Investigadores de la Universidad de California en Berkeley estimación de que el mundo produce entre 1 y 2 mil millones de bytes de datos al año. A menudo parece que estamos ahogando en la información, sin embargo, para muchas decisiones importantes experimentamos vacíos de información (la diferencia entre lo que sabemos y lo que necesitamos saber para tomar una decisión efectiva). Los vacíos de información representan pasivos de la empresa con potencialmente profundos impactos sobre la eficacia operativa y la rentabilidad. 1.4. DAMA la guía de soporte para el Information Governance y la Gestión de Datos La Asociación de Gestión de Datos (DAMA Internacional) es la ​principal organización de datos para los profesionales de todo el mundo. DAMA International es una organización internacional sin fines de lucro, con más de 7500 miembros en 40 capítulos en todo el

mundo. Su objetivo es promover el entendimiento, desarrollo y práctica de la gestión de datos e información para apoyar las estrategias de negocio. DAMA International entrega la guía DAMA-DMBOK siendo una introducción definitiva para la Gestión de Datos la cual presenta brevemente los conceptos y se identifican los objetivos de gestión de datos, funciones y actividades, entregables, roles primarios, los principios, la tecnología y las cuestiones de organización / culturales. Como introducción definitiva, los objetivos de la Guía DAMA-DMBOK son: 1. Para construir un consenso para una vista de aplicación general de las funciones de gestión de datos. 2. Para proporcionar las definiciones estándar de funciones de uso general de gestión de datos, entregables, roles y otra terminología. 3. Para identificar los principios para la gestión de datos de guía. 4. A la vista general buenas prácticas comúnmente aceptadas ampliamente, métodos y técnicas adoptadas y enfoques alternativos significativos, sin referencia a los proveedores de tecnología específica o sus productos. 5. Para identificar brevemente los problemas organizativos y culturales comunes. 6. Para aclarar el alcance y los límites de la gestión de datos. 7. Para guiar a los lectores a recursos adicionales para una mayor comprensión. El Marco funcional del DAMA nace después de identificar las siguientes necesidades: • Un modelo de proceso integral y comúnmente aceptado para la función de gestión de datos, la definición de una vista estándar de actividades. • Un entorno de la organización, incluyendo los objetivos, principios, actividades, roles, entregables principales, la tecnología, habilidades, métricas y estructuras organizativas. • Un marco estándar para la discusión de cada aspecto de la gestión de datos en una cultura de organización. A continuación las diez funciones principales que promueve DAMA-DBOK para la Gobernanza de Datos:

2.

Introducción a la Seguridad de Datos

La Gestión de seguridad de datos es la planificación, desarrollo y ejecución de las políticas de seguridad y procedimientos para proporcionar la correcta autenticación, autorización, acceso y auditoría de los activos de datos y la información. Los procedimientos y políticas de seguridad de datos eficaz garantizan que las personas pueden utilizar y actualizar los datos de la manera correcta, y que todo acceso inadecuado y actualización es restringido. Comprender y cumplir con los intereses de privacidad y confidencialidad y necesidades de todos los actores es en el mayor interés de la organización. Cliente, proveedor y relaciones constitutivas de todos confían y dependen del uso responsable de los datos.

2.1. Conceptos y Actividades El objetivo final de la administración de seguridad de datos es proteger los activos de información en concordancia con las regulaciones de privacidad y confidencialidad y los requerimientos del negocio. Estos requisitos vienen de varias fuentes diferentes: • Preocupaciones de los Stakeholders: Las organizaciones deben reconocer las necesidades de privacidad y confidencialidad de las partes interesadas, incluyendo clientes, pacientes, estudiantes, ciudadanos, proveedores o socios comerciales. Los stakeholders son los

propietarios finales de los datos sobre ellos, y todos los miembros de la organización deben ser un administrador responsable de los datos. • Las regulaciones gubernamentales: Las regulaciones del gobierno protegen algunos de los intereses de seguridad de las partes interesadas. Algunas regulaciones restringen el acceso a la información, mientras que otras normas garantizar la apertura, la transparencia y la rendición de cuentas. • Preocupaciones de negocios de los stakeholders: Cada organización tiene su propia propiedad datos a proteger; garantizar la ventaja competitiva proporcionada por la propiedad intelectual y conocimiento íntimo de las necesidades del cliente y la empresa es la piedra angular en cualquier plan de negocios. • Necesidades legítimas de acceso: Los encargados de la seguridad de datos también deben entender las necesidades legítimas de acceso a datos. Procesos, reglas y estrategia de negocio requieren de individuos en determinados roles a asumir la responsabilidad para el acceso y mantenimiento de ciertos datos. Los requisitos de seguridad de datos y los procedimientos para cumplir con esto pueden clasificarse en cuatro grupos básicos: • Autenticación: Validar que los usuarios son quién ellos dicen que son. • Autorización: Identificar a las personas de derecha y concederles los privilegios derecho a vistas específicas, apropiadas de los datos. • Acceso: Permiten a estos individuos y sus privilegios de manera oportuna. • Auditoría: Revisión de actividad de usuario y acciones de seguridad para garantizar el cumplimiento de las normas y la conformidad con políticas y normas.

2.2. Requerimientos del Negocio La implementación de seguridad de los datos dentro de una empresa comienza con una comprensión de los requerimientos del negocio. La misión y la estrategia que fluye a través de la estrategia de datos deben ser el factor guía en la planificación de las políticas de seguridad de datos. Las necesidades de la empresa definen el grado de rigidez necesario para la seguridad de los datos. El tamaño de la empresa y la industria a la que pertenece gran influencia de este grado. Por ejemplo, una financiera o una empresa de valores en los Estados Unidos son altamente reglamentada y, independientemente del tamaño, necesita mantener los estándares de seguridad de datos rigurosamente. 2.3. Políticas de Seguridad

La definición de las políticas de seguridad de datos según los requerimientos de seguridad de datos son un esfuerzo colaborativo entre los administradores de seguridad, Data Steward, equipos de auditoría interna y externa y el departamento jurídico. Los profesionales de seguridad de datos a veces toman una aproximación rigurosa a la seguridad y en el proceso pueden causar impedimentos para los consumidores de datos. Desarrollar políticas de seguridad de datos para que el cumplimiento es más fácil que el incumplimiento de las normas. El Consejo de gobierno de datos debe revisar y aprobar la política de seguridad de datos de alto nivel. •

Ejecución de la política requiere satisfacer las cuatro A para asegurar los activos de información: autenticación, autorización, acceso y auditoría. 2.4. Requisitos regulatorios La rapidez y la evolución exponencial creciente de los datos exigen a las organizaciones cumplir con un conjunto de regulaciones en cuanto a los aspectos éticos y legales. Por ejemplo: ● ● ●

ley Sarbanes-Oxley de 2002 canadiense 198 de la ley ley CLERP de Australia Acuerdo de la Unión Europea de Basilea II, Para las instituciones financieras de la región.

2.5. Definición de normas de Seguridad Para la definición de normas de seguridad se deben considerar aspectos, entre otros, como: • Herramientas utilizadas para administrar la seguridad de los datos. • Mecanismos y estándares de la encriptamiento de datos. • Pautas de accesibilidad a los proveedores externos y contratistas. • Protocolos de transmisión de datos por internet. • Procedimientos para la creación de contraseñas (nivel de complejidad que asegura la seguridad de custodia) 2.6. GDPR (General Data Protection Regulation) La GDPR es la nueva normativa europea de protección de datos, que se aplicará a partir del día 25 de Mayo del 2018. El principal objetivo de esta normativa es dotar de mayor poder a los ciudadanos para el control de sus datos personales y el tratamiento de los mismos, así como homogeneizar las distintas regulaciones de los países de la Unión Europea. GDPR afecta a todas las empresas que tratan datos personales de todos los ciudadanos europeos. El impacto de la aplicación de esta normativa abarca desde datos estructurados y no estructurados, y los repositorios de información van desde el almacenamiento en bases de datos tradicionales, Plataformas Big Data, Correos electrónicos, DataWarehouse incluso a la Nube. Los ámbitos de Gobernabilidad de estos datos que formarán parte de estas restricciones deben tener como pilares: Creación: Clasificación de los datos para identificar los datos afectados. Almacenamiento: Encriptación de datos para asegurar su protección. Acceso: Anonimación de datos, enmascaramiento y acceso correcto de los datos

Procesamiento: Perfilamiento correcto de datos, administración de contenidos, monitoreo y actividad de Logs Archivo: Definir y adjuntar políticas de Retención, políticas de eliminación de datos personales.

3.

Gobierno de Datos y la Seguridad a entornos Big Data 3.1.

Introducción

Big Data es una de esas tecnologías disruptivas que de hecho está cambiando cómo ver y usar la información. Uno de los principales cambios en el uso de la información debido a los grandes volúmenes de datos que se encuentran en las redes sociales. En el pasado las organizaciones tendrían que esperar días, semanas y a veces de forma tardía poder detectar las respuestas del consumidor a las campañas de publicidad y producto. Ahora con entornos de redes sociales como Facebook y Twitter, las reacciones instantáneas y viscerales para campañas de marketing pueden ser capturadas y analizadas. No es simplemente el tamaño y la diferencia de volúmenes de Big Data, también en su inmediatez. Evaluar correctamente las diferentes implicancias del Big Data en el manejo de la información, por lo que primero necesitamos revisar las dimensiones de Big Data: Datos Internos Estructurados​: Por ej. El Alto volumen de datos, Como la lectura de inteligente que mide los pases de la tarjeta de acceso al transporte público. Datos Internos No Estructurados​: Por ej. Datos de seguimiento de Clic del cliente, Tweets y mensajes internos, Gestión de documentos como documentos legales. Datos Externos Estructurados​: Por ej. Alto volúmenes de datos como la ingesta de proveedores externos. Datos Externos No Estructurados:​ Por ej. Actividad de Redes Sociales. Cada tipo de datos tendrá un conjunto diferente de descubrimiento, control y patrones de uso en la organización que tenga impactos significativos del control de la información sobre propiedad de datos, administración de datos, calidad de datos y gestión de metadatos. Considerando que el Big Data convive con los sistemas transaccionales y no los reemplaza, al contrario esto debe ser desde una mirada de ​Big Data integrado como agregación de dos o más tipos de datos grandes, por ejemplo, integrar datos estructurados externos como Twitter y datos internos estructurados como un cliente de la tabla en una base de datos relacional.

El Ciclo de vida de Big Data se divide en tres etapas las que permiten dar cobertura a todas las actividades que debes ser considerada en el ámbito de Big Data y los datos que estas tecnologías pueden gestionar. Las etapas son:

3.2.

Fase Big Data Discovery

Big Data Discovery corresponde a la investigación y análisis de nuevas fuentes de información que pueden entregar un conjunto de conocimiento y sabiduría en la organización.

3.2.1. El Rol del Data Steward en Big Data Uno de los temas principales de este curso es aumentar el valor de manejo de la información a la organización más amplia. Esto se logra a través del manejo de la información en el proceso de desarrollo. Otro enfoque importante es aprovechar al Data Stewards en funciones más allá del control tradicional de la información. Este tipo de análisis de datos no ha sido por lo general la competencia de los data steward, sino de científicos datos, analistas de negocios y analistas de asignación de datos de integración de datos incluso. Sin embargo, si uno considera la comprensión de un Data Steward las definiciones de datos y reglas de negocio de una organización y su conocimiento de las áreas de dominio, los Data Stewards son en algunos casos el rol mejor calificado en una organización para llevar a cabo el descubrimiento para el uso de Big Data. Las principales actividades en la etapa de Big Data Discovery son: • • • •

Revisión cada nueva gran fuente de datos por tipo Entender los principales temas de Big Data Identificar patrones de uso potencial Seguridad desde una perspectiva de seguridad de información o ¿Son datos seguros de usar? o ¿Es legal usar estos datos?

Se espera que el Data Steward para el área de negocio particular sería responsable de trabajar con los actores técnicos y de negocios en el proceso de descubrimiento, pero el Data Steward es también responsable de liderar cada una de estas actividades y tareas. El Data Steward conduce la Fase de Descubrimiento, las tareas de manejo de la información típicas en cualquier nueva creación de datos en la organización (o uso) como definición de datos, propiedad de datos, criterios de calidad de datos y retención de datos 3.2.2. La paradoja del Big Data y el Data Steward Típicamente un Data Steward es parte del área de negocio que genera y analiza los datos de una función específica en la organización, Por ejemplo: El Chief Marketing Officer es el responsable de los datos de los datos transaccionales de Ventas y Marketing, estas definiciones y reglas de negocio son fácilmente creadas, puestos en operación e incorporados a la estructura de datos de la organización. La pregunta es ¿Cómo sería una organización con datos gobernados hacer cumplir las normas de propiedad de datos para datos no estructurados externos como Twitter y Facebook?

En el siguiente capítulo examina cómo capturar y aplicar controles de Data Governance en Big Data. 3.3.

Fase Big Data Control

Antiguamente las organizaciones generaban sus análisis de gestión sobre su información transacción y estructurada, la cual es de fácil entendimiento y comprensión, el alcance actual de los datos que hoy manejan las empresas se expande desde información obtenida desde un XML o la web, bajo este contexto para Big Data el reto del manejo correcto de los datos desde la perspectiva de control también expande el enfoque que estas deben adoptar para el uso de los datos dentro y fuera de la organización. El Big Data Control, o etapa de Control se define como el enfoque en el manejo de la información para integrar Big Data para el uso de la organización de un modo seguro que garantice el máximo beneficio sin riesgo indebido. Determina cómo integrar mejor Big Data en la organización, tanto desde la perspectiva técnica y de seguridad. Los cuatro tipos de datos (Datos Estructurados internos y externos, Datos No estructurados internos y externos) de Big Data generan las preguntas "¿quién posee los datos?" y "¿Cómo es administrado"? El ejemplo de Facebook es que por una lado la “Organización Facebook” es responsable de administrar su entorno, como son responsables del contenido de la actividad en su plataforma aún está en cuestionamiento. Por un lado Facebook puede declarar e informar todas las políticas y procedimientos sobre el uso de los datos pero al final de cuentas el contenido es creado por millones de usuarios y cada uno de acuerdo a la utilización que desee darle. ¿Cómo puede una organización efectivamente controlar y utilizar esta información de manera segura y controlada? El tema es que las empresas siempre han utilizado datos externos a través de la adquisición de datos para análisis de campañas de Marketing y otros propósitos. El Data Ownership Big Data debe diferenciar los datos externos vs internos en términos de creación pero será consistente en cuanto a la definición, uso y retención.

3.3.1. Controlando Big Data a través de procesos de Ingesta En los procesos de Ingesta o Admisión de datos para entornos Big Data se determinará los niveles de propiedad basados en cómo estos se integrarán con la organización. Esto dependerá de cómo la organización dirige el uso de la información.

3.3.2. Área Staging para Big Data Discovery Muchas organizaciones establecen entornos Hadoop para almacenar Petabytes de información para la etapa de Big Data Discovery. Esto trae consigo el de desafío entre el control/seguridad y el descubrimiento. A menudo ocurre que el Gobierno de Datos controla demasiado y podría reprimir el descubrimiento de Big Data. El enfoque no debe pretender poner sobre todo los controles de Big Data para la obtención de datos nuevos que entran al medio ambiente. Una vez la información potencialmente útil ha sido identificada, entonces deben aplicarse los típicos procesos de Data Governance antes de

la obtención de estos nuevos datos dentro de un proceso iterativo, los controles que deben aplicarse en Big Data son: Definición de Datos​: Debe ser aplicada a los datos encontrados dentro de Big Data para los que se pretenden utilizar en el curso de propósitos transaccionales o analíticas. Estos datos deben pasar a través de todo el rigor de que negocio y definiciones técnicas, criterios de calidad de datos, requerimientos de retención de datos y propiedad de datos. Calidad de Datos​: Como se indica en la ​Definición de Datos, que de los datos que se descubre y el cómo serán utilizados de manera continua debe tener criterios de calidad de datos definidos. Es útil para entender cómo se ha generado el Big Data para entender si hay criterios de Calidad de Datos implícitas (o explícitas de hecho) que pueden ser recogidos y aprovechados dentro de la organización. Seguridad​: El Control de la Seguridad en el entorno de Big Data debe basarse en las fuentes y tipos de información. El mismo tipo de cuidado que se aplica a datos estructurados para ciertos zonas que se aplicarían con este patrón de uso y los mismos tipos de controles deben ser revisados y forzados por el Chief Information Security Officer (CISO). Cada fuente de datos debe ser considerada y revisada por el CISO, antes de uso en la organización. Esta seguridad debe considerar: • Higiene de datos – ¿qué tipo de datos es, qué tan confiable es? ¿Podría contener ocultos virus Troyanos o gusanos que podrían poner en peligro el ambiente interno de la TI? • Controles reglamentarios: ¿es aceptable usar los datos? ¿Violan las leyes de privacidad del consumidor? Retención​: Es a menudo el análisis de Big Data es útil por un tiempo limitado. Esta hipótesis debe ser verificada y si no es el caso, se debe definir un método para almacenar y recuperar estos análisis. Deben establecerse políticas de actualización y eliminación para estos entornos no difieren de los entornos de gestión de información tradicional.

3.3.3. Integración de Big Data El segundo patrón de Big Data integra los hallazgos de datos en los entornos de Staging dentro de la organización, dentro de los ambientes de Business Intelligence para poder ampliar o crear nuevos análisis. Big Data que debe integrarse en el conjunto más amplio de datos organizacionales debe tener controles de manejo de la información aplicados en el punto de integración. Esto incluye: Definición de Datos​: Definición de Datos técnicos y de negocio deben aplicarse a los orígenes de datos de Big Data similar tal como a los datos transaccionales. Para el Big Data que se obtendrá de forma continua, los Data Steward deberían trabajar con stakeholders apropiados para aprovechar (si está disponible) las definiciones comerciales y técnicas externas para proporcionar el estándar interno de Data Governance para esos datos.

Calidad de Datos​: Para Big Data siendo traído en e integrado en el entorno más amplio de gestión de información se recomienda que sigue el mismo enfoque de Calidad de los Datos como otros datos. Los criterios de calidad de datos son conducidos por el objetivo, obligando así a todas las fuentes, independientemente de sus niveles de calidad de los datos, para tener un nivel constante de Calidad de Datos. Seguridad​: Muchas de las preocupaciones de la seguridad externa ya se han abordado cuando el entorno de Staging para Big Data fue seleccionado. En caso que existan preocupaciones para para la seguridad interna estos deben centrarse en la integración del nuevo Big Data. Retención​: Aunque es poco probable que ampliar la información existente con Big Data va a cambiar los requisitos de negocio para la retención de datos, debe ser considerado y documentado. Este análisis también debe considerar el costo beneficio en el caso de la inclusión de Big Data cambia significativamente las cantidades de datos extendidas en la organización. 3.4.

Uso de Big Data

El uso de Big Data definirá como los Data Steward ayudarán a conducir a la unidad de negocio aportando el valor de las nuevas fuentes de datos de Big Data. Primero es importante examinar lo que se tan diferente sobre el uso de Big Data en comparación con lo que las organizaciones han estado haciendo durante los últimos 20 años. Uno de los problemas actuales con los entornos de Business Intelligence ha sido el problema de latencia. Cuando la mayoría de los profesionales piensan en inteligencia de negocios, visualizar la maduración de la disciplina de recopilación de datos transaccionales periódicamente para producir informes y recoger datos transaccionales periódicamente para producir análisis que permiten análisis mediante técnicas de "perforar" (“drill through”). Mientras que las empresas se han beneficiado de hecho de las capacidades ampliadas de informes estáticos de analítica tradicional, siempre ha sido un problema de retardo o latencia. Hace 20 años la latencia a menudo significaba informes son ejecutados y no están listos hasta final de mes. Big Data ofrece una inmediatez a datos que no ha experimentado antes en las organizaciones y se abre un sinfín de nuevas oportunidades que no habían sido considerados, ya que no habían sido posibles. Ayudar a las organizaciones coincide con estas nuevas oportunidades con las nuevas capacidades del uso del Big Data que son el objetivo de los Data Steward.

Referencias Bibliográficas: ● ●

The DAMA Guide to the Data Management Body of Knowledge (DAMA-DMBOK) Performing Information Governance: A Step-by-Step Guide to Making Information Governance Work