El futuro de la Base de Datos Juan Caserta Sr. Sales Consultant Los Tres Objetivos de TI • Proveer: • La mejor informa
Views 365 Downloads 3 File size 3MB
El futuro de la Base de Datos Juan Caserta Sr. Sales Consultant
Los Tres Objetivos de TI • Proveer: • La mejor información • Al menor costo • Con la más alta calidad de servicio
• Los límites están definidos por las tecnologías existentes
Cost
Information Current Solutions
Quality of Service
Avances Los avances en la tecnología pueden habilitar nuevos enfoques para redefinir los límites de las posibles soluciones
Cost Cost
Information
Information Current Solutions
Quality of Service
New Technologies
Future Solutions Quality of Service
• TI ha estado avanzando durante los últimos 40 años • Podrá el futuro traernos nuevos avances? • Se ha convertido la TI en un commodity suficientemente bueno?
Hay un Futuro para las DBMS ?
• De manera similar algunos opinan: • DBMS no es importante • DBMS es una tecnología madura • DBMS es un commodity suficientemente bueno
• La mejor estrategia es • Gastar menos • Ser un “seguidor” (no invovar)
Por Otro Lado…
• Los usuarios tiene otra opinión • Ellos opinan: • TI es lento para adaptarse al negocio • TI es caro • TI es poco confiable
El Estado Actual de TI •
Se ha adoptado como práctica común la implementación de sistemas aislados suficientemente buenos para resolver problemas especificios
•
A medida que los sistemas aislados crecen, la información se fragmenta y los recursos de TI se dispersan en múltiples sistemas •
•
El resultado son altos costos, información pobre y baja calidad del servicio •
•
Un cliente tiene +1500 bases de datos en producción
Algo observado por los usuarios
Para resolver estos problemas, se necesitan nuevas tecnologías y nuevos enfoques
Tres Nuevos Enfoques
Integración Total para reducir el costo y enfocar el uso de recursos
Agilidad elástica para proveer información rápidamente
Future Solutions Una plataforma sin límites e indestructible para satisfacer la calidad de servicio requerida por el usuario
Logrando Bajos Costos Mediante la Integración Total Costo Future Solutions
Sistemas Aislados Aumentan Costos • Altos costos de operación • Cientos de bases de datos que mantener • Docenas de productos que administrar • Integración y transformación constante de datos • Múltiples modelos de seguridad, administración, etc
• Altos costos de capital • Servidores monoliticos dedicados • Subutilización de HW & SW
• Altos costo de la información • Datos incompletos, incongruentes y obsoletos
Integración Total Nuevas tecnologías permitirán un enfoque integrado Para los DBMS, el futuro traerá integración en 5 dimensiones
• Integrated Infrastructure Grid • Integrated Database Deployments • Integrated Product Stacks • Integrated Content Stores • Integrated Business Intelligence
Las 5 Dimensiones
1. Integrated Infrastructure Grid 2. Integrated Database Deployments 3. Integrated Product Stacks 4. Integrated Content Stores 5. Integrated Business Intelligence
Despliegue en Grid HW dedicado Application X
Application Y
Infraestructura en GRID
Application Z
Application Server
Database
Storage Enfoque Aislado • Servidores estáticos aislados • Servidores monolíticos costosos • Storage monolítico costoso
Enfoque Integrado • Servidores en pool dinámico • Servidores estandar de bajo costo • Storage estandar de bajo costo
Grid es Fundamentalmente Software • Un conjunto de servidores baratos en red no es un Grid • Un Grid requiere software que Application Server
Database
• Lo haga parecer un único sistema • Permita administrarlo como un único sistema • Escala y balance la carga automaticamente • Soporte las fallas de los componentes transparentemente
• Es un gran desafío técnico Storage
• Oracle es uno de los líderes en esta tecnología
Estado Actual: Application Server • La industria ha dado el salto • Todo el mundo concuerda en el modelo del grid para los servidores de aplicaciones
Application Server
• Miles de clientes lo estan utilizando
ut ol Ev
Old Approach
n io
New Approach Revolution
Estado Actual: Base de Datos • Oracle ha dado el salto en esta capa • Real Aplication Cluster es la tecnología habilitadora Database
• Liberado con Oracle9i en el año 2001 • Mejorada en 9iR2, 10g, 10gR2
• Miles de clientes en producción u ol Ev
Old Approach
n tio
New Approach Revolution
Estado Actual: Almacenamiento
Storage
• Tecnología emergente • La visión de Oracle es crear almacenamiento de base de datos utilizando un pool de discos de bajo costo conectados en red • El software de Oracle proveerá los atributos del grid: • • • •
Lo haga parecer un único sistema Permita administrarlo como un único sistema Escala y balance la carga automaticamente Soporte las fallas de los componentes transparentemente
Las 5 Dimensiones
1. Integrated Infrastructure Grid 2. Integrated Database Deployments 3. Integrated Product Stacks 4. Integrated Content Stores 5. Integrated Business Intelligence
Despliegue Integrado Application Application Application 1 2 3
Enfoque Aislado • Instancias aisladas por aplicación • Administración y mantenimiento por separado
Application Application Application 1 2 3
Enfoque Integrado • Múltiples aplicaciones en la misma base • Administración centralizada
Estado Actual Application Application Application 1 2 3
• Alto interés y adopción entre los clientes • Tecnologías claves • • • •
E
Old Approach
n tio lu vo
New Approach Revolution
•
Clusters escalables Transportable tablespaces – merging databases Flashback – fine grained recovery Database Resource Management – controlling performance Data Vault
• Clientes •
Ej. Fidelity Inv, Talk America
Las 5 Dimensiones
1. Integrated Infrastructure Grid 2. Integrated Database Deployments 3. Integrated Product Stacks 4. Integrated Content Stores 5. Integrated Business Intelligence
Productos Integrados Applications Applications
Application Server
Application Server Database Database Clusterware Files,Volumes,Backup Enfoque Aislado • Desarrollo y soporte independiente • Integrados por el usuario
Clusterware Files,Volumes,Backup Enfoque Integrado • Stack completo e integrado
Estado Actual • Productos aislados crean altos costos de administración • Distintas herramientas, metodos de usos, repositorios, modelos de seguridad, etc
• Se generán problemas entre productos • Certificación de interoperabilidad, soporte, optimización
• Oracle está desarrollando un stack integrado • • • • •
Oracle Database Oracle Automatic Storage Management Oracle Clusterware Oracle Secure Backup Oracle Application Server
• Microsoft, IBM, SAP también
ut ol Ev
Old Approach
n io
New Approach Revolution
Las 5 Dimensiones
1. Integrated Infrastructure Grid 2. Integrated Database Deployments 3. Integrated Product Stacks 4. Integrated Content Stores 5. Integrated Business Intelligence
Contenidos Integrados Images Images Documents Documents Spatial Spatial XML Relational Enfoque Aislado • Cada tipo de dato con un DB ad-hoc • Múltiples modelos de admin, seguridad y acceso • Consultas y transacciones cruzadas son raras
XML Relational Enfoque Integrado • Un solo motor para todos los datos • Un solo modelo de admin, seguridad y acceso • Consultas y transacciones combinadas son simples
Estado Actual Images Documents Spatial
• Oracle XML-DB • Oracle Spatial • Oracle Intermedia
XML Relational
ut ol Ev
Old Approach
• Mútiples clientes utilizándolo • La integración de documentos es el último salto n io
New Approach Revolution
• Oracle ha integrado XML, datos espaciales e imágenes en la base de datos relacional • Tecnologías claves
• Oracle Content DB incluye capacidades sofisticadas para reemplazar los file servers
Oracle Database 11g Highlights • • • • •
LOB’s as fast as filesystems Binary XML storage Enhanced XML indexing DICOM Medical Imaging Support Storage & Query of Semantic Content
Las 5 Dimensiones
1. Integrated Infrastructure Grid 2. Integrated Database Deployments 3. Integrated Product Stacks 4. Integrated Content Stores 5. Integrated Business Intelligence
BI Integrado OLAP
Data Warehouse
OLTP Analytics Data Mining
Data Mining
Production OLTP Database
OLAP Materialized Views Reporting Database
Enfoque Aislado • Repositorios dedicados para Reporting, DW, OLAP y Data Mining • Múltiples modelos de admin, seguridad y acceso • Datos incompletos,incongruentes y obsoletos
Enfoque Integrado • Una única base de datos para OLTP y DW • Múltiples modelos de admin, seguridad y acceso • Información en tiempo real
Estado del Arte OLTP Analytics Data Mining OLAP Materialized Views
ut ol Ev
Old Approach
n io
New Approach Revolution
• Oracle esta dando el salto moviendo algoritmos a los datos, no los datos al algoritmo • Tecnologías claves • • • • •
Integrated Analytics Integrated OLAP Integrated Data Mining Integrated Materialized Views RAC Clustering & Database Resource Manager to help isolate BI workloads
• Mientras tanto otros dicen que no es posible integrar OLTP & DW …
Oracle Database 11g Highlights
SQL Star Queries
Cubes but no SQL access
SQL Views over Cubes
Transparent SQL Rewrite to Cubes
Integración Total • Otras áreas de TI pueden beneficiarse • Ejemplos • Management Suite • Application Server Suite • Collaboration Suite • Application Suite
• La integración es un enfoque clave en el futuro de TI
Consideraciones • El objetivo es un numero racional de sistemas (no uno solo necesariamente) • Hay razones para no integrar o hacerlo lentamente • Interoperabilidad y certificaciones • Limitaciones técnicas • Razones organizacionales
• La integración toma mayor relevancia cuando los datos o sistemas están relacionados o cuando existen muchos sistemas • El objetivo es que la integración sea una opción
Alcanzando una Alta Calidad de Servicio con una plataforma sin límites e indestructible
Future Solutions
Calidad del Servicio
Calidad de Servicio • Los sistemas integrados son más grandes y críticos que los sistemas aislados • Requieren mayor calidad de servicio • A veces los sistemas se mantienen aislados por miedo a perder calidad de servicio
• Alcanzar la maxima calidad de servicio en un sistema integrado requiere crear una plataforma con: • Capacidad ilimitada • Disponibilidad ilimitada
Capacidad Limitada
En los sistemas monolíticos, la integración de aplicaciones estaba limitada porque las aplicaciones debían correr en un único servidor
That’s One, Ein, Uno, “1”
Capacidad Ilimitada • El Grid permite escalar sin límites • Agregando más nodos y storage cuando se lo necesita Application Server Grid
• Permite crear sistemas más grandes que los que un único servidor puede manejar Database Grid
• Mientras que mantiene el costo bajo
• Ejemplo Storage Grid
• Una base de datos con 256 CPUs solo es (economicamente) posible con una arquitectura en Grid
Disponibilidad Ilimitada
Computer Failures Unplanned Downtime
Data Failures
System Changes Planned Downtime Data Changes
• La interrupcion del servicio en un sistema integrado puede paralizar todo el negocio • La integración de tecnologías de alta disponibilidad en la base de datos provee la mejor protección • Funciona transparentemente en servidores escalables de bajo costo • Permite el recupero a nivel de fila (no a nivel de archivo o disco) • Diseñado para tolerar fallas
Disponibilidad Ilimitada Real Application Clusters
Data Guard Site Failure Data Corruption Release Upgrades
Computer Failures Hardware Changes Patch Upgrades
Automatic Storage Management Disk Failures
Online Redefinition Online Index Changes Online Table Changes
Flashback Undo Human Errors
Recovery Manager Oracle Secure Backup Lost or Corrupted Data Archive to Tape
Integración Mejora Calidad del Servicio • Los sistemas aislados raramente pueden soportar el costo de tecnologías sofisticadas de escalabilidad y disponibilidad • Demasiado costo/trabajo para implementar y mantener
• La integración disponibiliza esta tecnología para más aplicaciones • Mayor integración permite enfocar la administración en menos sistemas y asegurar la calidad del servicio
Mejor Información mediante Agilidad Elástica Informacion
Future Solutions
Mejor Información • Mejor información significa satisfacer dos criterios • Precisión y completitud – integrar información en una sola fuente de verdad • Agilidad – nivel de respuesta a los requerimientos
• La agilidad se trata de lograr cambios y obtener respuestas rápidas • Rápida puesta en marcha de aplicaciones • Habilitar acceso ad-hoc a la información que el usuario requiere sin demoras por tener que esperar a TI
Miedo al Cambio • “Cambios” y “Acceso Ad-hoc” son palabras temidas por los administradores Integration
• Las bases de datos son vulnerables aún a pequeños cambios
Agility
• Los administradores restringen los cambios para evitar interrupciones en las bases de producción • Se pierde agilidad
Evitando el Destino del Mainframe • Los mainframes tenían un alto nivel de integración • Pero su lentitud y poca accesibilidad los hizo declinar •
Son pocos ágiles (y caros y pobres en herramientas)
• Para evitar el destino del mainframe, los sistemas integrados viables deben promover los cambios mientras que minimizan el riesgo • Nuevas aplicaciones siempre contienen fallas • La Base de Datos debe poder recuperarse de esas fallas •
Agilidad Elástica
Agilidad Elástica - Performance • Para recuperarse de aplicaciones que fallan, la base de datos debe prevenir el consumo excesivo de recursos • “run away” SQL • Priorizar transacciones • Restringir el uso de recursos
• Tecnologías claves • Database Resource Manager • RAC • Aplicaciones sospechosas se colocan en cuarentena en nodos aislados
Agilidad Elástica - Security • Actualmente, las aplicaciones controlan la identidad del usuario y manejan la seguridad a nivel de objetos • Bases de datos manejan seguridad a nivel de tabla
• Para ser más resistente, los DBMS deben reforzar la seguridad • Previniendo de aplicaciones que fallan en seguridad • Permitiendo el acceso desde herramientas de reporting adhoc
• Tecnologías Claves • Fine grained security (VPD)
Database 11g: Ayuda para Cambio Detect & Tune Performance Changes
Perform Online Application Upgrades
Capture & Replay Workload
Manage Execution Plan Evolution
Set Up Test Environments Package Incidents for Support Online Hot Patching
Amazon.com Amazon’s RAC is so cost-effective they run 2 concurrently and still save money. 1. Extract from source systems
2. Integrate, transform, and denormalize
3. Query and analyze
8 nodes x 4CPUs 12 TB+ STAGE
16nodes x 4CPUs 65 TB QUERY
Extract Servers
ETL Manager
2nd pair of identical RAC clusters means ‘no need for backup’ for active online data
4. Data access and publishing
Talk America Telecomunicaciones
• Antes de la integración • +50 Informix Databases • Replicacion para sincronizar datos • Uso desparejo de recursos
• Despues de la integración • Una sola base • 6 node RAC (nodos 8-vías HP/UX) • ASM administra el almacenamiento • 7 TB • No más replicación • Reportes en tiempo real
Múltiples Servicos, Una Base
Node-1
Node-2
Node-3
Node-4
Repor ting
Batch
Node-5
Node-6
OLTP 1 OLTP 2 OLTP 3 OLTP 4
DW
Mercado Libre Pagar a Demanda: de 4 a 13 nodos • • • •
460 GB RAM clusterwide 286 GB SGA 30,000 URLS/second 47 GB/ redo /day
1.400.000 1.200.000 1.000.000
Nodes
BusinessVolume
1.600.000
800.000 600.000 400.000 200.000 0
2004
2005
2006
Gas Natural Corporate DW SAP BI Electricity Dispatching Siebel - Europe SAP ERP
Siebel - Brazil
• •
Linux RAC Escalabilidad para OLTP & DW
Fidelity Investments • Problemas • Demasiadas bases de datos • Subutilización de hw • Sin un patrón uniforme de puesta en marcha
• Objetivos 2007 • Reducuir 67% las bases de desarrollo • Reducir 54% las bases de producción
• Beneficios • Ahorros en costo • Mejor calidad de servicio • Mejor uso de recursos
Servicios Financieros
Avances Cost Cost
Information
Information Current Solutions
New Technologies
Future Solutions
Quality of Service
Quality of Service
ut ol Ev
Old Approach
n io
New Approach Revolution