CUESTIONARIO DATA MART, DATA MINING.docx

CUESTIONARIO DATA MART ¿Qué es un data mart? Es una forma sencilla de un data Warehouse (almacén de datos) que se centra

Views 163 Downloads 0 File size 14KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

  • Author / Uploaded
  • evito
Citation preview

CUESTIONARIO DATA MART ¿Qué es un data mart? Es una forma sencilla de un data Warehouse (almacén de datos) que se centra en un único tema o área funcional como ventas o finanzas o marketing. Por esto, se conoce a menudo como base de datos departamental.

¿Por qué y cuando se crea un data mart? Por que necesitamos realizar operaciones valiosas como obtener información sobre nuestros KPI, crear informes comerciales y utilizar algoritmos avanzados de aprendizaje autónomo para predecir eventos futuros. ¿Qué relación y/o dependencia existe entre un data mart y un data Warehouse? Si existe dependencia debido a que un data mart está enfocado a un área limitada y está incluido en un data Warehouse.

¿Cómo se integran un data mart y bajo que concepto? Los data Marts se cargan a través de procesos de integración de datos (ETL) los cuales suministran información adecuada a cada uno de ello. En muchas ocasiones, los data marts son implementados sin que exista el DW, ya que tienen sus mismas características, pero con la particularidad de que están enfocados en un tema específico. Luego de que hayan sido creados cargados todos lo data warts, se procederá a su integración el DW.

¿Cuáles son los componentes en la creación de data mart? Un data warehouse tiene cuatro características clave: 1. Contiene datos orientados a temas relacionados con el negocio. 2. Integra datos desde múltiples fuentes a través de una herramienta ETL. 3. Nos ayuda a analizar los cambios al largo del tiempo, desde una perspectiva histórica. 4. No es volátil, por lo cual, una vez que lo datos son cargados, no cambian.

CUESTIONARIO DATA MIND ¿Cuál es la definición de un data mining? Es el proceso de extracción de información significativas de grandes base de datos, información que revela inteligencia de negocios a través de factores ocultos, tendencias y correlación para permitir al usuario realizar predicciones que resuelvan

problemas de negocios. El proceso de descubrimiento de nuevas y significativas relaciones, patrones y tendencias al examinar grandes cantidades de datos.

¿Cuál es su estructura del conocimiento? 1. Entender el dominio de aplicación, el conocimiento relevante a usa uy las metas del usuario. 2. Seleccionar el conjunto de datos y enfocar la búsqueda en subconjuntos de variables o muestras de datos donde realizar el proceso de descubrimiento. 3. Filtrar (limpiar) y pre-procesar datos, diseñando una estrategia adecuada para manejar ruido, valores incompletos, secuencias de tiempos, Etc 4. Reducir datos y protecciones para disminuir el numero de variables a considerar. 5. Seleccionar la tarea de descubrimiento a realizar. 6. Seleccionar el o los algoritmos a utilizar. 7. Llevar a cabo el proceso de minería de datos. 8. Interpretar los resultados y posiblemente regresar a algún paso anterior. Esto puede involucrar repetir el proceso, quizás con otros datos, otros algoritmos, otras metas y otras estrategias. 9. Incorporar el conocimiento descubierto al sistema (normalmente para mejorarlo) lo cual puede incluir resolver conflictos potenciales con el conocimiento existente

¿Explique sus funcionalidades? -

Analisis de dependencia. Identificacion de clases. Descripcion de conceptos. Deteccion de desviaciones, casos extremos o anomalías.

¿Explique algunas técnicas estadísticas utilizadas en data mining? Arbol de decisión y reglas de clasificación. - Realizan cortes sobre una variable (lo cual limita su expresividad. Pero facilita) ¿Explique 4 ejemplos de la aplicación de un data ming? ¿marque las diferencias entre un data ware house, data mart, data ming? ¿Cuál es las herramientas de un data mining? Un data mining consta de herramientas que harán la tarea mucho más sencilla: RapidMiner (formerly known as YALE) Con un lenguaje de programación Java, RapidMiner permite realizar un análisis avanzado de los datos, a través de plantillas.

WEKA La versión original de esta herramienta se destina al análisis de datos del sector agrícola. Pero fue evolucionando y desarrollo una herramienta superior basada en Java. ORANGE Esta herramienta es simple y fácil de usar, a la vez que potente. Orange dispone de una estupenda programación visual y de script. Además, cuenta con componentes de aprendizaje propio, complementos de informática y minería de texto. KNIME Capacidad de pre- procesamiento de datos con tres componentes principales: la extracción, la transformación y la carga de datos. NLTK Cuando se trata de tareas de procesamiento del lenguaje, nada puede superar NLYK. NLTK proporciona un conjunto de herramientas de procesamiento del lenguaje, incluyendo la minería de datos, aprendizaje automático, raspado de datos, análisis de los sentimientos y otra tareas de procesamiento del lenguaje.