Un paciente que vive en el norte de Canadá se hizo una resonancia magnética. Los resultados del procedimiento médico se
Views 154 Downloads 0 File size 287KB
Un paciente que vive en el norte de Canadá se hizo una resonancia magnética. Los resultados del procedimiento médico se transmiten inmediatamente a un especialista en Toronto para que revise los resultados. ¿Qué características describirían mejor los datos del paciente que se transmiten? (Elija tres opciones).
Corrija respuesta su respuesta
o
almacenados
o
estructurados
o
aleatorios
o
no estructurados
o
privados
o en movimiento La información médica electrónica es información personal privada. Los resultados digitales de pruebas, como rayos X, IRM y ultrasonidos no tienen un formato de campos fijos, por lo que se consideran no estructurados. Debido a que la información se transmite desde un lugar a otro para su revisión, estos serían datos en movimiento. Los datos estarán inactivos una vez que se almacenen en un centro de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
2 ¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos? (Elija tres opciones).
2¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos? (Elija tres opciones).
Corrija respuesta su respuesta
o
vigencia
o
valor
o
volumen
o o
variedad vitalidad
o velocidad Hay tres palabras clave que pueden ayudar a distinguir los datos de los datos masivos: Volumen :describe la cantidad de datos masivos que se envían y almacenan Velocidad : describe la rapidez con la que se mueven los datos masivos Variedad : describe el tipo de datos masivos que se encuentra rara vez en un estado que esté perfectamente listo para procesar y analizar. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.2.1 De dónde provienen los datos masivos
3 ¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones).
3¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones).
Corrija respuesta su respuesta
o
datos de la hoja de cálculo
o
blogs
o
Documentos oficiales
o
artículos periodísticos
o
cuentas de usuario de e-commerce
o datos en bases de datos relacionales Los datos estructurados se ingresan y se mantienen en campos fijos dentro de un archivo o de un registro, como los datos que se encuentran en bases de datos relacionales y hojas de cálculo relacionales. El ingreso de datos estructurados requiere cierto formato para minimizar errores y facilitar la interpretación de la computadora. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.2.3 Datos estructurados y no estructurados
4 ¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y utilizan un método estándar para representar registros de datos? (Elija dos opciones).
4¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y utilizan un método estándar para representar registros de datos? (Elija dos opciones).
Corrija respuesta su respuesta
o
o o
DOC
XML PDF
o
JSON
o XLS A medida que los datos se recopilan de diferentes fuentes y en formatos diferentes, es recomendable utilizar tipos de archivos específicos que faciliten la conversión y el soporte universal de la aplicación. CSV, JSON y XML son los tipos de archivo de texto sin formato que permiten recopilar y analizar datos en un formato que es fácilmente compatible y aplicable para al análisis. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
2.3.1 Fuentes de datos
5 ¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones).
5¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones).
Corrija respuesta su respuesta
o
reunir datos de múltiples fuentes
o
mediante reglas, modificar los datos de origen según el tipo de datos necesario para la base de datos de destino
o
recopilar los datos necesarios para realizar el análisis
o
presentar el conocimiento adquirido a partir de los datos
o crear representaciones visuales de los datos La transformación de datos es el proceso de modificar la información en un formato utilizable. Esto incluye tareas como agregar de datos y clasificarlos. La recolección de datos es el proceso de extraer de datos. La creación de representaciones visuales de datos y la presentación del conocimiento adquirido a partir de los datos son ejemplos de los últimos pasos que se siguen en el análisis de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
2.3.2 Preparación de datos
6 ¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en la nube? (Elija dos opciones).
6¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en la nube? (Elija dos opciones).
Corrija respuesta su respuesta
o
permite respuestas rápidas para aumentar los requisitos de volumen de datos
o
procesamiento distribuido de grandes conjuntos de datos en el tamaño de terabytes
o
elimina las vulnerabilidades a ataques cibernéticos
o
proporciona un modelo de "pago por uso" que permite a las organizaciones considerar los gastos de computación y almacenamiento como un servicio
o aumenta la dependencia de recursos de TI en las instalaciones Las organizaciones pueden usar la virtualización para consolidar la cantidad de servidores requeridos al ejecutar muchos servidores virtuales en un único servidor físico. La computación en la nube permite que las organizaciones amplíen sus soluciones según sea necesario y paguen solo los recursos que necesitan. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.1.1 La nube, la niebla y el perímetro
6.1.2 Virtualización
7 ¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).
7¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).
Corrija respuesta su respuesta
o
implementación del enfoque de almacenamiento de valores clave
o
importación de datos no estructurados
o
organización de datos en columnas, tablas y filas
o
establecimiento de relaciones dentro de datos almacenados
o depende del enfoque relacional de la base de datos de tablas vinculadas Las bases de datos NoSQL pueden usar un enfoque de par de valor clave. Una base de datos NoSQL puede importar datos no estructurados. Organiza datos en columnas, tablas y filas; establecimiento relaciones dentro de los datos almacenados. NoSQL no depende del enfoque relacional de la base de datos de tablas vinculadas. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.2.1 Historial de ingeniería de datos
8 ¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones).
8¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones).
Corrija respuesta su respuesta
o o
o
hardware especializado
o
capacidad de ejecutar una única base de datos en diversos centros de datos
falla automática de nodos, clústeres y centros de datos solución de almacenamiento económico
o arquitectura master-slave Algunos de los beneficios de usar el CSF en cambio del HDFS son: Mayor disponibilidad : el CSF no requiere soluciones de almacenamiento compartido. Asistencia básica de hardware : no se necesita ningún servidor ni dispositivo de red especial para CFS.
Integración de datos : todos los datos que se escriben en CSF se replican tanto en analítica como en nodos de búsqueda. Falla automática : en relación con la disponibilidad, la falla es automática debido a la replicación. Implementación más simple : los clústers son fáciles de configurar y se pueden ejecutar en cuestión de minutos. El CSF no exige requisitos de almacenamiento complicados o configuraciones master-slave. Admite múltiples centros de datos : el CFS puede ejecutar una única base de datos en múltiples centros de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.3.2 Almacenamiento de datos
9 Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento?
9Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento?
Corrija respuesta su respuesta
o
servidores proxy
o
torres de la red celular
o
puntos de acceso Wi-Fi
o routers móviles El rápido aumento de dispositivos en la IoT es una de las razones principales del crecimiento exponencial de la generación de datos. Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué routers móviles se utilizan cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento? Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.1.3 El crecimiento de datos cambia nuestras vidas
10 ¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta de fabricación?
10¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta de fabricación?
Corrija respuesta su respuesta
o
transaccional
o
capital
o
comparativa
o analítica Los dos tipos principales de información empresarial útiles para una compañía son la información transaccional y la información analítica. La información transaccional se captura y almacena a medida que suceden los eventos. La información transaccional se puede utilizar para analizar informes diarios de ventas y cronogramas de producción para determinar la cantidad de inventario que se necesita. La información analítica sustenta tareas de análisis gerencial como determinar si la organización debería construir una nueva planta de fabricación o contratar más personal de ventas. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.2.1 De dónde provienen los datos masivos
11 ¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis disponibles cerca del perímetro de su red?
11¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis disponibles cerca del perímetro de su red?
Corrija respuesta su respuesta
o
virtualización
o
computación en la niebla
o
NoSQL
o
Hadoop
La computación en la niebla proporciona datos, cómputos, almacenamiento y servicios de aplicaciones a los usuarios finales. Las características de la niebla incluyen proximidad a los usuarios finales, distribución de densidad geográfica y soporte para movilidad. Los servicios se alojan en el perímetro de la red o incluso en terminales, como decodificadores o puntos de acceso. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.2.4 Datos almacenados y datos en movimiento
12 ¿En qué se diferencia la infraestructura de datos masivos de la tradicional?
12¿En qué se diferencia la infraestructura de datos masivos de la tradicional?
Corrija respuesta su respuesta
o
Las plataformas de datos masivos distribuyen datos en varios nodos de cómputo y almacenamiento.
o
La seguridad está integrada en todos los componentes asociados con los datos masivos.
o
La infraestructura de datos masivos requiere la implementación de productos patentados y protocolos.
Los datos masivos implican menos personas dentro de la organización con acceso a los datos. En la infraestructura de datos masivos, las aplicaciones, los registros, los datos de eventos, los datos de sensores, los datos de la movilidad, los medios sociales y los datos de streaming podrían todos proporcionar datos a la infraestructura de datos masivos, que podrían incluir centros de datos, NoSQL, servidores de bases de datos tradicionales, almacenamiento y la tecnología basada en Hadoop. o
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.3.1 Evolución a los datos masivos
13 ¿Cuál es un ejemplo de base de datos relacional?
13¿Cuál es un ejemplo de base de datos relacional?
Corrija respuesta su respuesta
o
o o
Hoja de cálculo de Excel
Servidor SQL Hadoop
o Visual Network Index Dos sistemas populares de administración de base de datos relacional son Oracle y SQL. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
1.3.2 Tecnologías de administración básica de datos
14 ¿Cuál es el propósito de la estadística descriptiva?
14¿Cuál es el propósito de la estadística descriptiva?
Corrija respuesta su respuesta
o
hacer predicciones sobre otros valores
o
comparar grupos de conjuntos de datos
o
resumir hallazgos dentro de un conjunto de datos
o hacer generalizaciones sobre una población Existen dos tipos de estadísticas utilizadas en el análisis de datos: descriptiva e inferencial. Las estadísticas descriptivas se usan para describir o resumir valores en un conjunto de datos. Las estadísticas inferenciales se utilizan para hacer predicciones sobre los datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.2 Análisis estadístico
15 Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50 personas que se han elegido para representar a la oficina completa?
15Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50 personas que se han elegido para representar a la oficina completa?
Corrija respuesta su respuesta
o
o o
Categoría
Muestra Grupo
o Clúster Una población comparte un conjunto de características en común. Como, por lo general, no es viable estudiar una población completa, se elige una muestra representativa de la población, denominada "muestra", para el análisis. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.2 Análisis estadístico
16 ¿Qué funcionalidad ofrece pandas a un entorno de Python?
16¿Qué funcionalidad ofrece pandas a un entorno de Python?
Corrija respuesta su respuesta
o
un conjunto de estructuras de datos y herramientas para el análisis de datos
o
un conjunto de API para permitir que los sensores envíen datos a Raspberry Pi
o
un chip mejorado para procesar información gráfica
o un algoritmo para generar los números aleatorios Pandas es una biblioteca de código abierto con estructuras de datos y las herramientas de alto rendimiento para el análisis de grandes conjuntos de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.4 Análisis con estadísticas descriptivas
17 Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué significa esto?
17Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué significa esto?
Corrija respuesta su respuesta
o
Una variable mantiene su valor en el 90% de la otra variable.
o
Cuando una variable aumenta su valor, la otra variable lo disminuye.
o
Cuando una variable aumenta su valor, la variable aumenta su valor de manera muy similar.
o Las dos variables tienen casi los mismos valores. El coeficiente de correlación más usado, r de Pearson, (o valor r), es una cantidad que se expresa como un valor de -1 a 1. Un valor positivo indica una relación positiva entre los cambios en dos cantidades. Un valor negativo indica una relación inversa. La magnitud de los valores positivos o negativos indica el grado de correlación. Cuanto más se acerque el valor a 1 o a -1, más fuerte será la relación. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.5 Análisis con correlación
18 Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de datos se espera para los datos faltantes?
18Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de datos se espera para los datos faltantes?
Corrija respuesta su respuesta
o
cadena
o
número entero
o o
marca de hora flotante
o objeto En un conjunto de datos de pandas, NaN se utiliza para indicar una cadena indefinida, un número entero o un valor flotante. NaT se utiliza para indicar una marca de hora faltante. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.2.1 Análisis básico con Pandas.
19 ¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de préstamo según el valor de otras variables?
19¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de préstamo según el valor de otras variables?
Corrija respuesta su respuesta
o
regresión
o
asociación
o
clasificación
o clusterizado Un ejemplo de cómo se puede utilizar un algoritmo de regresión para predecir el costo de una vivienda considerando variables como el índice de delitos, el nivel promedio de ingresos en el barrio y la distancia de la vivienda hasta una escuela. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.1.1 El aprendizaje automático.
20 En un análisis de regresión, ¿qué variable se conoce como un predictora o explicativa?
20En un análisis de regresión, ¿qué variable se conoce como un predictora o explicativa?
Corrija respuesta su respuesta
o
independiente
o
principal
o
dependiente
o primera La variable dependiente se conoce como variable objetivo o de respuesta. La variable independiente también se conoce como la variable de predicción o explicativa. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.1.2 Regresión
21 Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar?
21Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar?
Corrija respuesta su respuesta
o
Realizar las investigaciones que correspondan.
o
Analizar los datos recopilados.
o
Elaborar una hipótesis.
o Hacer preguntas sobre de una observación. El método científico se utiliza comúnmente en las investigaciones científicas y está conformado por los siguientes pasos: Paso 1. Formular una preguntas sobre una observación: qué, cuándo, cómo o por qué. Paso 2. Realizar las investigaciones que correspondan. Paso 3. Elaborar una hipótesis a partir de estas investigaciones. Paso 4. Probar la hipótesis con experimentos. Paso 5. Analizar los datos que se obtuvieron en los experimentos para arribar a una conclusión. Paso 6. Informar los resultados del proceso. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.2.1 Validez y fiabilidad
22 ¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con otras personas, en otros lugares y en otras oportunidades?
22¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con otras personas, en otros lugares y en otras oportunidades?
Corrija respuesta su respuesta
o
constructiva
o
de conclusión
o
externa
o interna Los investigadores, por lo general, realizan pruebas de verificación con cuatro tipos de validez:
Validez constructiva : ¿el estudio mide en realidad lo que afirma medir? Validez interna : ¿se diseñó realmente bien el experimento? ¿Incluyó todos los pasos del método científico? Validez externa : ¿las conclusiones pueden aplicarse a otras situaciones o personas, en otros lugares y en otros momentos? ¿Hay otra relación de causalidad en el estudio que podría explicar los resultados? Validez de las conclusiones : en función de las relaciones entre los datos, ¿son razonables las conclusiones del estudio? Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.2.1 Validez y fiabilidad
23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?
23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?
Corrija respuesta su respuesta
o
o o
grandes
anómalos normales
o históricos Un científico debe calcular un límite de decisión para detectar anomalías. Los puntos de datos anómalos son los que se encuentran más allá de la esfera del límite de decisión. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.3.2 Práctica de laboratorio: detección de anomalías del contador de Internet
24 ¿Qué es un módulo de matplotlib que incluye un conjunto de funciones de estilo?
24¿Qué es un módulo de matplotlib que incluye un conjunto de funciones de estilo?
Corrija respuesta su respuesta
o
Plotly
o
Jupyter
o
CSS
o Pyplot Pyplot es un módulo de matplotlib que incluye un conjunto de funciones de estilo. Se puede utilizar para crear y personalizar un gráfico. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
5.2.1 Pyplot
25 ¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código abierto?
25¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código abierto?
Corrija respuesta su respuesta
o
o o
CSS
Plotly Pyplot
o Jupyter Plotly es una herramienta en línea que se puede utilizar para generar visualizaciones de datos rápidamente. Plotly ofrece diversos recursos para analistas de datos y desarrolladores web, incluidas bibliotecas de API, conversores de cifras, aplicaciones para Google Chrome y una biblioteca JavaScript de código abierto.
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
5.2.2 Plotly
26 ¿Qué servicios son proporcionados por una nube privada?
26¿Qué servicios son proporcionados por una nube privada?
Corrija respuesta su respuesta
o
almacenamiento de datos cifrados en computación en nube
o
comunicaciones seguras entre los sensores y los accionadores
o
múltiples servicios de TI internos en una empresa
o servicios en línea a los proveedores confiables Las grandes empresas, por lo general, tienen su propio centro de datos para administrar necesidades de almacenamiento de datos y de procesamiento de datos. El centro de datos se puede utilizar para satisfacer necesidades internas de TI. Es decir, el centro de datos se convierte en una nube privada, una infraestructura de computación en la nube solo para servicios internos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.1.1 La nube, la niebla y el perímetro
27 ¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el Instituto Nacional de Normas y Tecnología (NIST)?
27¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el Instituto Nacional de Normas y Tecnología (NIST)?
Corrija respuesta su respuesta
o
PaaS
o o
ITaaS SaaS
o IaaS El Instituto Nacional de Normas y Tecnología (NIST) define tres servicios de computación en la nube principales: IaaS, PaaS, SaaS, en su publicación especial 800-145. Los proveedores de servicios en la nube han extendido este modelo y también proporcionan asistencia de TI para cada uno de los servicios de computación en la nube (ITaaS). Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.1.1 La nube, la niebla y el perímetro
28 ¿Cuál es la función principal de un hipervisor?
28¿Cuál es la función principal de un hipervisor?
Corrija respuesta su respuesta
o
Es un dispositivo que sincroniza un grupo de sensores.
o
Se utiliza para crear y administrar varias instancias de máquinas virtuales en una máquina host.
o
Es un dispositivo que filtra y verifica credenciales de seguridad.
o
Lo utilizan los ISP para monitorear los recursos de informática en la nube.
o Es un software utilizado para coordinar y preparar datos para analizar. Un hipervisor es un componente clave de la virtualización. Un hipervisor está, a menudo, respaldado por un software y se utiliza para crear y administrar varias instancias de máquinas virtuales. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.1.2 Virtualización
29 ¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con frecuencia en la memoria para un acceso rápido?
29¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con frecuencia en la memoria para un acceso rápido?
Corrija respuesta su respuesta
o
o o
bases de datos distribuidas
memcaching equilibrio de carga
o sharding Mantener la disponibilidad es la prioridad máxima de las compañías que trabajan con datos masivos. Entre algunas de las soluciones para mejorar la disponibilidad podemos mencionar las siguientes: Equilibrio de carga : implementar varios servidores web y DNS para responder simultáneamente a las solicitudes Bases de datos distribuidas : mejorar la velocidad de acceso y las demandas de las bases de datos Memcaching : descargar la demanda en servidores de bases de datos manteniendo los datos solicitados con frecuencia disponibles en la memoria para acelerar el acceso Sharding : particionar una gran base de datos relacional en varios servidores para mejorar la velocidad de búsqueda Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.2.2 Sistemas de datos masivos
30 ¿Cuál es el principal componente del flujo de datos masivos?
30¿Cuál es el principal componente del flujo de datos masivos?
Corrija respuesta su respuesta
o
transporte de datos
o
procesamiento de datos
o
almacenamiento de datos
o asimilación de datos Los tres componentes básicos del flujo de datos masivos son la asimilación, el almacenamiento y el procesamiento o cómputo de datos.
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.3.1 Adquisición de datos
31 ¿Cómo administra Cassandra los cambios en los archivos?
31¿Cómo administra Cassandra los cambios en los archivos?
Corrija respuesta su respuesta
o
Se mantienen ambas versiones.
o
Los cambios se anteponen.
o
Se crea un nuevo archivo y se elimina el antiguo.
o Los cambios se adjuntan. Cassandra utiliza lectura secuencial y escribe para mantener velocidades rápidas. En lugar de adjuntar archivos, cuando ocurre una adición o eliminación de datos en un archivo, se crea un nuevo archivo y se eliminan el o los archivos antiguos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
6.3.2 Almacenamiento de datos
32 Pregunta: Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan todas las opciones.
analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico Analizar el historial de pedidos del cliente para encontrar los productos populares de los últimos 6 meses Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de marketing del propio producto para el próximo trimestre
analítica dinámica analítica descriptiva
analítica predictivos analítica prescriptiva
La analítica de datos, aplicada a los datos masivos, se puede clasificar en tres tipos principales:
Descriptiva : proporciona información sobre el estado o desempeño anteriores de una persona u organización Predictiva : intenta predecir el futuro, sobre la base de datos de análisis, o lo que sucederá luego Prescriptiva : predice resultados y sugiere cursos de acción que redundarán en el máximo beneficio para una organización Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
2.2.2 Tipos de análisis de datos
Su respuesta:
Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan todas las opciones.
analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico Analizar el historial de pedidos del cliente para encontrar los productos populares de los últimos 6 meses Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de marketing del propio producto para el próximo trimestre
analítica dinámica analítica descriptiva analítica predictivos analítica prescriptiva
33
Pregunta: Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).
Para verificar que los archivos transferidos no estén alterados, se utiliza una suma. La información confidencial se deberá cifrar para minimizar la exposición. Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.
Confidencialidad Contabilidad Disponibilidad Integridad
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
2.4.1 ¿Cuáles son las preocupaciones éticas?
Su respuesta:
Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).
Para verificar que los archivos transferidos no estén alterados, se utiliza una suma. La información confidencial se deberá cifrar para minimizar la exposición. Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.
Confidencialidad Contabilidad Disponibilidad Integridad
34
Pregunta: Una la variable con la descripción.
ordinal intervalo relación discreto
valores cuantitativos de un rango determinado valor cuantitativo de un conjunto de valores finito valores cualitativos en los que el orden es importante valores cuantitativos que pueden especificar si existe un valor para una variable
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.1 Preliminares
Su respuesta:
Una la variable con la descripción.
ordinal intervalo relación discreto
valores cuantitativos de un rango determinado valor cuantitativo de un conjunto de valores finito valores cualitativos en los que el orden es importante valores cuantitativos que pueden especificar si existe un valor para una variable
35 Pregunta: Una el término estadístico con la descripción.
Media Rango Desviación estándar Mediana
un índice de la dispersión de datos la diferencia entre los valores más altos y más bajos para la variable equivale a la suma de todos los valores de datos dividida por la cantidad de valores el valor medio en un conjunto de datos después de que los valores se hayan organizado por orden numérico
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
3.1.3 Características de los ejemplos
Su respuesta:
Una el término estadístico con la descripción.
Media Rango Desviación estándar Mediana
un índice de la dispersión de datos la diferencia entre los valores más altos y más bajos para la variable equivale a la suma de todos los valores de datos dividida por la cantidad de valores el valor medio en un conjunto de datos después de que los valores se hayan organizado por orden numérico
36 Pregunta: Una el algoritmo con el tipo de algoritmo de aprendizaje.
asociación clasificación clusterizado regresión máquina supervisada
Objetivo Objetivo máquina no supervisada
Objetivo Objetivo
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.1.1 El aprendizaje automático.
Su respuesta:
Una el algoritmo con el tipo de algoritmo de aprendizaje.
asociación clasificación clusterizado regresión máquina supervisada
Objetivo
Objetivo máquina no supervisada
Objetivo Objetivo
37 Pregunta: Una el tipo de error con el origen de error correspondiente.
A una regla le falta la primera línea en milímetros. Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01. Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente cada vez que lo hace.
error grave error aleatorio error sistemático
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
4.2.2 Error de análisis
Su respuesta:
Una el tipo de error con el origen de error correspondiente.
A una regla le falta la primera línea en milímetros. Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01. Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente cada vez que lo hace.
error grave
error aleatorio error sistemático
38 Pregunta: Una cada término con su definición correspondiente. (No se usan todas las opciones).
hacer inferencias sobre una población según los atributos de una muestra usar hechos, propuestas u otras afirmaciones para llegar a una conclusión. narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo razonamiento deductivo razonamiento inductivo análisis exploratorio
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
5.1.1 Conozca su propósito
5.1.2 Propuesta y evidencia
Su respuesta:
Una cada término con su definición correspondiente. (No se usan todas las opciones).
hacer inferencias sobre una población según los atributos de una muestra usar hechos, propuestas u otras afirmaciones para llegar a una conclusión. narrar una historia para persuadir a un público con la presentación de evidencia.
análisis explicativo razonamiento deductivo
razonamiento inductivo análisis exploratorio
39 Pregunta: Una los términos con su definición. (No se usan todas las opciones).
un ejemplo de razonamiento deductivo una conclusión no justificada por la premisa de un argumento se presenta para sustentar una conclusión en el análisis explicativo
propuesta silogismo falacia evidencia
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
5.1.1 Conozca su propósito
5.1.2 Propuesta y evidencia
Su respuesta:
Una los términos con su definición. (No se usan todas las opciones).
un ejemplo de razonamiento deductivo una conclusión no justificada por la premisa de un argumento se presenta para sustentar una conclusión en el análisis explicativo
propuesta silogismo
falacia evidencia
40 Pregunta: Una el tipo de gráfico con el mejor uso.
línea columna dispersión circular
comparar datos a través de categorías similares visualizar la tendencia de datos continuos en el tiempo visualizar correlaciones mostrar la composición de una cifra estática en los segmentos que suman un 100 %
Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics
5.2.3 Elección de la visualización correcta para el trabajo
Su respuesta:
Una el tipo de gráfico con el mejor uso.
línea columna dispersión circular
comparar datos a través de categorías similares
visualizar la tendencia de datos continuos en el tiempo visualizar correlaciones mostrar la composición de una cifra estática en los segmentos que suman un 100 %