Corrija respuesta respuesta

Un paciente que vive en el norte de Canadá se hizo una resonancia magnética. Los resultados del procedimiento médico se

Views 154 Downloads 0 File size 287KB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

Un paciente que vive en el norte de Canadá se hizo una resonancia magnética. Los resultados del procedimiento médico se transmiten inmediatamente a un especialista en Toronto para que revise los resultados. ¿Qué características describirían mejor los datos del paciente que se transmiten? (Elija tres opciones). 

Corrija  respuesta   su  respuesta 

 o

 

almacenados

o

 

estructurados

o

 

aleatorios

o

 

no estructurados

o

 

privados

o   en movimiento La información médica electrónica es información personal privada. Los resultados digitales de pruebas, como rayos X, IRM y ultrasonidos no tienen un formato de campos fijos, por lo que se consideran no estructurados. Debido a que la información se transmite desde un lugar a otro para su revisión, estos serían datos en movimiento. Los datos estarán inactivos una vez que se almacenen en un centro de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics

2 ¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos? (Elija tres opciones).

2¿Cuáles son las tres palabras clave que se utilizan para describir la diferencia entre datos masivos y datos? (Elija tres opciones). 

Corrija  respuesta   su  respuesta 

 o

 

vigencia

o

 

valor

o

 

volumen

 

o o

 

variedad vitalidad

o   velocidad Hay tres palabras clave que pueden ayudar a distinguir los datos de los datos masivos: Volumen :describe la cantidad de datos masivos que se envían y almacenan Velocidad : describe la rapidez con la que se mueven los datos masivos Variedad : describe el tipo de datos masivos que se encuentra rara vez en un estado que esté perfectamente listo para procesar y analizar. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.2.1 De dónde provienen los datos masivos

3 ¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones).

3¿Cuáles son los tres tipos de datos estructurados? (Elija tres opciones). 

Corrija  respuesta   su  respuesta 

  

o

datos de la hoja de cálculo

o

 

blogs

o

 

Documentos oficiales

o

 

artículos periodísticos

o

 

cuentas de usuario de e-commerce

o   datos en bases de datos relacionales Los datos estructurados se ingresan y se mantienen en campos fijos dentro de un archivo o de un registro, como los datos que se encuentran en bases de datos relacionales y hojas de cálculo relacionales. El ingreso de datos estructurados requiere cierto formato para minimizar errores y facilitar la interpretación de la computadora. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.2.3 Datos estructurados y no estructurados

4 ¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y utilizan un método estándar para representar registros de datos? (Elija dos opciones).

4¿Cuáles son los dos tipos de archivo de texto sin formato que son compatibles con varias aplicaciones y utilizan un método estándar para representar registros de datos? (Elija dos opciones). 

Corrija  respuesta   su  respuesta 

 o

   

o o

DOC

 

XML PDF

 

o

JSON

o   XLS A medida que los datos se recopilan de diferentes fuentes y en formatos diferentes, es recomendable utilizar tipos de archivos específicos que faciliten la conversión y el soporte universal de la aplicación. CSV, JSON y XML son los tipos de archivo de texto sin formato que permiten recopilar y analizar datos en un formato que es fácilmente compatible y aplicable para al análisis. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

2.3.1 Fuentes de datos

5 ¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones).

5¿Cuáles son las dos tareas que forman parte de proceso de transformación de datos? (Elija dos opciones). 

Corrija  respuesta   su  respuesta 

  

o

reunir datos de múltiples fuentes

o

  mediante reglas, modificar los datos de origen según el tipo de datos necesario para la base de datos de destino

o

 

recopilar los datos necesarios para realizar el análisis

o

 

presentar el conocimiento adquirido a partir de los datos

o   crear representaciones visuales de los datos La transformación de datos es el proceso de modificar la información en un formato utilizable. Esto incluye tareas como agregar de datos y clasificarlos. La recolección de datos es el proceso de extraer de datos. La creación de representaciones visuales de datos y la presentación del conocimiento adquirido a partir de los datos son ejemplos de los últimos pasos que se siguen en el análisis de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

2.3.2 Preparación de datos

6 ¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en la nube? (Elija dos opciones).

6¿Cuáles son los dos beneficios obtenido cuando una organización adopta la computación y visualización en la nube? (Elija dos opciones). 

Corrija  respuesta   su  respuesta 

  

o

permite respuestas rápidas para aumentar los requisitos de volumen de datos

o

 

procesamiento distribuido de grandes conjuntos de datos en el tamaño de terabytes

o

 

elimina las vulnerabilidades a ataques cibernéticos

o

  proporciona un modelo de "pago por uso" que permite a las organizaciones considerar los gastos de computación y almacenamiento como un servicio

o   aumenta la dependencia de recursos de TI en las instalaciones Las organizaciones pueden usar la virtualización para consolidar la cantidad de servidores requeridos al ejecutar muchos servidores virtuales en un único servidor físico. La computación en la nube permite que las organizaciones amplíen sus soluciones según sea necesario y paguen solo los recursos que necesitan. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.1.1 La nube, la niebla y el perímetro



6.1.2 Virtualización

7 ¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).

7¿Cuáles son las dos características utilizadas por las bases de datos NoSQL? (Elija dos opciones).



Corrija  respuesta   su  respuesta 

 o

 

implementación del enfoque de almacenamiento de valores clave

o

 

importación de datos no estructurados

o

 

organización de datos en columnas, tablas y filas

o

 

establecimiento de relaciones dentro de datos almacenados

o   depende del enfoque relacional de la base de datos de tablas vinculadas Las bases de datos NoSQL pueden usar un enfoque de par de valor clave. Una base de datos NoSQL puede importar datos no estructurados. Organiza datos en columnas, tablas y filas; establecimiento relaciones dentro de los datos almacenados. NoSQL no depende del enfoque relacional de la base de datos de tablas vinculadas. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.2.1 Historial de ingeniería de datos

8 ¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones).

8¿Cuáles son las dos ventajas de utilizar CFS y no HDFS? (Elija dos opciones). 

Corrija  respuesta   su  respuesta 

  

o o

 

o

hardware especializado  

o  

capacidad de ejecutar una única base de datos en diversos centros de datos

falla automática de nodos, clústeres y centros de datos solución de almacenamiento económico

o   arquitectura master-slave Algunos de los beneficios de usar el CSF en cambio del HDFS son:  Mayor disponibilidad : el CSF no requiere soluciones de almacenamiento compartido.  Asistencia básica de hardware : no se necesita ningún servidor ni dispositivo de red especial para CFS.

 Integración de datos : todos los datos que se escriben en CSF se replican tanto en analítica como en nodos de búsqueda.  Falla automática : en relación con la disponibilidad, la falla es automática debido a la replicación.  Implementación más simple : los clústers son fáciles de configurar y se pueden ejecutar en cuestión de minutos. El CSF no exige requisitos de almacenamiento complicados o configuraciones master-slave.  Admite múltiples centros de datos : el CFS puede ejecutar una única base de datos en múltiples centros de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.3.2 Almacenamiento de datos

9 Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento?

9Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué tipo de dispositivo se utiliza cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento? 

Corrija  respuesta   su  respuesta 

 o

 

servidores proxy

o

 

torres de la red celular

o

 

puntos de acceso Wi-Fi

o   routers móviles El rápido aumento de dispositivos en la IoT es una de las razones principales del crecimiento exponencial de la generación de datos. Con la cantidad de sensores y otras terminales que crecen exponencialmente, ¿qué routers móviles se utilizan cada vez más para mejorar la administración del tráfico de Internet en sistemas que están en movimiento? Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.1.3 El crecimiento de datos cambia nuestras vidas

10 ¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta de fabricación?

10¿Qué tipo de información admite el análisis gerencial al determinar si la empresa debe expandir su planta de fabricación? 

Corrija  respuesta   su  respuesta 

 o

 

transaccional

o

 

capital

o

 

comparativa

o   analítica Los dos tipos principales de información empresarial útiles para una compañía son la información transaccional y la información analítica. La información transaccional se captura y almacena a medida que suceden los eventos. La información transaccional se puede utilizar para analizar informes diarios de ventas y cronogramas de producción para determinar la cantidad de inventario que se necesita. La información analítica sustenta tareas de análisis gerencial como determinar si la organización debería construir una nueva planta de fabricación o contratar más personal de ventas. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.2.1 De dónde provienen los datos masivos

11 ¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis disponibles cerca del perímetro de su red?

11¿Qué tecnología de red se utiliza cuando una empresa con varias ubicaciones requiere datos y análisis disponibles cerca del perímetro de su red? 

Corrija  respuesta   su  respuesta 

 o

 

virtualización  

o

computación en la niebla

o

 

NoSQL

o

 

Hadoop

La computación en la niebla proporciona datos, cómputos, almacenamiento y servicios de aplicaciones a los usuarios finales. Las características de la niebla incluyen proximidad a los usuarios finales, distribución de densidad geográfica y soporte para movilidad. Los servicios se alojan en el perímetro de la red o incluso en terminales, como decodificadores o puntos de acceso. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.2.4 Datos almacenados y datos en movimiento

12 ¿En qué se diferencia la infraestructura de datos masivos de la tradicional?

12¿En qué se diferencia la infraestructura de datos masivos de la tradicional? 

Corrija  respuesta   su  respuesta 

 o

  Las plataformas de datos masivos distribuyen datos en varios nodos de cómputo y almacenamiento.

o

  La seguridad está integrada en todos los componentes asociados con los datos masivos.

o

  La infraestructura de datos masivos requiere la implementación de productos patentados y protocolos.

  Los datos masivos implican menos personas dentro de la organización con acceso a los datos. En la infraestructura de datos masivos, las aplicaciones, los registros, los datos de eventos, los datos de sensores, los datos de la movilidad, los medios sociales y los datos de streaming podrían todos proporcionar datos a la infraestructura de datos masivos, que podrían incluir centros de datos, NoSQL, servidores de bases de datos tradicionales, almacenamiento y la tecnología basada en Hadoop. o

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.3.1 Evolución a los datos masivos

13 ¿Cuál es un ejemplo de base de datos relacional?

13¿Cuál es un ejemplo de base de datos relacional? 

Corrija  respuesta   su  respuesta 

 o

   

o o

Hoja de cálculo de Excel

 

Servidor SQL Hadoop

o   Visual Network Index Dos sistemas populares de administración de base de datos relacional son Oracle y SQL. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

1.3.2 Tecnologías de administración básica de datos

14 ¿Cuál es el propósito de la estadística descriptiva?

14¿Cuál es el propósito de la estadística descriptiva? 

Corrija  respuesta   su  respuesta 

 o

 

hacer predicciones sobre otros valores

o

 

comparar grupos de conjuntos de datos

o

 

resumir hallazgos dentro de un conjunto de datos

o   hacer generalizaciones sobre una población Existen dos tipos de estadísticas utilizadas en el análisis de datos: descriptiva e inferencial. Las estadísticas descriptivas se usan para describir o resumir valores en un conjunto de datos. Las estadísticas inferenciales se utilizan para hacer predicciones sobre los datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.2 Análisis estadístico

15 Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50 personas que se han elegido para representar a la oficina completa?

15Quinientas personas trabajan en una oficina. Para un estudio, ¿qué término describe un grupo de 50 personas que se han elegido para representar a la oficina completa?



Corrija  respuesta   su  respuesta 

 o

   

o o

Categoría

 

Muestra Grupo

o   Clúster Una población comparte un conjunto de características en común. Como, por lo general, no es viable estudiar una población completa, se elige una muestra representativa de la población, denominada "muestra", para el análisis. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.2 Análisis estadístico

16 ¿Qué funcionalidad ofrece pandas a un entorno de Python?

16¿Qué funcionalidad ofrece pandas a un entorno de Python? 

Corrija  respuesta   su  respuesta 

  

o

un conjunto de estructuras de datos y herramientas para el análisis de datos

o

 

un conjunto de API para permitir que los sensores envíen datos a Raspberry Pi

o

 

un chip mejorado para procesar información gráfica

o   un algoritmo para generar los números aleatorios Pandas es una biblioteca de código abierto con estructuras de datos y las herramientas de alto rendimiento para el análisis de grandes conjuntos de datos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.4 Análisis con estadísticas descriptivas

17 Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué significa esto?

17Un analista de datos realiza un análisis de correlación entre dos cantidades. El resultado del análisis es un valor r de 0,9. ¿Qué significa esto? 

Corrija  respuesta   su  respuesta 

 o

 

Una variable mantiene su valor en el 90% de la otra variable.

o

 

Cuando una variable aumenta su valor, la otra variable lo disminuye.

o

  Cuando una variable aumenta su valor, la variable aumenta su valor de manera muy similar.

o   Las dos variables tienen casi los mismos valores. El coeficiente de correlación más usado, r de Pearson, (o valor r), es una cantidad que se expresa como un valor de -1 a 1. Un valor positivo indica una relación positiva entre los cambios en dos cantidades. Un valor negativo indica una relación inversa. La magnitud de los valores positivos o negativos indica el grado de correlación. Cuanto más se acerque el valor a 1 o a -1, más fuerte será la relación. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.5 Análisis con correlación

18 Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de datos se espera para los datos faltantes?

18Un analista de datos está procesando un conjunto de datos con pandas y detecta un NaT. ¿Qué tipo de datos se espera para los datos faltantes? 

Corrija  respuesta   su  respuesta 

 o

 

cadena

o

 

número entero  

o o

 

marca de hora flotante

o   objeto En un conjunto de datos de pandas, NaN se utiliza para indicar una cadena indefinida, un número entero o un valor flotante. NaT se utiliza para indicar una marca de hora faltante. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.2.1 Análisis básico con Pandas.

19 ¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de préstamo según el valor de otras variables?

19¿Qué tipo de algoritmo de aprendizaje puede predecir el valor de una variable de una tasa de interés de préstamo según el valor de otras variables? 

Corrija  respuesta   su  respuesta 

  

o

regresión

o

 

asociación

o

 

clasificación

o   clusterizado Un ejemplo de cómo se puede utilizar un algoritmo de regresión para predecir el costo de una vivienda considerando variables como el índice de delitos, el nivel promedio de ingresos en el barrio y la distancia de la vivienda hasta una escuela. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.1.1 El aprendizaje automático.

20 En un análisis de regresión, ¿qué variable se conoce como un predictora o explicativa?

20En un análisis de regresión, ¿qué variable se conoce como un predictora o explicativa? 

Corrija  respuesta   su  respuesta 

  

o

independiente

o

 

principal

o

 

dependiente

o   primera La variable dependiente se conoce como variable objetivo o de respuesta. La variable independiente también se conoce como la variable de predicción o explicativa. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.1.2 Regresión

21 Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar?

21Cuando realiza un experimento y sigue el método científico, ¿cuál es el primer paso que debe tomar? 

Corrija  respuesta   su  respuesta 

 o

 

Realizar las investigaciones que correspondan.

o

 

Analizar los datos recopilados.

o

 

Elaborar una hipótesis.

o   Hacer preguntas sobre de una observación. El método científico se utiliza comúnmente en las investigaciones científicas y está conformado por los siguientes pasos: Paso 1. Formular una preguntas sobre una observación: qué, cuándo, cómo o por qué. Paso 2. Realizar las investigaciones que correspondan. Paso 3. Elaborar una hipótesis a partir de estas investigaciones. Paso 4. Probar la hipótesis con experimentos. Paso 5. Analizar los datos que se obtuvieron en los experimentos para arribar a una conclusión. Paso 6. Informar los resultados del proceso. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.2.1 Validez y fiabilidad

22 ¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con otras personas, en otros lugares y en otras oportunidades?

22¿Qué tipo de validez se utiliza cuando un investigador compara los hallazgos originales en relación con otras personas, en otros lugares y en otras oportunidades? 

Corrija  respuesta   su  respuesta 

 o

 

constructiva

o

 

de conclusión

o

 

externa

o   interna Los investigadores, por lo general, realizan pruebas de verificación con cuatro tipos de validez:

 Validez constructiva : ¿el estudio mide en realidad lo que afirma medir?  Validez interna : ¿se diseñó realmente bien el experimento? ¿Incluyó todos los pasos del método científico?  Validez externa : ¿las conclusiones pueden aplicarse a otras situaciones o personas, en otros lugares y en otros momentos? ¿Hay otra relación de causalidad en el estudio que podría explicar los resultados?  Validez de las conclusiones : en función de las relaciones entre los datos, ¿son razonables las conclusiones del estudio? Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.2.1 Validez y fiabilidad

23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión?

23 Consulte la ilustración. ¿Qué tipo de datos existe fuera del límite de decisión? 

Corrija  respuesta   su  respuesta 

 o

   

o o

grandes

 

anómalos normales

o   históricos Un científico debe calcular un límite de decisión para detectar anomalías. Los puntos de datos anómalos son los que se encuentran más allá de la esfera del límite de decisión. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.3.2 Práctica de laboratorio: detección de anomalías del contador de Internet

24 ¿Qué es un módulo de matplotlib que incluye un conjunto de funciones de estilo?

24¿Qué es un módulo de matplotlib que incluye un conjunto de funciones de estilo? 

Corrija  respuesta   su  respuesta 

 o

 

Plotly

o

 

Jupyter

o

 

CSS

o   Pyplot Pyplot es un módulo de matplotlib que incluye un conjunto de funciones de estilo. Se puede utilizar para crear y personalizar un gráfico. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

5.2.1 Pyplot

25 ¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código abierto?

25¿Qué herramienta se encuentra disponible en línea y se utiliza para crear visualizaciones de datos que incluyen bibliotecas de API, conversores de cifras, aplicaciones y una biblioteca de JavaScript de código abierto? 

Corrija  respuesta   su  respuesta 

 o

   

o o

CSS

 

Plotly Pyplot

o   Jupyter Plotly es una herramienta en línea que se puede utilizar para generar visualizaciones de datos rápidamente. Plotly ofrece diversos recursos para analistas de datos y desarrolladores web, incluidas bibliotecas de API, conversores de cifras, aplicaciones para Google Chrome y una biblioteca JavaScript de código abierto.

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

5.2.2 Plotly

26 ¿Qué servicios son proporcionados por una nube privada?

26¿Qué servicios son proporcionados por una nube privada? 

Corrija  respuesta   su  respuesta 

 o

 

almacenamiento de datos cifrados en computación en nube

o

 

comunicaciones seguras entre los sensores y los accionadores  

o

múltiples servicios de TI internos en una empresa

o   servicios en línea a los proveedores confiables Las grandes empresas, por lo general, tienen su propio centro de datos para administrar necesidades de almacenamiento de datos y de procesamiento de datos. El centro de datos se puede utilizar para satisfacer necesidades internas de TI. Es decir, el centro de datos se convierte en una nube privada, una infraestructura de computación en la nube solo para servicios internos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.1.1 La nube, la niebla y el perímetro

27 ¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el Instituto Nacional de Normas y Tecnología (NIST)?

27¿Qué servicio es un ejemplo de una extensión de los servicios de computación en la nube definidos por el Instituto Nacional de Normas y Tecnología (NIST)? 

Corrija  respuesta   su  respuesta 

 o

 

PaaS

 

o o

 

ITaaS SaaS

o   IaaS El Instituto Nacional de Normas y Tecnología (NIST) define tres servicios de computación en la nube principales: IaaS, PaaS, SaaS, en su publicación especial 800-145. Los proveedores de servicios en la nube han extendido este modelo y también proporcionan asistencia de TI para cada uno de los servicios de computación en la nube (ITaaS). Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.1.1 La nube, la niebla y el perímetro

28 ¿Cuál es la función principal de un hipervisor?

28¿Cuál es la función principal de un hipervisor? 

Corrija  respuesta   su  respuesta 

 o

 

Es un dispositivo que sincroniza un grupo de sensores.

o

  Se utiliza para crear y administrar varias instancias de máquinas virtuales en una máquina host.

o

 

Es un dispositivo que filtra y verifica credenciales de seguridad.

o

 

Lo utilizan los ISP para monitorear los recursos de informática en la nube.

o   Es un software utilizado para coordinar y preparar datos para analizar. Un hipervisor es un componente clave de la virtualización. Un hipervisor está, a menudo, respaldado por un software y se utiliza para crear y administrar varias instancias de máquinas virtuales. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.1.2 Virtualización

29 ¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con frecuencia en la memoria para un acceso rápido?

29¿Qué solución mejora la disponibilidad de aplicaciones de datos masivos al mantener datos solicitados con frecuencia en la memoria para un acceso rápido?



Corrija  respuesta   su  respuesta 

 o

   

o o

bases de datos distribuidas

 

memcaching equilibrio de carga

o   sharding Mantener la disponibilidad es la prioridad máxima de las compañías que trabajan con datos masivos. Entre algunas de las soluciones para mejorar la disponibilidad podemos mencionar las siguientes:  Equilibrio de carga : implementar varios servidores web y DNS para responder simultáneamente a las solicitudes  Bases de datos distribuidas : mejorar la velocidad de acceso y las demandas de las bases de datos  Memcaching : descargar la demanda en servidores de bases de datos manteniendo los datos solicitados con frecuencia disponibles en la memoria para acelerar el acceso  Sharding : particionar una gran base de datos relacional en varios servidores para mejorar la velocidad de búsqueda Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.2.2 Sistemas de datos masivos

30 ¿Cuál es el principal componente del flujo de datos masivos?

30¿Cuál es el principal componente del flujo de datos masivos? 

Corrija  respuesta   su  respuesta 

 o

 

transporte de datos

o

 

procesamiento de datos

o

 

almacenamiento de datos

o   asimilación de datos Los tres componentes básicos del flujo de datos masivos son la asimilación, el almacenamiento y el procesamiento o cómputo de datos.

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.3.1 Adquisición de datos

31 ¿Cómo administra Cassandra los cambios en los archivos?

31¿Cómo administra Cassandra los cambios en los archivos? 

Corrija  respuesta   su  respuesta 

 o

 

Se mantienen ambas versiones.

o

 

Los cambios se anteponen.

o

 

Se crea un nuevo archivo y se elimina el antiguo.

o   Los cambios se adjuntan. Cassandra utiliza lectura secuencial y escribe para mantener velocidades rápidas. En lugar de adjuntar archivos, cuando ocurre una adición o eliminación de datos en un archivo, se crea un nuevo archivo y se eliminan el o los archivos antiguos. Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

6.3.2 Almacenamiento de datos

32 Pregunta: Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan todas las opciones.

analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico Analizar el historial de pedidos del cliente para encontrar los productos populares de los últimos 6 meses Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de marketing del propio producto para el próximo trimestre

analítica dinámica analítica descriptiva

analítica predictivos analítica prescriptiva

La analítica de datos, aplicada a los datos masivos, se puede clasificar en tres tipos principales:

 Descriptiva : proporciona información sobre el estado o desempeño anteriores de una persona u organización  Predictiva : intenta predecir el futuro, sobre la base de datos de análisis, o lo que sucederá luego  Prescriptiva : predice resultados y sugiere cursos de acción que redundarán en el máximo beneficio para una organización Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

2.2.2 Tipos de análisis de datos

Su respuesta:  

Una la tarea y el propósito con el método analítico de datos masivos adecuado. No se utilizan todas las opciones.

analizar datos históricos sobre temperatura para preparar el último pronóstico meteorológico Analizar el historial de pedidos del cliente para encontrar los productos populares de los últimos 6 meses Revisar datos de ventas de los 5 principales competidores para determinar la estrategia de marketing del propio producto para el próximo trimestre

analítica dinámica analítica descriptiva analítica predictivos analítica prescriptiva

33

Pregunta: Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).

Para verificar que los archivos transferidos no estén alterados, se utiliza una suma. La información confidencial se deberá cifrar para minimizar la exposición. Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.

Confidencialidad Contabilidad Disponibilidad Integridad

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

2.4.1 ¿Cuáles son las preocupaciones éticas?

Su respuesta:  

Una la descripción con el tipo de seguridad de datos correcto. (No se usan todas las opciones).

Para verificar que los archivos transferidos no estén alterados, se utiliza una suma. La información confidencial se deberá cifrar para minimizar la exposición. Se deben crear copias de respaldo del sistema y se debe mantener el software actualizado.

Confidencialidad Contabilidad Disponibilidad Integridad

34

Pregunta: Una la variable con la descripción.

ordinal intervalo relación discreto

valores cuantitativos de un rango determinado valor cuantitativo de un conjunto de valores finito valores cualitativos en los que el orden es importante valores cuantitativos que pueden especificar si existe un valor para una variable

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.1 Preliminares

Su respuesta:  

Una la variable con la descripción.

ordinal intervalo relación discreto

valores cuantitativos de un rango determinado valor cuantitativo de un conjunto de valores finito valores cualitativos en los que el orden es importante valores cuantitativos que pueden especificar si existe un valor para una variable

35 Pregunta: Una el término estadístico con la descripción.

Media Rango Desviación estándar Mediana

un índice de la dispersión de datos la diferencia entre los valores más altos y más bajos para la variable equivale a la suma de todos los valores de datos dividida por la cantidad de valores el valor medio en un conjunto de datos después de que los valores se hayan organizado por orden numérico

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

3.1.3 Características de los ejemplos

Su respuesta:  

Una el término estadístico con la descripción.

Media Rango Desviación estándar Mediana

un índice de la dispersión de datos la diferencia entre los valores más altos y más bajos para la variable equivale a la suma de todos los valores de datos dividida por la cantidad de valores el valor medio en un conjunto de datos después de que los valores se hayan organizado por orden numérico

36 Pregunta: Una el algoritmo con el tipo de algoritmo de aprendizaje.

asociación clasificación clusterizado regresión máquina supervisada

Objetivo Objetivo máquina no supervisada

Objetivo Objetivo

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.1.1 El aprendizaje automático.

Su respuesta:  

Una el algoritmo con el tipo de algoritmo de aprendizaje.

asociación clasificación clusterizado regresión máquina supervisada

Objetivo

Objetivo máquina no supervisada

Objetivo Objetivo

37 Pregunta: Una el tipo de error con el origen de error correspondiente.

A una regla le falta la primera línea en milímetros. Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01. Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente cada vez que lo hace.

error grave error aleatorio error sistemático

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

4.2.2 Error de análisis

Su respuesta:  

Una el tipo de error con el origen de error correspondiente.

A una regla le falta la primera línea en milímetros. Un científico registra una medición de 3.1 cuando, en realidad, fue de 3.01. Un hombre sube a una balanza calibrada varias veces y la balanza indica un peso diferente cada vez que lo hace.

error grave

error aleatorio error sistemático

38 Pregunta: Una cada término con su definición correspondiente. (No se usan todas las opciones).

hacer inferencias sobre una población según los atributos de una muestra usar hechos, propuestas u otras afirmaciones para llegar a una conclusión. narrar una historia para persuadir a un público con la presentación de evidencia.

análisis explicativo razonamiento deductivo razonamiento inductivo análisis exploratorio

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

5.1.1 Conozca su propósito



5.1.2 Propuesta y evidencia

Su respuesta:  

Una cada término con su definición correspondiente. (No se usan todas las opciones).

hacer inferencias sobre una población según los atributos de una muestra usar hechos, propuestas u otras afirmaciones para llegar a una conclusión. narrar una historia para persuadir a un público con la presentación de evidencia.

análisis explicativo razonamiento deductivo

razonamiento inductivo análisis exploratorio

39 Pregunta: Una los términos con su definición. (No se usan todas las opciones).

un ejemplo de razonamiento deductivo una conclusión no justificada por la premisa de un argumento se presenta para sustentar una conclusión en el análisis explicativo

propuesta silogismo falacia evidencia

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

5.1.1 Conozca su propósito



5.1.2 Propuesta y evidencia

Su respuesta:  

Una los términos con su definición. (No se usan todas las opciones).

un ejemplo de razonamiento deductivo una conclusión no justificada por la premisa de un argumento se presenta para sustentar una conclusión en el análisis explicativo

propuesta silogismo

falacia evidencia

40 Pregunta: Una el tipo de gráfico con el mejor uso.

línea columna dispersión circular

comparar datos a través de categorías similares visualizar la tendencia de datos continuos en el tiempo visualizar correlaciones mostrar la composición de una cifra estática en los segmentos que suman un 100 %

Este punto hace referencia al contenido de las siguientes áreas: Big Data & Analytics 

5.2.3 Elección de la visualización correcta para el trabajo

Su respuesta:  

Una el tipo de gráfico con el mejor uso.

línea columna dispersión circular

comparar datos a través de categorías similares

visualizar la tendencia de datos continuos en el tiempo visualizar correlaciones mostrar la composición de una cifra estática en los segmentos que suman un 100 %