Introducción a las tecnologías Big Data

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Cuál de las siguientes afirmaciones es correcta sobre la generación de datos en la actualidad?

La mayoría de los datos generados son estructurados.

Los datos no estructurados son producidos únicamente por dispositivos IoT.

Los datos generados por máquinas son siempre estructurados.

Casi el 80 % de los datos generados son no estructurados. (correct)

En el contexto de la generación de datos, ¿qué representa la interacción entre un humano y una máquina?

El registro de comentarios en redes sociales.

Los logs generados durante la navegación en Internet. (correct)

La producción de imágenes y vídeos por los usuarios.

Las encuestas realizadas a usuarios en línea.

¿Qué tipo de datos es más común en las interacciones humanas a través de sistemas informáticos?

Datos estructurados que pueden ser almacenados en bases de datos.

Datos cuantitativos generados por sensores.

Datos no estructurados que son difíciles de analizar. (correct)

Datos semi-estructurados que mezclan texto y números.

Cuál de las siguientes situaciones NO genera datos estructurados?

La interacción en plataformas de redes sociales. Signup and view all the answers

¿Qué porcentaje de datos se genera generalmente por máquinas?

20 % Signup and view all the answers

¿Cuál de las siguientes afirmaciones sobre las necesidades de procesamiento de datos en la sociedad actual es incorrecta?

Las tecnologías big data son irrelevantes frente al crecimiento exponencial de la información. Signup and view all the answers

¿Qué aspecto no se menciona como parte de la comprensión del concepto de clúster de ordenadores?

Su aplicación en la inteligencia artificial. Signup and view all the answers

¿Cuál es la finalidad principal de las herramientas que componen el ecosistema Hadoop?

Procesar grandes volúmenes de datos de manera distribuida. Signup and view all the answers

En la sociedad interconectada, ¿cuál de las siguientes afirmaciones refleja mejor la realidad del incremento de información?

El crecimiento de la información es exponencial en un corto período de tiempo. Signup and view all the answers

¿Qué hecho sobre el procesamiento de datos en la actualidad no es correcto?

La gran cantidad de datos no afecta la necesidad de tecnologías especializadas. Signup and view all the answers

En la sociedad actual, la mayoría de los datos que se generan a diario son...

Datos no estructurados generados por las personas. Signup and view all the answers

¿Qué retos presentan los datos generados por personas en una red social?

Las dos respuestas anteriores son correctas. Signup and view all the answers

El término commodity hardware se refiere a...

Máquinas de potencia y coste normales, conectadas entre sí para formar un clúster más potente. Signup and view all the answers

Un proyecto se denomina big data cuando...

El problema que resuelve contiene simultáneamente las tres «v». Signup and view all the answers

Las tres «v» del big data se refieren a:

Volumen, velocidad y variedad. Signup and view all the answers

Lo mejor, si necesitamos más potencia de cómputo en un clúster big data, es...

Añadir más máquinas al clúster y aprovechar todas las que ya había. Signup and view all the answers

El sistema de ficheros precursor de HDFS fue...

GFS. Signup and view all the answers

Una distribución de Hadoop es...

Un conjunto de aplicaciones del ecosistema Hadoop, con versiones interoperables entre sí y listas para usarse. Signup and view all the answers

¿Qué compañías fueron precursoras de HDFS y MapReduce?

Google, en los dos casos. Signup and view all the answers

Definimos big data como...

Las tecnologías que permiten almacenar, mover, procesar y analizar cantidades inmensas de datos heterogéneos. Signup and view all the answers

Study Notes