Introducción a Big Data – Parte 2

EloquentDarmstadtium avatar
EloquentDarmstadtium
·
·
Download

Start Quiz

Study Flashcards

Questions and Answers

¿Cuál es la principal diferencia entre Scale-up y Scale-out?

Scale-up es más fácil de implementar mientras que Scale-out es más escalable

¿Cuál es la ventaja principal de Scale-up?

Menos consumo de energía

¿Cuál es la desventaja principal de Scale-up?

No es tolerante a fallos

¿Cuál es la ventaja principal de Scale-out?

<p>Es más tolerante a fallos</p> Signup and view all the answers

¿Qué tipo de escalabilidad utiliza Big Data?

<p>Scale-out</p> Signup and view all the answers

¿Cuál es la desventaja principal de Scale-out?

<p>Mayor coste de licencias</p> Signup and view all the answers

¿Cuál es la principal desventaja de la computación distribuida?

<p>La comunicación por red</p> Signup and view all the answers

¿Qué característica de MapReduce permite la tolerancia a fallos?

<p>La redundancia de datos</p> Signup and view all the answers

¿Qué pasa cuando se aplica la computación distribuida?

<p>Se distribuyen los datos entre los nodos y se aplican operaciones</p> Signup and view all the answers

¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?

<p>Hadoop Distributed File System (HDFS)</p> Signup and view all the answers

¿Qué significa 'Data Locality' en sistemas distribuidos?

<p>La proximidad de los datos a los nodos que los procesan</p> Signup and view all the answers

¿Cuál es el año en que se presentó MapReduce?

<p>2004</p> Signup and view all the answers

Study Notes

Escalabilidad en Big Data

  • Existen dos tipos de escalabilidad: Scale-up (escalabilidad vertical) y Scale-out (escalabilidad horizontal)
  • Scale-up: agregar más recursos a una máquina, límite en la capacidad de mejora, no tolerante a fallos
  • Scale-out: agregar más máquinas conectadas por red, tolerante a fallos, bajo costo de escalabilidad

Ventajas y desventajas de Scale-up y Scale-out

  • Ventajas de Scale-up: menor consumo de energía, menor costo de refrigeración, fácil de implementar, menores costos de licencias
  • Desventajas de Scale-up: precio, no tolerante a fallos, límite de mejoras futuras
  • Ventajas de Scale-out: más barato de escalar, tolerante a fallos, fácil de crecer
  • Desventajas de Scale-out: más costos de licencias, más espacio físico, mayor costo de electricidad y refrigeración

Sistemas distribuidos en Big Data

  • La idea es repartir los datos por las máquinas y aplicar operaciones en paralelo
  • Se utiliza Data Locality para evitar la transferencia de datos y mantenerlos cerca de quien los procesa
  • La principal desventaja de la computación distribuida es la comunicación en red

MapReduce

  • Presentado por Google en 2004, Hadoop nació en 2008 como implementación Open Source
  • Combina un sistema distribuido de ficheros (HDFS) con un paradigma de programación para procesar datos
  • Funciona distribuyendo los cálculos sobre los datos entre los nodos, solo se mueven los datos necesarios entre nodos

Características de MapReduce

  • Escalabilidad: funciona sobre cualquier clúster de nodos/procesadores
  • Transparencia: maneja la comunicación automática entre máquinas
  • Tolerancia a fallos: puede sobrevivir a fallos en los nodos
  • Redundancia de datos: almacena los datos en múltiples lugares para asegurar la disponibilidad

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

More Quizzes Like This

Big Data
7 questions
Big Data Technologies Quiz
15 questions
Technologies pour le Big Data
5 questions

Technologies pour le Big Data

TranquilGyrolite6380 avatar
TranquilGyrolite6380
Use Quizgecko on...
Browser
Browser