Podcast
Questions and Answers
¿Cuál es la principal diferencia entre Scale-up y Scale-out?
¿Cuál es la principal diferencia entre Scale-up y Scale-out?
¿Cuál es la ventaja principal de Scale-up?
¿Cuál es la ventaja principal de Scale-up?
¿Cuál es la desventaja principal de Scale-up?
¿Cuál es la desventaja principal de Scale-up?
¿Cuál es la ventaja principal de Scale-out?
¿Cuál es la ventaja principal de Scale-out?
Signup and view all the answers
¿Qué tipo de escalabilidad utiliza Big Data?
¿Qué tipo de escalabilidad utiliza Big Data?
Signup and view all the answers
¿Cuál es la desventaja principal de Scale-out?
¿Cuál es la desventaja principal de Scale-out?
Signup and view all the answers
¿Cuál es la principal desventaja de la computación distribuida?
¿Cuál es la principal desventaja de la computación distribuida?
Signup and view all the answers
¿Qué característica de MapReduce permite la tolerancia a fallos?
¿Qué característica de MapReduce permite la tolerancia a fallos?
Signup and view all the answers
¿Qué pasa cuando se aplica la computación distribuida?
¿Qué pasa cuando se aplica la computación distribuida?
Signup and view all the answers
¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?
¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?
Signup and view all the answers
¿Qué significa 'Data Locality' en sistemas distribuidos?
¿Qué significa 'Data Locality' en sistemas distribuidos?
Signup and view all the answers
¿Cuál es el año en que se presentó MapReduce?
¿Cuál es el año en que se presentó MapReduce?
Signup and view all the answers
Study Notes
Escalabilidad en Big Data
- Existen dos tipos de escalabilidad: Scale-up (escalabilidad vertical) y Scale-out (escalabilidad horizontal)
- Scale-up: agregar más recursos a una máquina, límite en la capacidad de mejora, no tolerante a fallos
- Scale-out: agregar más máquinas conectadas por red, tolerante a fallos, bajo costo de escalabilidad
Ventajas y desventajas de Scale-up y Scale-out
- Ventajas de Scale-up: menor consumo de energía, menor costo de refrigeración, fácil de implementar, menores costos de licencias
- Desventajas de Scale-up: precio, no tolerante a fallos, límite de mejoras futuras
- Ventajas de Scale-out: más barato de escalar, tolerante a fallos, fácil de crecer
- Desventajas de Scale-out: más costos de licencias, más espacio físico, mayor costo de electricidad y refrigeración
Sistemas distribuidos en Big Data
- La idea es repartir los datos por las máquinas y aplicar operaciones en paralelo
- Se utiliza Data Locality para evitar la transferencia de datos y mantenerlos cerca de quien los procesa
- La principal desventaja de la computación distribuida es la comunicación en red
MapReduce
- Presentado por Google en 2004, Hadoop nació en 2008 como implementación Open Source
- Combina un sistema distribuido de ficheros (HDFS) con un paradigma de programación para procesar datos
- Funciona distribuyendo los cálculos sobre los datos entre los nodos, solo se mueven los datos necesarios entre nodos
Características de MapReduce
- Escalabilidad: funciona sobre cualquier clúster de nodos/procesadores
- Transparencia: maneja la comunicación automática entre máquinas
- Tolerancia a fallos: puede sobrevivir a fallos en los nodos
- Redundancia de datos: almacena los datos en múltiples lugares para asegurar la disponibilidad
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Aprende los conceptos básicos de Big Data, incluyendo Scale-up y Scale-out, sistemas distribuidos, MapReduce y Hadoop.