Podcast
Questions and Answers
¿Cuál es la principal diferencia entre Scale-up y Scale-out?
¿Cuál es la principal diferencia entre Scale-up y Scale-out?
- Scale-up utiliza mejores componentes mientras que Scale-out utiliza más servidores
- Scale-up es más fácil de implementar mientras que Scale-out es más escalable (correct)
- Scale-up utiliza más servidores mientras que Scale-out utiliza mejores componentes
- Scale-up es más barato que Scale-out
¿Cuál es la ventaja principal de Scale-up?
¿Cuál es la ventaja principal de Scale-up?
- Es más tolerante a fallos
- Es más escalable
- Es más barato
- Menos consumo de energía (correct)
¿Cuál es la desventaja principal de Scale-up?
¿Cuál es la desventaja principal de Scale-up?
- No es tolerante a fallos (correct)
- Requiere más espacio físico
- Es más caro
- Es más difícil de implementar
¿Cuál es la ventaja principal de Scale-out?
¿Cuál es la ventaja principal de Scale-out?
¿Qué tipo de escalabilidad utiliza Big Data?
¿Qué tipo de escalabilidad utiliza Big Data?
¿Cuál es la desventaja principal de Scale-out?
¿Cuál es la desventaja principal de Scale-out?
¿Cuál es la principal desventaja de la computación distribuida?
¿Cuál es la principal desventaja de la computación distribuida?
¿Qué característica de MapReduce permite la tolerancia a fallos?
¿Qué característica de MapReduce permite la tolerancia a fallos?
¿Qué pasa cuando se aplica la computación distribuida?
¿Qué pasa cuando se aplica la computación distribuida?
¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?
¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?
¿Qué significa 'Data Locality' en sistemas distribuidos?
¿Qué significa 'Data Locality' en sistemas distribuidos?
¿Cuál es el año en que se presentó MapReduce?
¿Cuál es el año en que se presentó MapReduce?
Flashcards are hidden until you start studying
Study Notes
Escalabilidad en Big Data
- Existen dos tipos de escalabilidad: Scale-up (escalabilidad vertical) y Scale-out (escalabilidad horizontal)
- Scale-up: agregar más recursos a una máquina, límite en la capacidad de mejora, no tolerante a fallos
- Scale-out: agregar más máquinas conectadas por red, tolerante a fallos, bajo costo de escalabilidad
Ventajas y desventajas de Scale-up y Scale-out
- Ventajas de Scale-up: menor consumo de energía, menor costo de refrigeración, fácil de implementar, menores costos de licencias
- Desventajas de Scale-up: precio, no tolerante a fallos, límite de mejoras futuras
- Ventajas de Scale-out: más barato de escalar, tolerante a fallos, fácil de crecer
- Desventajas de Scale-out: más costos de licencias, más espacio físico, mayor costo de electricidad y refrigeración
Sistemas distribuidos en Big Data
- La idea es repartir los datos por las máquinas y aplicar operaciones en paralelo
- Se utiliza Data Locality para evitar la transferencia de datos y mantenerlos cerca de quien los procesa
- La principal desventaja de la computación distribuida es la comunicación en red
MapReduce
- Presentado por Google en 2004, Hadoop nació en 2008 como implementación Open Source
- Combina un sistema distribuido de ficheros (HDFS) con un paradigma de programación para procesar datos
- Funciona distribuyendo los cálculos sobre los datos entre los nodos, solo se mueven los datos necesarios entre nodos
Características de MapReduce
- Escalabilidad: funciona sobre cualquier clúster de nodos/procesadores
- Transparencia: maneja la comunicación automática entre máquinas
- Tolerancia a fallos: puede sobrevivir a fallos en los nodos
- Redundancia de datos: almacena los datos en múltiples lugares para asegurar la disponibilidad
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.