Introducción a Big Data – Parte 2
12 Questions
2 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

¿Cuál es la principal diferencia entre Scale-up y Scale-out?

  • Scale-up utiliza mejores componentes mientras que Scale-out utiliza más servidores
  • Scale-up es más fácil de implementar mientras que Scale-out es más escalable (correct)
  • Scale-up utiliza más servidores mientras que Scale-out utiliza mejores componentes
  • Scale-up es más barato que Scale-out
  • ¿Cuál es la ventaja principal de Scale-up?

  • Es más tolerante a fallos
  • Es más escalable
  • Es más barato
  • Menos consumo de energía (correct)
  • ¿Cuál es la desventaja principal de Scale-up?

  • No es tolerante a fallos (correct)
  • Requiere más espacio físico
  • Es más caro
  • Es más difícil de implementar
  • ¿Cuál es la ventaja principal de Scale-out?

    <p>Es más tolerante a fallos</p> Signup and view all the answers

    ¿Qué tipo de escalabilidad utiliza Big Data?

    <p>Scale-out</p> Signup and view all the answers

    ¿Cuál es la desventaja principal de Scale-out?

    <p>Mayor coste de licencias</p> Signup and view all the answers

    ¿Cuál es la principal desventaja de la computación distribuida?

    <p>La comunicación por red</p> Signup and view all the answers

    ¿Qué característica de MapReduce permite la tolerancia a fallos?

    <p>La redundancia de datos</p> Signup and view all the answers

    ¿Qué pasa cuando se aplica la computación distribuida?

    <p>Se distribuyen los datos entre los nodos y se aplican operaciones</p> Signup and view all the answers

    ¿Cuál es el nombre del sistema de archivos distribuido que se combina con MapReduce?

    <p>Hadoop Distributed File System (HDFS)</p> Signup and view all the answers

    ¿Qué significa 'Data Locality' en sistemas distribuidos?

    <p>La proximidad de los datos a los nodos que los procesan</p> Signup and view all the answers

    ¿Cuál es el año en que se presentó MapReduce?

    <p>2004</p> Signup and view all the answers

    Study Notes

    Escalabilidad en Big Data

    • Existen dos tipos de escalabilidad: Scale-up (escalabilidad vertical) y Scale-out (escalabilidad horizontal)
    • Scale-up: agregar más recursos a una máquina, límite en la capacidad de mejora, no tolerante a fallos
    • Scale-out: agregar más máquinas conectadas por red, tolerante a fallos, bajo costo de escalabilidad

    Ventajas y desventajas de Scale-up y Scale-out

    • Ventajas de Scale-up: menor consumo de energía, menor costo de refrigeración, fácil de implementar, menores costos de licencias
    • Desventajas de Scale-up: precio, no tolerante a fallos, límite de mejoras futuras
    • Ventajas de Scale-out: más barato de escalar, tolerante a fallos, fácil de crecer
    • Desventajas de Scale-out: más costos de licencias, más espacio físico, mayor costo de electricidad y refrigeración

    Sistemas distribuidos en Big Data

    • La idea es repartir los datos por las máquinas y aplicar operaciones en paralelo
    • Se utiliza Data Locality para evitar la transferencia de datos y mantenerlos cerca de quien los procesa
    • La principal desventaja de la computación distribuida es la comunicación en red

    MapReduce

    • Presentado por Google en 2004, Hadoop nació en 2008 como implementación Open Source
    • Combina un sistema distribuido de ficheros (HDFS) con un paradigma de programación para procesar datos
    • Funciona distribuyendo los cálculos sobre los datos entre los nodos, solo se mueven los datos necesarios entre nodos

    Características de MapReduce

    • Escalabilidad: funciona sobre cualquier clúster de nodos/procesadores
    • Transparencia: maneja la comunicación automática entre máquinas
    • Tolerancia a fallos: puede sobrevivir a fallos en los nodos
    • Redundancia de datos: almacena los datos en múltiples lugares para asegurar la disponibilidad

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Aprende los conceptos básicos de Big Data, incluyendo Scale-up y Scale-out, sistemas distribuidos, MapReduce y Hadoop.

    More Like This

    Big Data
    7 questions
    Big Data Technologies Quiz
    15 questions
    Understanding Hadoop: MapReduce and HDFS
    10 questions
    Use Quizgecko on...
    Browser
    Browser