Podcast
Questions and Answers
¿Cuánto ocupa en total un archivo de 500 MB almacenado en HDFS, sin replicación, si se asume el tamaño de bloque por defecto?
¿Cuánto ocupa en total un archivo de 500 MB almacenado en HDFS, sin replicación, si se asume el tamaño de bloque por defecto?
- Ocupará 512 MB que son 4 bloques de 128 MB, y hay 12 MB desperdiciados.
- Ocupará 500 MB multiplicado por el número de datanodes del clúster.
- Ocupara 500 MB (correct)
- Ocupará 512 MB que son 4 bloques de 128 MB, y hay 12 MB desperdiciados.
¿Cuál de las siguientes afirmaciones respecto a HDFS es cierta?
¿Cuál de las siguientes afirmaciones respecto a HDFS es cierta?
- Las dos respuestas anteriores son correctas.
- El tamaño de bloque debe ser siempre pequeño para no desperdiciar espacio.
- El factor de replicación es configurable por fichero, y su valor por defecto es 3 (correct)
¿Qué afirmación es cierta sobre el proceso de escritura en HDFS?
¿Qué afirmación es cierta sobre el proceso de escritura en HDFS?
- El cliente manda al namenode el fichero, que a su vez se encarga de escribirlo en los diferentes datanodes.
- El cliente escribe los bloques en todos los datanodes que le ha especificado el namenode.
- El cliente escribe los bloques en un datanode y este datanode envÃa la orden de escritura a los demás. (correct)
En un clúster de varios nodos donde no hemos configurado la topologÃa…
En un clúster de varios nodos donde no hemos configurado la topologÃa…
Cuando usamos namenodes federados…
Cuando usamos namenodes federados…
¿Por qué se dice que HDFS es un sistema escalable?
¿Por qué se dice que HDFS es un sistema escalable?
¿Qué tipo de uso suele darse a los ficheros de HDFS?
¿Qué tipo de uso suele darse a los ficheros de HDFS?
La alta disponibilidad de los namenodes de HDFS implica que…
La alta disponibilidad de los namenodes de HDFS implica que…
El comando de HDFS para moverse a la carpeta /mydata es…
El comando de HDFS para moverse a la carpeta /mydata es…
¿Qué inconveniente presenta MapReduce?
¿Qué inconveniente presenta MapReduce?
Lo mejor si necesitamos más potencia de cómputo en un clúster Big Data es…
Lo mejor si necesitamos más potencia de cómputo en un clúster Big Data es…
El sistema de ficheros precursor de HDFS fue…
El sistema de ficheros precursor de HDFS fue…
Una distribución de Hadoop es…
Una distribución de Hadoop es…
¿Qué compañÃas fueron precursoras de HDFS y MapReduce?
¿Qué compañÃas fueron precursoras de HDFS y MapReduce?
Definimos Big Data como…
Definimos Big Data como…
En la sociedad actual, la mayorÃa de los datos que se generan a diario son…
En la sociedad actual, la mayorÃa de los datos que se generan a diario son…
¿Qué retos presentan los datos generados por personas en una red social?
¿Qué retos presentan los datos generados por personas en una red social?
El término "commodity hardware" se refiere a…
El término "commodity hardware" se refiere a…
Un proyecto se denomina Big Data cuando…
Un proyecto se denomina Big Data cuando…
Las tres "V" del Big Data se refieren a:
Las tres "V" del Big Data se refieren a:
Flashcards
HDFS file size
HDFS file size
Without replication, a 500 MB file in HDFS occupies 500 MB.
HDFS replication factor
HDFS replication factor
The replication factor is configurable per file, with a default value of 3.
HDFS write process
HDFS write process
The client writes blocks to a datanode, which then propagates the write command to other datanodes.
HDFS replica placement
HDFS replica placement
Signup and view all the flashcards
Namenodes federated
Namenodes federated
Signup and view all the flashcards
HDFS scalability
HDFS scalability
Signup and view all the flashcards
Typical HDFS file usage
Typical HDFS file usage
Signup and view all the flashcards
Namenode high availability
Namenode high availability
Signup and view all the flashcards
MapReduce downside
MapReduce downside
Signup and view all the flashcards
Increasing cluster compute power
Increasing cluster compute power
Signup and view all the flashcards
HDFS precursor
HDFS precursor
Signup and view all the flashcards
Hadoop distribution
Hadoop distribution
Signup and view all the flashcards
HDFS and MapReduce originators
HDFS and MapReduce originators
Signup and view all the flashcards
Big Data definition
Big Data definition
Signup and view all the flashcards
Most common data today
Most common data today
Signup and view all the flashcards
The three V's of Big Data
The three V's of Big Data
Signup and view all the flashcards
"Commodity hardware"
"Commodity hardware"
Signup and view all the flashcards
When is a project "Big Data"?
When is a project "Big Data"?
Signup and view all the flashcards