Podcast
Questions and Answers
Qual das seguintes características é uma vantagem dos SGBD Distribuídos?
Qual das seguintes características é uma vantagem dos SGBD Distribuídos?
Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?
Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?
Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?
Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?
O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?
O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?
Signup and view all the answers
Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?
Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?
Signup and view all the answers
Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?
Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?
Signup and view all the answers
Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?
Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?
Signup and view all the answers
Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?
Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?
Signup and view all the answers
Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?
Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?
Signup and view all the answers
Qual das seguintes características é específica do HBase?
Qual das seguintes características é específica do HBase?
Signup and view all the answers
O que o Zookeeper ajuda a coordenar em um sistema distribuído?
O que o Zookeeper ajuda a coordenar em um sistema distribuído?
Signup and view all the answers
Qual é a função principal do Hive?
Qual é a função principal do Hive?
Signup and view all the answers
Quais dados o HBase utiliza como sistema de armazenamento subjacente?
Quais dados o HBase utiliza como sistema de armazenamento subjacente?
Signup and view all the answers
Qual é a característica distintiva do modelo de programação MapReduce?
Qual é a característica distintiva do modelo de programação MapReduce?
Signup and view all the answers
Como o Hive lida com consultas feitas pelos usuários?
Como o Hive lida com consultas feitas pelos usuários?
Signup and view all the answers
Qual das seguintes funções não é atribuída ao Zookeeper?
Qual das seguintes funções não é atribuída ao Zookeeper?
Signup and view all the answers
Quais dados o Hive armazena em bancos como MySQL?
Quais dados o Hive armazena em bancos como MySQL?
Signup and view all the answers
Qual das seguintes opções descreve HBase corretamente?
Qual das seguintes opções descreve HBase corretamente?
Signup and view all the answers
Qual das seguintes características define um SGBD Centralizado?
Qual das seguintes características define um SGBD Centralizado?
Signup and view all the answers
Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?
Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?
Signup and view all the answers
O que caracteriza a Arquitetura Totalmente Distribuída?
O que caracteriza a Arquitetura Totalmente Distribuída?
Signup and view all the answers
Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?
Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?
Signup and view all the answers
O HDFS utiliza qual arquitetura para gerenciar seus dados?
O HDFS utiliza qual arquitetura para gerenciar seus dados?
Signup and view all the answers
Qual é uma das limitações do HDFS?
Qual é uma das limitações do HDFS?
Signup and view all the answers
Qual afirmação caracteriza a função do YARN dentro do Hadoop?
Qual afirmação caracteriza a função do YARN dentro do Hadoop?
Signup and view all the answers
Qual é uma característica do modelo de Consistência Eventual?
Qual é uma característica do modelo de Consistência Eventual?
Signup and view all the answers
O que é necessário para maximizar o desempenho do HDFS?
O que é necessário para maximizar o desempenho do HDFS?
Signup and view all the answers
Quais dados são armazenados em um DataNode no HDFS?
Quais dados são armazenados em um DataNode no HDFS?
Signup and view all the answers
Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?
Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?
Signup and view all the answers
Qual é a principal função do ApplicationMaster no YARN?
Qual é a principal função do ApplicationMaster no YARN?
Signup and view all the answers
Quais componentes são essenciais para a arquitetura básica do HDFS?
Quais componentes são essenciais para a arquitetura básica do HDFS?
Signup and view all the answers
Study Notes
Sistemas e Gestão de Bases de Dados Distribuídos (SGBD Distribuídos)
- Um SGBD Distribuído é uma coleção de bases de dados interconectadas, fisicamente distribuídas em uma rede de computadores.
- O software (DBMS distribuído) gerencia os dados, tornando a distribuição transparente para os usuários.
-
Características Principais:
- Distribuição Lógica: Os dados são tratados como um todo, independente da localização física.
-
Transparência:
- Distribuição: Usuários não precisam saber onde os dados estão localizados.
- Fragmentação: Divisões dos dados (fragmentos) são gerenciadas como uma base única.
- Replicação: Dados replicados em diferentes locais são gerenciados sem intervenção do usuário.
- Autonomia Local: Cada site (nó) possui controle sobre seus dados locais.
-
Vantagens:
- Maior Disponibilidade: Falha em um site não impede o funcionamento dos outros.
- Melhor Desempenho: Transações são executadas em paralelo.
- Escalabilidade: Adição de sites é mais simples para expandir o sistema.
- Flexibilidade no Design: Fragmentação e replicação podem ser adaptadas às necessidades da aplicação.
-
Arquitetura:
- Centralizada: Um site central controla todo o sistema. (Simples, mas com pontos únicos de falha).
- Totalmente Distribuída: Cada site tem autonomia completa. (Mais complexa, mas resiliente).
-
Híbrida: Combinação das duas abordagens anteriores. Componentes:
- Sites (Nós): Armazenam partes dos dados.
- Rede de Comunicação: Interconecta os sites para troca de dados.
- Ger. Transações Distribuídas: Coordena transações em múltiplos sites.
- Ger. Consultas Distribuídas: Processa consultas em múltiplos sites.
Conceitos-chave
- Fragmentação: Divisão lógica em partes menores (horizontal, vertical ou híbrida).
- Replicação: Cópias dos dados em diferentes locais para otimizar disponibilidade e desempenho.
- Consistência: Garante que todas as cópias dos dados estejam sincronizadas.
Comparação com SGBD Centralizados
- SGBD Centralizados: Todos os dados em um único local.
- SGBD Distribuídos: Dados em diferentes locais interconectados.
Vantagens dos Distribuídos sobre Centralizados
- Resiliência e Disponibilidade: Melhor tolerância a falhas.
- Escalabilidade: Crescimento horizontal mais fácil.
- Melhor Desempenho Local: Consultas locais são mais rápidas.
- Distribuição de Carga: Melhora o desempenho geral.
- Proximidade aos Dados: Dados geograficamente próximos a usuários.
Arquiteturas e Modelos Comuns
- Arquitetura Centralizada: Um nó central controla todas as operações.
- Arquitetura Totalmente Distribuída: Todos os nós são autônomos.
- Arquitetura Híbrida: Combinação de centralizada e distribuída.
-
Modelos Baseados em Fragmentação: Dados divididos logicamente.
- Horizontal: Divisão por linhas.
- Vertical: Divisão por colunas.
- Híbrida: Combinação das duas.
-
Modelos Baseados em Replicação: Cópias dos dados espalhadas.
- Replicação Total: Todas as cópias completas dos dados.
- Parcial: Replicação de apenas parte dos dados.
-
Modelos de Consistência:
- Forte: Cópias atualizadas imediatamente após alterações.
- Eventual: Cópias sincronizadas gradualmente.
Hadoop Distributed File System (HDFS)
- HDFS: Sistema de arquivos distribuído para grandes volumes de dados.
-
Características:
- Master-Slave: NameNode (master) gerencia metadados; DataNodes (slaves) armazenam dados.
- Tolerância a Falhas: Dados replicados em múltiplos nós.
- Imutabilidade (Write Once, Read Many): Dados gravados não podem ser modificados.
- Alta Escalabilidade: Permite adicionar nós para aumentar a capacidade.
- Data Locality: Processamento próximo aos dados para otimizar desempenho.
-
Vantagens:
- Custo-Benefício: Usa hardware comum em clusters.
- Confiabilidade: Replicação protegendo contra falhas.
-
Utilizado para:
- Armazenamento de arquivos grandes que são divididos em blocos.
- Processamento paralelo usando ferramentas como MapReduce, Spark, etc.
-
Limitações:
- Baixa latência para acessos aleatórios.
- Configuração do tamanho de bloco requer atenção.
HDFS e Sistemas de Bases de Dados
- O HDFS não é um SGBD, mas é usado como base para sistemas distribuídos de processamento e análise de dados.
- Ferramentas que estendem HDFS, como YARN, MapReduce, HBase, Zookeeper, Hive, proporcionam funcionalidades adicionais.
Outros Componentes do Hadoop
-
YARN (Yet Another Resource Negotiator): Gerenciador de recursos que aloca e monitora recursos no cluster.
- ResourceManager (Master)
- NodeManager (Slave)
- ApplicationMaster
-
MapReduce: Modelo de programação para processamento paralelo de dados. Dividido em
Map
eReduce
. - HBase: Banco de dados NoSQL distribuído baseado em colunas, para leitura e escrita em tempo real.
-
ZooKeeper: Ferramenta de coordenação e gerenciamento de configuração para sistemas distribuídos.
- Gerencia metadados, sincronização e eleição de líderes.
- Hive: Ferramenta de data warehouse para consultas em dados do HDFS usando SQL. Traduz consultas em tarefas MapReduce, Spark ou Tez.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Description
Este quiz aborda os Sistemas de Gestão de Bases de Dados Distribuídos, suas características principais, como a transparência de distribuição e a autonomia local. Explore também as vantagens que esses sistemas oferecem, como maior disponibilidade e melhor desempenho nas transações.