Podcast
Questions and Answers
Qual das seguintes características é uma vantagem dos SGBD Distribuídos?
Qual das seguintes características é uma vantagem dos SGBD Distribuídos?
- Menor complexidade na gestão de dados
- Redução de redundância de dados
- Maior disponibilidade dos dados (correct)
- Menor custo de instalação
Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?
Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?
- Coordenação de transações que envolvem múltiplos sites (correct)
- Configurar a rede de comunicação
- Realizar a fragmentação dos dados
- Armazenar dados em um único local
Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?
Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?
- Fragmentação linear
- Fragmentação aleatória
- Fragmentação sequencial
- Fragmentação horizontal (correct)
O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?
O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?
Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?
Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?
Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?
Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?
Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?
Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?
Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?
Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?
Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?
Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?
Qual das seguintes características é específica do HBase?
Qual das seguintes características é específica do HBase?
O que o Zookeeper ajuda a coordenar em um sistema distribuído?
O que o Zookeeper ajuda a coordenar em um sistema distribuído?
Qual é a função principal do Hive?
Qual é a função principal do Hive?
Quais dados o HBase utiliza como sistema de armazenamento subjacente?
Quais dados o HBase utiliza como sistema de armazenamento subjacente?
Qual é a característica distintiva do modelo de programação MapReduce?
Qual é a característica distintiva do modelo de programação MapReduce?
Como o Hive lida com consultas feitas pelos usuários?
Como o Hive lida com consultas feitas pelos usuários?
Qual das seguintes funções não é atribuída ao Zookeeper?
Qual das seguintes funções não é atribuída ao Zookeeper?
Quais dados o Hive armazena em bancos como MySQL?
Quais dados o Hive armazena em bancos como MySQL?
Qual das seguintes opções descreve HBase corretamente?
Qual das seguintes opções descreve HBase corretamente?
Qual das seguintes características define um SGBD Centralizado?
Qual das seguintes características define um SGBD Centralizado?
Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?
Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?
O que caracteriza a Arquitetura Totalmente Distribuída?
O que caracteriza a Arquitetura Totalmente Distribuída?
Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?
Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?
O HDFS utiliza qual arquitetura para gerenciar seus dados?
O HDFS utiliza qual arquitetura para gerenciar seus dados?
Qual é uma das limitações do HDFS?
Qual é uma das limitações do HDFS?
Qual afirmação caracteriza a função do YARN dentro do Hadoop?
Qual afirmação caracteriza a função do YARN dentro do Hadoop?
Qual é uma característica do modelo de Consistência Eventual?
Qual é uma característica do modelo de Consistência Eventual?
O que é necessário para maximizar o desempenho do HDFS?
O que é necessário para maximizar o desempenho do HDFS?
Quais dados são armazenados em um DataNode no HDFS?
Quais dados são armazenados em um DataNode no HDFS?
Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?
Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?
Qual é a principal função do ApplicationMaster no YARN?
Qual é a principal função do ApplicationMaster no YARN?
Quais componentes são essenciais para a arquitetura básica do HDFS?
Quais componentes são essenciais para a arquitetura básica do HDFS?
Flashcards
SGBD Distribuído
SGBD Distribuído
Um sistema de gestão de bancos de dados que armazena dados em vários computadores conectados em rede.
Fragmentação
Fragmentação
A capacidade de dividir logicamente os dados em partes menores, chamadas fragmentos, para melhorar o desempenho e a localização.
Replicação
Replicação
A criação de cópias idênticas dos dados em diferentes locais da rede, aumentando a disponibilidade e o desempenho.
Consistência
Consistência
Signup and view all the flashcards
Sítio (Site)
Sítio (Site)
Signup and view all the flashcards
Rede de comunicação
Rede de comunicação
Signup and view all the flashcards
Gerenciador de transações distribuídas
Gerenciador de transações distribuídas
Signup and view all the flashcards
Gerenciador de consultas distribuídas
Gerenciador de consultas distribuídas
Signup and view all the flashcards
O que é MapReduce?
O que é MapReduce?
Signup and view all the flashcards
Explique a fase Map do MapReduce.
Explique a fase Map do MapReduce.
Signup and view all the flashcards
Explique a fase Reduce do MapReduce.
Explique a fase Reduce do MapReduce.
Signup and view all the flashcards
O que é HBase?
O que é HBase?
Signup and view all the flashcards
Como o HBase organiza os dados?
Como o HBase organiza os dados?
Signup and view all the flashcards
O que é Zookeeper e para que serve?
O que é Zookeeper e para que serve?
Signup and view all the flashcards
O que é Hive?
O que é Hive?
Signup and view all the flashcards
SGBD Centralizado
SGBD Centralizado
Signup and view all the flashcards
Resiliência
Resiliência
Signup and view all the flashcards
Escalabilidade
Escalabilidade
Signup and view all the flashcards
Melhor Desempenho Local
Melhor Desempenho Local
Signup and view all the flashcards
Distribuição de Carga
Distribuição de Carga
Signup and view all the flashcards
Proximidade aos Dados
Proximidade aos Dados
Signup and view all the flashcards
Arquitetura Centralizada
Arquitetura Centralizada
Signup and view all the flashcards
Arquitetura Totalmente Distribuída
Arquitetura Totalmente Distribuída
Signup and view all the flashcards
Arquitetura Híbrida
Arquitetura Híbrida
Signup and view all the flashcards
Modelos Baseados em Fragmentação
Modelos Baseados em Fragmentação
Signup and view all the flashcards
Modelos Baseados em Replicação
Modelos Baseados em Replicação
Signup and view all the flashcards
Modelos de Consistência
Modelos de Consistência
Signup and view all the flashcards
HDFS (Hadoop Distributed File System)
HDFS (Hadoop Distributed File System)
Signup and view all the flashcards
Arquitetura Master-Slave do HDFS
Arquitetura Master-Slave do HDFS
Signup and view all the flashcards
Study Notes
Sistemas e Gestão de Bases de Dados Distribuídos (SGBD Distribuídos)
- Um SGBD Distribuído é uma coleção de bases de dados interconectadas, fisicamente distribuídas em uma rede de computadores.
- O software (DBMS distribuído) gerencia os dados, tornando a distribuição transparente para os usuários.
- Características Principais:
- Distribuição Lógica: Os dados são tratados como um todo, independente da localização física.
- Transparência:
- Distribuição: Usuários não precisam saber onde os dados estão localizados.
- Fragmentação: Divisões dos dados (fragmentos) são gerenciadas como uma base única.
- Replicação: Dados replicados em diferentes locais são gerenciados sem intervenção do usuário.
- Autonomia Local: Cada site (nó) possui controle sobre seus dados locais.
- Vantagens:
- Maior Disponibilidade: Falha em um site não impede o funcionamento dos outros.
- Melhor Desempenho: Transações são executadas em paralelo.
- Escalabilidade: Adição de sites é mais simples para expandir o sistema.
- Flexibilidade no Design: Fragmentação e replicação podem ser adaptadas às necessidades da aplicação.
- Arquitetura:
- Centralizada: Um site central controla todo o sistema. (Simples, mas com pontos únicos de falha).
- Totalmente Distribuída: Cada site tem autonomia completa. (Mais complexa, mas resiliente).
- Híbrida: Combinação das duas abordagens anteriores. Componentes:
- Sites (Nós): Armazenam partes dos dados.
- Rede de Comunicação: Interconecta os sites para troca de dados.
- Ger. Transações Distribuídas: Coordena transações em múltiplos sites.
- Ger. Consultas Distribuídas: Processa consultas em múltiplos sites.
Conceitos-chave
- Fragmentação: Divisão lógica em partes menores (horizontal, vertical ou híbrida).
- Replicação: Cópias dos dados em diferentes locais para otimizar disponibilidade e desempenho.
- Consistência: Garante que todas as cópias dos dados estejam sincronizadas.
Comparação com SGBD Centralizados
- SGBD Centralizados: Todos os dados em um único local.
- SGBD Distribuídos: Dados em diferentes locais interconectados.
Vantagens dos Distribuídos sobre Centralizados
- Resiliência e Disponibilidade: Melhor tolerância a falhas.
- Escalabilidade: Crescimento horizontal mais fácil.
- Melhor Desempenho Local: Consultas locais são mais rápidas.
- Distribuição de Carga: Melhora o desempenho geral.
- Proximidade aos Dados: Dados geograficamente próximos a usuários.
Arquiteturas e Modelos Comuns
- Arquitetura Centralizada: Um nó central controla todas as operações.
- Arquitetura Totalmente Distribuída: Todos os nós são autônomos.
- Arquitetura Híbrida: Combinação de centralizada e distribuída.
- Modelos Baseados em Fragmentação: Dados divididos logicamente.
- Horizontal: Divisão por linhas.
- Vertical: Divisão por colunas.
- Híbrida: Combinação das duas.
- Modelos Baseados em Replicação: Cópias dos dados espalhadas.
- Replicação Total: Todas as cópias completas dos dados.
- Parcial: Replicação de apenas parte dos dados.
- Modelos de Consistência:
- Forte: Cópias atualizadas imediatamente após alterações.
- Eventual: Cópias sincronizadas gradualmente.
Hadoop Distributed File System (HDFS)
- HDFS: Sistema de arquivos distribuído para grandes volumes de dados.
- Características:
- Master-Slave: NameNode (master) gerencia metadados; DataNodes (slaves) armazenam dados.
- Tolerância a Falhas: Dados replicados em múltiplos nós.
- Imutabilidade (Write Once, Read Many): Dados gravados não podem ser modificados.
- Alta Escalabilidade: Permite adicionar nós para aumentar a capacidade.
- Data Locality: Processamento próximo aos dados para otimizar desempenho.
- Vantagens:
- Custo-Benefício: Usa hardware comum em clusters.
- Confiabilidade: Replicação protegendo contra falhas.
- Utilizado para:
- Armazenamento de arquivos grandes que são divididos em blocos.
- Processamento paralelo usando ferramentas como MapReduce, Spark, etc.
- Limitações:
- Baixa latência para acessos aleatórios.
- Configuração do tamanho de bloco requer atenção.
HDFS e Sistemas de Bases de Dados
- O HDFS não é um SGBD, mas é usado como base para sistemas distribuídos de processamento e análise de dados.
- Ferramentas que estendem HDFS, como YARN, MapReduce, HBase, Zookeeper, Hive, proporcionam funcionalidades adicionais.
Outros Componentes do Hadoop
- YARN (Yet Another Resource Negotiator): Gerenciador de recursos que aloca e monitora recursos no cluster.
- ResourceManager (Master)
- NodeManager (Slave)
- ApplicationMaster
- MapReduce: Modelo de programação para processamento paralelo de dados. Dividido em
Map
eReduce
. - HBase: Banco de dados NoSQL distribuído baseado em colunas, para leitura e escrita em tempo real.
- ZooKeeper: Ferramenta de coordenação e gerenciamento de configuração para sistemas distribuídos.
- Gerencia metadados, sincronização e eleição de líderes.
- Hive: Ferramenta de data warehouse para consultas em dados do HDFS usando SQL. Traduz consultas em tarefas MapReduce, Spark ou Tez.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.