SGBD Distribuídos e Suas Vantagens
31 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual das seguintes características é uma vantagem dos SGBD Distribuídos?

  • Menor complexidade na gestão de dados
  • Redução de redundância de dados
  • Maior disponibilidade dos dados (correct)
  • Menor custo de instalação
  • Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?

  • Coordenação de transações que envolvem múltiplos sites (correct)
  • Configurar a rede de comunicação
  • Realizar a fragmentação dos dados
  • Armazenar dados em um único local
  • Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?

  • Fragmentação linear
  • Fragmentação aleatória
  • Fragmentação sequencial
  • Fragmentação horizontal (correct)
  • O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?

    <p>Cada site opera de forma independente</p> Signup and view all the answers

    Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?

    <p>Centralização da gestão de dados</p> Signup and view all the answers

    Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?

    <p>Replicação</p> Signup and view all the answers

    Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?

    <p>Permite a expansão do sistema com facilidade</p> Signup and view all the answers

    Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?

    <p>Transparência de segurança</p> Signup and view all the answers

    Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?

    <p>Map</p> Signup and view all the answers

    Qual das seguintes características é específica do HBase?

    <p>Consistência Forte</p> Signup and view all the answers

    O que o Zookeeper ajuda a coordenar em um sistema distribuído?

    <p>Gerenciamento de Configuração</p> Signup and view all the answers

    Qual é a função principal do Hive?

    <p>Executar consultas SQL-like</p> Signup and view all the answers

    Quais dados o HBase utiliza como sistema de armazenamento subjacente?

    <p>HDFS</p> Signup and view all the answers

    Qual é a característica distintiva do modelo de programação MapReduce?

    <p>Processamento Paralelo de Dados</p> Signup and view all the answers

    Como o Hive lida com consultas feitas pelos usuários?

    <p>Traduz para tarefas MapReduce</p> Signup and view all the answers

    Qual das seguintes funções não é atribuída ao Zookeeper?

    <p>Armazenamento de Dados em Lote</p> Signup and view all the answers

    Quais dados o Hive armazena em bancos como MySQL?

    <p>Metadados</p> Signup and view all the answers

    Qual das seguintes opções descreve HBase corretamente?

    <p>Banco de dados NoSQL baseado em colunas</p> Signup and view all the answers

    Qual das seguintes características define um SGBD Centralizado?

    <p>O acesso e processamento de dados ocorrem em um ponto central.</p> Signup and view all the answers

    Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?

    <p>Capacidade de escalar horizontalmente com novos nós.</p> Signup and view all the answers

    O que caracteriza a Arquitetura Totalmente Distribuída?

    <p>Todos os nós têm autonomia para gerenciar seus próprios dados.</p> Signup and view all the answers

    Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?

    <p>Fragmentação Horizontal</p> Signup and view all the answers

    O HDFS utiliza qual arquitetura para gerenciar seus dados?

    <p>Master-Slave</p> Signup and view all the answers

    Qual é uma das limitações do HDFS?

    <p>Não é ideal para acessos aleatórios e de baixa latência.</p> Signup and view all the answers

    Qual afirmação caracteriza a função do YARN dentro do Hadoop?

    <p>Gerencia os recursos do cluster e aloca CPU e memória.</p> Signup and view all the answers

    Qual é uma característica do modelo de Consistência Eventual?

    <p>As cópias dos dados são atualizadas em um tempo posterior.</p> Signup and view all the answers

    O que é necessário para maximizar o desempenho do HDFS?

    <p>Configuração cuidadosa do tamanho do bloco.</p> Signup and view all the answers

    Quais dados são armazenados em um DataNode no HDFS?

    <p>Os blocos de dados propriamente ditos.</p> Signup and view all the answers

    Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?

    <p>Uso de hardware comum, reduzindo custos.</p> Signup and view all the answers

    Qual é a principal função do ApplicationMaster no YARN?

    <p>Coordenar a execução de uma aplicação específica.</p> Signup and view all the answers

    Quais componentes são essenciais para a arquitetura básica do HDFS?

    <p>NameNode, DataNode, e a arquitetura de replicação.</p> Signup and view all the answers

    Study Notes

    Sistemas e Gestão de Bases de Dados Distribuídos (SGBD Distribuídos)

    • Um SGBD Distribuído é uma coleção de bases de dados interconectadas, fisicamente distribuídas em uma rede de computadores.
    • O software (DBMS distribuído) gerencia os dados, tornando a distribuição transparente para os usuários.
    • Características Principais:
      • Distribuição Lógica: Os dados são tratados como um todo, independente da localização física.
      • Transparência:
        • Distribuição: Usuários não precisam saber onde os dados estão localizados.
        • Fragmentação: Divisões dos dados (fragmentos) são gerenciadas como uma base única.
        • Replicação: Dados replicados em diferentes locais são gerenciados sem intervenção do usuário.
      • Autonomia Local: Cada site (nó) possui controle sobre seus dados locais.
    • Vantagens:
      • Maior Disponibilidade: Falha em um site não impede o funcionamento dos outros.
      • Melhor Desempenho: Transações são executadas em paralelo.
      • Escalabilidade: Adição de sites é mais simples para expandir o sistema.
      • Flexibilidade no Design: Fragmentação e replicação podem ser adaptadas às necessidades da aplicação.
    • Arquitetura:
      • Centralizada: Um site central controla todo o sistema. (Simples, mas com pontos únicos de falha).
      • Totalmente Distribuída: Cada site tem autonomia completa. (Mais complexa, mas resiliente).
      • Híbrida: Combinação das duas abordagens anteriores. Componentes:
        • Sites (Nós): Armazenam partes dos dados.
        • Rede de Comunicação: Interconecta os sites para troca de dados.
        • Ger. Transações Distribuídas: Coordena transações em múltiplos sites.
        • Ger. Consultas Distribuídas: Processa consultas em múltiplos sites.

    Conceitos-chave

    • Fragmentação: Divisão lógica em partes menores (horizontal, vertical ou híbrida).
    • Replicação: Cópias dos dados em diferentes locais para otimizar disponibilidade e desempenho.
    • Consistência: Garante que todas as cópias dos dados estejam sincronizadas.

    Comparação com SGBD Centralizados

    • SGBD Centralizados: Todos os dados em um único local.
    • SGBD Distribuídos: Dados em diferentes locais interconectados.

    Vantagens dos Distribuídos sobre Centralizados

    • Resiliência e Disponibilidade: Melhor tolerância a falhas.
    • Escalabilidade: Crescimento horizontal mais fácil.
    • Melhor Desempenho Local: Consultas locais são mais rápidas.
    • Distribuição de Carga: Melhora o desempenho geral.
    • Proximidade aos Dados: Dados geograficamente próximos a usuários.

    Arquiteturas e Modelos Comuns

    • Arquitetura Centralizada: Um nó central controla todas as operações.
    • Arquitetura Totalmente Distribuída: Todos os nós são autônomos.
    • Arquitetura Híbrida: Combinação de centralizada e distribuída.
    • Modelos Baseados em Fragmentação: Dados divididos logicamente.
      • Horizontal: Divisão por linhas.
      • Vertical: Divisão por colunas.
      • Híbrida: Combinação das duas.
    • Modelos Baseados em Replicação: Cópias dos dados espalhadas.
      • Replicação Total: Todas as cópias completas dos dados.
      • Parcial: Replicação de apenas parte dos dados.
    • Modelos de Consistência:
      • Forte: Cópias atualizadas imediatamente após alterações.
      • Eventual: Cópias sincronizadas gradualmente.

    Hadoop Distributed File System (HDFS)

    • HDFS: Sistema de arquivos distribuído para grandes volumes de dados.
    • Características:
      • Master-Slave: NameNode (master) gerencia metadados; DataNodes (slaves) armazenam dados.
      • Tolerância a Falhas: Dados replicados em múltiplos nós.
      • Imutabilidade (Write Once, Read Many): Dados gravados não podem ser modificados.
      • Alta Escalabilidade: Permite adicionar nós para aumentar a capacidade.
      • Data Locality: Processamento próximo aos dados para otimizar desempenho.
    • Vantagens:
      • Custo-Benefício: Usa hardware comum em clusters.
      • Confiabilidade: Replicação protegendo contra falhas.
    • Utilizado para:
      • Armazenamento de arquivos grandes que são divididos em blocos.
      • Processamento paralelo usando ferramentas como MapReduce, Spark, etc.
    • Limitações:
      • Baixa latência para acessos aleatórios.
      • Configuração do tamanho de bloco requer atenção.

    HDFS e Sistemas de Bases de Dados

    • O HDFS não é um SGBD, mas é usado como base para sistemas distribuídos de processamento e análise de dados.
    • Ferramentas que estendem HDFS, como YARN, MapReduce, HBase, Zookeeper, Hive, proporcionam funcionalidades adicionais.

    Outros Componentes do Hadoop

    • YARN (Yet Another Resource Negotiator): Gerenciador de recursos que aloca e monitora recursos no cluster.
      • ResourceManager (Master)
      • NodeManager (Slave)
      • ApplicationMaster
    • MapReduce: Modelo de programação para processamento paralelo de dados. Dividido em Map e Reduce.
    • HBase: Banco de dados NoSQL distribuído baseado em colunas, para leitura e escrita em tempo real.
    • ZooKeeper: Ferramenta de coordenação e gerenciamento de configuração para sistemas distribuídos.
      • Gerencia metadados, sincronização e eleição de líderes.
    • Hive: Ferramenta de data warehouse para consultas em dados do HDFS usando SQL. Traduz consultas em tarefas MapReduce, Spark ou Tez.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Este quiz aborda os Sistemas de Gestão de Bases de Dados Distribuídos, suas características principais, como a transparência de distribuição e a autonomia local. Explore também as vantagens que esses sistemas oferecem, como maior disponibilidade e melhor desempenho nas transações.

    More Like This

    Use Quizgecko on...
    Browser
    Browser