SGBD Distribuídos e Suas Vantagens
31 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual das seguintes características é uma vantagem dos SGBD Distribuídos?

  • Menor complexidade na gestão de dados
  • Redução de redundância de dados
  • Maior disponibilidade dos dados (correct)
  • Menor custo de instalação
  • Em um SGBD Distribuído, qual é a função do gerenciador de transações distribuídas?

  • Coordenação de transações que envolvem múltiplos sites (correct)
  • Configurar a rede de comunicação
  • Realizar a fragmentação dos dados
  • Armazenar dados em um único local
  • Qual é um dos tipos de fragmentação que pode ser aplicada a um SGBD Distribuído?

  • Fragmentação linear
  • Fragmentação aleatória
  • Fragmentação sequencial
  • Fragmentação horizontal (correct)
  • O que caracteriza uma arquitetura totalmente distribuída em um SGBD Distribuído?

    <p>Cada site opera de forma independente (A)</p> Signup and view all the answers

    Qual dos seguintes aspectos não é uma característica de um SGBD Distribuído?

    <p>Centralização da gestão de dados (D)</p> Signup and view all the answers

    Que conceito se refere ao processo de cópia de dados para vários locais em um SGBD Distribuído?

    <p>Replicação (B)</p> Signup and view all the answers

    Por que a escalabilidade é considerada uma vantagem dos SGBD Distribuídos?

    <p>Permite a expansão do sistema com facilidade (A)</p> Signup and view all the answers

    Qual das seguintes opções não representa um tipo de transparência em um SGBD Distribuído?

    <p>Transparência de segurança (C)</p> Signup and view all the answers

    Qual é a fase do MapReduce que divide o conjunto de dados em pares de chave-valor?

    <p>Map (A)</p> Signup and view all the answers

    Qual das seguintes características é específica do HBase?

    <p>Consistência Forte (C)</p> Signup and view all the answers

    O que o Zookeeper ajuda a coordenar em um sistema distribuído?

    <p>Gerenciamento de Configuração (A)</p> Signup and view all the answers

    Qual é a função principal do Hive?

    <p>Executar consultas SQL-like (A)</p> Signup and view all the answers

    Quais dados o HBase utiliza como sistema de armazenamento subjacente?

    <p>HDFS (D)</p> Signup and view all the answers

    Qual é a característica distintiva do modelo de programação MapReduce?

    <p>Processamento Paralelo de Dados (B)</p> Signup and view all the answers

    Como o Hive lida com consultas feitas pelos usuários?

    <p>Traduz para tarefas MapReduce (C)</p> Signup and view all the answers

    Qual das seguintes funções não é atribuída ao Zookeeper?

    <p>Armazenamento de Dados em Lote (A)</p> Signup and view all the answers

    Quais dados o Hive armazena em bancos como MySQL?

    <p>Metadados (B)</p> Signup and view all the answers

    Qual das seguintes opções descreve HBase corretamente?

    <p>Banco de dados NoSQL baseado em colunas (A)</p> Signup and view all the answers

    Qual das seguintes características define um SGBD Centralizado?

    <p>O acesso e processamento de dados ocorrem em um ponto central. (B)</p> Signup and view all the answers

    Qual das seguintes opções é uma vantagem dos SGBDs Distribuídos em relação aos Centralizados?

    <p>Capacidade de escalar horizontalmente com novos nós. (B)</p> Signup and view all the answers

    O que caracteriza a Arquitetura Totalmente Distribuída?

    <p>Todos os nós têm autonomia para gerenciar seus próprios dados. (B)</p> Signup and view all the answers

    Qual tipo de fragmentação permite que os dados sejam divididos por linhas em diferentes localizações?

    <p>Fragmentação Horizontal (B)</p> Signup and view all the answers

    O HDFS utiliza qual arquitetura para gerenciar seus dados?

    <p>Master-Slave (A)</p> Signup and view all the answers

    Qual é uma das limitações do HDFS?

    <p>Não é ideal para acessos aleatórios e de baixa latência. (D)</p> Signup and view all the answers

    Qual afirmação caracteriza a função do YARN dentro do Hadoop?

    <p>Gerencia os recursos do cluster e aloca CPU e memória. (C)</p> Signup and view all the answers

    Qual é uma característica do modelo de Consistência Eventual?

    <p>As cópias dos dados são atualizadas em um tempo posterior. (B)</p> Signup and view all the answers

    O que é necessário para maximizar o desempenho do HDFS?

    <p>Configuração cuidadosa do tamanho do bloco. (C)</p> Signup and view all the answers

    Quais dados são armazenados em um DataNode no HDFS?

    <p>Os blocos de dados propriamente ditos. (A)</p> Signup and view all the answers

    Qual é uma vantagem do HDFS em comparação com sistemas de arquivos tradicionais?

    <p>Uso de hardware comum, reduzindo custos. (A)</p> Signup and view all the answers

    Qual é a principal função do ApplicationMaster no YARN?

    <p>Coordenar a execução de uma aplicação específica. (D)</p> Signup and view all the answers

    Quais componentes são essenciais para a arquitetura básica do HDFS?

    <p>NameNode, DataNode, e a arquitetura de replicação. (D)</p> Signup and view all the answers

    Flashcards

    SGBD Distribuído

    Um sistema de gestão de bancos de dados que armazena dados em vários computadores conectados em rede.

    Fragmentação

    A capacidade de dividir logicamente os dados em partes menores, chamadas fragmentos, para melhorar o desempenho e a localização.

    Replicação

    A criação de cópias idênticas dos dados em diferentes locais da rede, aumentando a disponibilidade e o desempenho.

    Consistência

    Garante que todas as cópias dos dados sejam consistentes e idênticas em todos os locais da rede.

    Signup and view all the flashcards

    Sítio (Site)

    Um local físico que armazena uma parte do banco de dados distribuído.

    Signup and view all the flashcards

    Rede de comunicação

    Uma rede que conecta os diferentes sites de um SGBD distribuído, permitindo a comunicação entre eles.

    Signup and view all the flashcards

    Gerenciador de transações distribuídas

    Coordena as transações que envolvem múltiplos sites, garantindo a integridade dos dados.

    Signup and view all the flashcards

    Gerenciador de consultas distribuídas

    Processa as consultas e coordena a execução em diferentes sites, garantindo que os resultados sejam consistentes.

    Signup and view all the flashcards

    O que é MapReduce?

    O MapReduce é um modelo de programação distribuída que processa grandes conjuntos de dados de forma paralela, dividindo as operações em duas fases: Map e Reduce.

    Signup and view all the flashcards

    Explique a fase Map do MapReduce.

    Na fase Map, o conjunto de dados é dividido em pares de chave-valor e uma função de transformação é aplicada a cada par.

    Signup and view all the flashcards

    Explique a fase Reduce do MapReduce.

    Na fase Reduce, os resultados da fase Map são combinados e processados, geralmente para calcular agregados ou reduzir a quantidade de dados.

    Signup and view all the flashcards

    O que é HBase?

    O HBase é um banco de dados NoSQL distribuído baseado em colunas, ideal para operações de leitura e escrita em tempo real.

    Signup and view all the flashcards

    Como o HBase organiza os dados?

    O HBase armazena dados em "famílias de colunas", permitindo consultas mais rápidas para conjuntos específicos de dados.

    Signup and view all the flashcards

    O que é Zookeeper e para que serve?

    O Zookeeper é uma ferramenta de coordenação para sistemas distribuídos, gerenciando configurações, garantindo sincronização entre nós e realizando eleições de líderes.

    Signup and view all the flashcards

    O que é Hive?

    O Hive é uma ferramenta de data warehouse que permite executar consultas SQL-like sobre dados armazenados no HDFS, ideal para analistas que dominam SQL.

    Signup and view all the flashcards

    SGBD Centralizado

    Um sistema que armazena todos os dados em um único local, geralmente em um servidor principal. O acesso e processamento são centralizados.

    Signup and view all the flashcards

    Resiliência

    Capacidade de um sistema continuar funcionando mesmo com falhas em partes dele, garantindo alta disponibilidade.

    Signup and view all the flashcards

    Escalabilidade

    Capacidade de um sistema crescer horizontalmente, adicionando mais recursos para lidar com mais dados e usuários.

    Signup and view all the flashcards

    Melhor Desempenho Local

    Consultas podem ser processadas no local onde os dados residem, reduzindo o tempo de resposta.

    Signup and view all the flashcards

    Distribuição de Carga

    A carga de trabalho é distribuída entre vários nós, evitando sobrecarga em um único servidor.

    Signup and view all the flashcards

    Proximidade aos Dados

    Dados são armazenados próximos aos usuários, reduzindo o tempo de acesso para eles.

    Signup and view all the flashcards

    Arquitetura Centralizada

    Um nó central controla e coordena as operações em todos os outros nós. Simples, mas com gargalos e um único ponto de falha.

    Signup and view all the flashcards

    Arquitetura Totalmente Distribuída

    Todos os nós são autônomos para gerenciar seus próprios dados. Complexa, mas escalável e resiliente.

    Signup and view all the flashcards

    Arquitetura Híbrida

    Combina elementos de arquiteturas centralizadas e totalmente distribuídas, com nós principais coordenando subconjuntos de nós secundários.

    Signup and view all the flashcards

    Modelos Baseados em Fragmentação

    Divisão dos dados em diferentes locais por linhas (horizontal) ou colunas (vertical) ou uma combinação de ambas.

    Signup and view all the flashcards

    Modelos Baseados em Replicação

    Todos os nós possuem uma cópia completa do banco de dados (total) ou apenas partes dos dados replicados (parcial).

    Signup and view all the flashcards

    Modelos de Consistência

    Todas as cópias dos dados são atualizadas imediatamente após qualquer alteração (forte) ou gradualmente (eventual).

    Signup and view all the flashcards

    HDFS (Hadoop Distributed File System)

    Um sistema de arquivos distribuído projetado para armazenar e gerenciar grandes volumes de dados em clusters. Essencial para o Hadoop.

    Signup and view all the flashcards

    Arquitetura Master-Slave do HDFS

    O NameNode gerencia metadados (estrutura de diretórios) e os DataNodes armazenam blocos de dados. Ambos trabalhando juntos.

    Signup and view all the flashcards

    Study Notes

    Sistemas e Gestão de Bases de Dados Distribuídos (SGBD Distribuídos)

    • Um SGBD Distribuído é uma coleção de bases de dados interconectadas, fisicamente distribuídas em uma rede de computadores.
    • O software (DBMS distribuído) gerencia os dados, tornando a distribuição transparente para os usuários.
    • Características Principais:
      • Distribuição Lógica: Os dados são tratados como um todo, independente da localização física.
      • Transparência:
        • Distribuição: Usuários não precisam saber onde os dados estão localizados.
        • Fragmentação: Divisões dos dados (fragmentos) são gerenciadas como uma base única.
        • Replicação: Dados replicados em diferentes locais são gerenciados sem intervenção do usuário.
      • Autonomia Local: Cada site (nó) possui controle sobre seus dados locais.
    • Vantagens:
      • Maior Disponibilidade: Falha em um site não impede o funcionamento dos outros.
      • Melhor Desempenho: Transações são executadas em paralelo.
      • Escalabilidade: Adição de sites é mais simples para expandir o sistema.
      • Flexibilidade no Design: Fragmentação e replicação podem ser adaptadas às necessidades da aplicação.
    • Arquitetura:
      • Centralizada: Um site central controla todo o sistema. (Simples, mas com pontos únicos de falha).
      • Totalmente Distribuída: Cada site tem autonomia completa. (Mais complexa, mas resiliente).
      • Híbrida: Combinação das duas abordagens anteriores. Componentes:
        • Sites (Nós): Armazenam partes dos dados.
        • Rede de Comunicação: Interconecta os sites para troca de dados.
        • Ger. Transações Distribuídas: Coordena transações em múltiplos sites.
        • Ger. Consultas Distribuídas: Processa consultas em múltiplos sites.

    Conceitos-chave

    • Fragmentação: Divisão lógica em partes menores (horizontal, vertical ou híbrida).
    • Replicação: Cópias dos dados em diferentes locais para otimizar disponibilidade e desempenho.
    • Consistência: Garante que todas as cópias dos dados estejam sincronizadas.

    Comparação com SGBD Centralizados

    • SGBD Centralizados: Todos os dados em um único local.
    • SGBD Distribuídos: Dados em diferentes locais interconectados.

    Vantagens dos Distribuídos sobre Centralizados

    • Resiliência e Disponibilidade: Melhor tolerância a falhas.
    • Escalabilidade: Crescimento horizontal mais fácil.
    • Melhor Desempenho Local: Consultas locais são mais rápidas.
    • Distribuição de Carga: Melhora o desempenho geral.
    • Proximidade aos Dados: Dados geograficamente próximos a usuários.

    Arquiteturas e Modelos Comuns

    • Arquitetura Centralizada: Um nó central controla todas as operações.
    • Arquitetura Totalmente Distribuída: Todos os nós são autônomos.
    • Arquitetura Híbrida: Combinação de centralizada e distribuída.
    • Modelos Baseados em Fragmentação: Dados divididos logicamente.
      • Horizontal: Divisão por linhas.
      • Vertical: Divisão por colunas.
      • Híbrida: Combinação das duas.
    • Modelos Baseados em Replicação: Cópias dos dados espalhadas.
      • Replicação Total: Todas as cópias completas dos dados.
      • Parcial: Replicação de apenas parte dos dados.
    • Modelos de Consistência:
      • Forte: Cópias atualizadas imediatamente após alterações.
      • Eventual: Cópias sincronizadas gradualmente.

    Hadoop Distributed File System (HDFS)

    • HDFS: Sistema de arquivos distribuído para grandes volumes de dados.
    • Características:
      • Master-Slave: NameNode (master) gerencia metadados; DataNodes (slaves) armazenam dados.
      • Tolerância a Falhas: Dados replicados em múltiplos nós.
      • Imutabilidade (Write Once, Read Many): Dados gravados não podem ser modificados.
      • Alta Escalabilidade: Permite adicionar nós para aumentar a capacidade.
      • Data Locality: Processamento próximo aos dados para otimizar desempenho.
    • Vantagens:
      • Custo-Benefício: Usa hardware comum em clusters.
      • Confiabilidade: Replicação protegendo contra falhas.
    • Utilizado para:
      • Armazenamento de arquivos grandes que são divididos em blocos.
      • Processamento paralelo usando ferramentas como MapReduce, Spark, etc.
    • Limitações:
      • Baixa latência para acessos aleatórios.
      • Configuração do tamanho de bloco requer atenção.

    HDFS e Sistemas de Bases de Dados

    • O HDFS não é um SGBD, mas é usado como base para sistemas distribuídos de processamento e análise de dados.
    • Ferramentas que estendem HDFS, como YARN, MapReduce, HBase, Zookeeper, Hive, proporcionam funcionalidades adicionais.

    Outros Componentes do Hadoop

    • YARN (Yet Another Resource Negotiator): Gerenciador de recursos que aloca e monitora recursos no cluster.
      • ResourceManager (Master)
      • NodeManager (Slave)
      • ApplicationMaster
    • MapReduce: Modelo de programação para processamento paralelo de dados. Dividido em Map e Reduce.
    • HBase: Banco de dados NoSQL distribuído baseado em colunas, para leitura e escrita em tempo real.
    • ZooKeeper: Ferramenta de coordenação e gerenciamento de configuração para sistemas distribuídos.
      • Gerencia metadados, sincronização e eleição de líderes.
    • Hive: Ferramenta de data warehouse para consultas em dados do HDFS usando SQL. Traduz consultas em tarefas MapReduce, Spark ou Tez.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Este quiz aborda os Sistemas de Gestão de Bases de Dados Distribuídos, suas características principais, como a transparência de distribuição e a autonomia local. Explore também as vantagens que esses sistemas oferecem, como maior disponibilidade e melhor desempenho nas transações.

    More Like This

    Use Quizgecko on...
    Browser
    Browser