Arquitetura Lambda e Kappa
40 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quais são as características que os data lakes não suportam?

  • Transações ACID (correct)
  • Consistência e isolamento (correct)
  • Imposição de padrões complexos
  • Qualidade dos dados (correct)
  • Qual solução é proposta para resolver os desafios ACID nos data lakes?

  • Data Hub
  • Data Warehouse
  • Data Lakehouse (correct)
  • Data Mart
  • O que caracteriza um Lakehouse em comparação a um sistema de várias soluções?

  • Esquema simplificado (correct)
  • Maior complexidade de administração
  • Movimentação excessiva de dados
  • Armazenamento de dados desatualizados
  • Qual é uma das vantagens de utilizar um único Data Lakehouse?

    <p>Acesso direto aos dados</p> Signup and view all the answers

    Qual é uma limitação dos data warehouses tradicionais em relação a dados não estruturados?

    <p>Otimização para dados estruturados</p> Signup and view all the answers

    Qual das seguintes afirmações sobre a Snowflake é correta?

    <p>Serve como um exemplo de Lakehouse nativo</p> Signup and view all the answers

    Qual é uma desvantagem em manter vários sistemas de dados?

    <p>Custo elevado</p> Signup and view all the answers

    Qual é a principal função de um Data Lakehouse?

    <p>Unir características de data lakes e data warehouses</p> Signup and view all the answers

    Quais são as garantias oferecidas pelo Delta Lake em relação a alterações de dados?

    <p>As alterações de dados são confirmadas atomicamente.</p> Signup and view all the answers

    Como o Delta Lake lida com metadados em larga escala?

    <p>Aproveita o Spark para processar metadados de bilhões de arquivos.</p> Signup and view all the answers

    O que o log de transações do Delta Lake fornece aos desenvolvedores?

    <p>Detalhes sobre ações realizadas anteriormente.</p> Signup and view all the answers

    Qual das opções abaixo NÃO é suportada pelo Delta Lake?

    <p>Operações de consulta de dados não estruturados.</p> Signup and view all the answers

    Como o Delta Lake trata a evolução do esquema?

    <p>Impede a entrada de dados que não correspondem ao esquema.</p> Signup and view all the answers

    Qual é uma das funcionalidades principais da tabela Delta Lake?

    <p>Funciona tanto em lote quanto como fonte de streaming.</p> Signup and view all the answers

    Qual característica do Delta Lake garante a durabilidade de dados?

    <p>Confirmação atômica das alterações de dados.</p> Signup and view all the answers

    Qual a finalidade da captura de alteração de dados (CDC) no Delta Lake?

    <p>Apoiar operações complexas como atualizações e exclusões.</p> Signup and view all the answers

    Qual é a função principal do Delta Lake?

    <p>Garantir a integridade de dados durante operações de leitura e escrita.</p> Signup and view all the answers

    O que caracteriza um Data Lakehouse?

    <p>É uma fusão entre data warehouses e data lakes, permitindo análises em tempo real.</p> Signup and view all the answers

    Quais problemas estão associados a um Data Swamp?

    <p>Dificuldades na recuperação e entendimento dos dados.</p> Signup and view all the answers

    Qual é um benefício do uso do comando mergeSchema no Delta Lake?

    <p>Facilitar a evolução do esquema à medida que novos dados são adicionados.</p> Signup and view all the answers

    Como o Delta Lake assegura a evolução do esquema?

    <p>Utilizando os mecanismos de mergeSchema e overwriteSchema.</p> Signup and view all the answers

    Qual é uma característica distintiva de um Data Lake em comparação a um Data Warehouse?

    <p>Permite armazenar dados em qualquer formato.</p> Signup and view all the answers

    O que é necessário para evitar que um Data Lake se torne um Data Swamp?

    <p>Implementar boas práticas de gerenciamento e governança de dados.</p> Signup and view all the answers

    Qual é um conceito importante abordado por Matthew Powers sobre Delta Lake?

    <p>A imposição de esquema é essencial para garantir a integridade dos dados.</p> Signup and view all the answers

    Qual é o valor inicial da coluna 'id' no conjunto de dados?

    <p>1</p> Signup and view all the answers

    Qual a razão pela qual a transação de acréscimo não foi considerada uma incompatibilidade de esquema?

    <p>A coluna 'id' é nullable, permitindo valores nulos.</p> Signup and view all the answers

    O que acontece quando se tenta anexar dados com duas colunas a um arquivo Delta com três colunas?

    <p>Os dados são anexados sem problemas.</p> Signup and view all the answers

    Qual é o número de registros após a operação de acréscimo bem-sucedida?

    <p>200.000</p> Signup and view all the answers

    Se o modo de operação fosse alterado para sobrescrever, o que aconteceria com o esquema do arquivo Delta?

    <p>O esquema permaneceria com três colunas.</p> Signup and view all the answers

    Após adicionar 100.000 registros, quantos valores na coluna 'id' devem ser nulos?

    <p>100.000</p> Signup and view all the answers

    Qual opção deve ser adicionada para mudar o esquema de três colunas para apenas duas colunas no arquivo Delta?

    <p>option(‘overwriteSchema’, ‘true’)</p> Signup and view all the answers

    Quando os dados são lidos para o quadro de dados events_delta, quantas colunas são mostradas?

    <p>3 colunas</p> Signup and view all the answers

    Qual é uma característica dos dados armazenados na camada de lote?

    <p>Os dados brutos são imutáveis e não são substituídos.</p> Signup and view all the answers

    Qual é a desvantagem da arquitetura lambda em comparação com a arquitetura kappa?

    <p>Ela requer lógica de cálculo duplicada.</p> Signup and view all the answers

    Como os eventos são tratados na arquitetura kappa?

    <p>Os eventos são imutáveis e cada novo evento altera o estado atual.</p> Signup and view all the answers

    Qual é a principal diferença entre as arquiteturas de lambda e kappa?

    <p>A arquitetura kappa utiliza um sistema de processamento em fluxo.</p> Signup and view all the answers

    O que permite o recálculo de dados na arquitetura de lambda?

    <p>A imutabilidade dos dados brutos e seus registros de evento.</p> Signup and view all the answers

    O que acontece quando é necessário recalcular todo o conjunto de dados na arquitetura kappa?

    <p>Os eventos são ordenados e reproduzidos para recalculo.</p> Signup and view all the answers

    Qual é a função principal de um DATA LAKE no contexto apresentado?

    <p>Servir como armazenamento para dados brutos antes do processamento.</p> Signup and view all the answers

    Qual aspecto é verdadeiro sobre a lógica de processamento na arquitetura kappa?

    <p>Ela se concentra em um único caminho de fluxo de dados.</p> Signup and view all the answers

    Study Notes

    Arquitetura Lambda

    • O caminho quente contém dados para uma janela de tempo relativamente pequena.
    • Os resultados do caminho quente são atualizados com dados mais precisos do caminho frio.
    • Os dados brutos armazenados na camada de lote são imutáveis.
    • Os dados de entrada são sempre adicionados aos dados existentes.
    • Os dados anteriores nunca são substituídos.
    • Mudanças no valor de um dado específico são armazenadas como um novo registro de evento com carimbo de data/hora.
    • Permite o recálculo em qualquer ponto no tempo no histórico dos dados coletados.

    Arquitetura Kappa

    • A arquitetura Kappa é uma alternativa a Lambda.
    • Todos os dados fluem por um único caminho, usando um sistema de processamento de fluxo.
    • Os dados são ingeridos como um fluxo de eventos em um log unificado distribuído e tolerante a falhas.
    • Esses eventos são ordenados e o estado atual de um evento é alterado somente por um novo evento.
    • O processamento de eventos é feito no fluxo de entrada e persistido como uma exibição em tempo real.

    Data Lake

    • Data lakes não suportam transações ACID, não impõem a qualidade dos dados e sua falta de consistência/isolamento torna quase impossível unir escritas e leituras rodando processos batch e stream.

    Data Lakehouse

    • Uma solução convergente que combina Data Lake e Data Warehouse.
    • Permite derivar inteligência de dados não estruturados (texto, imagens, vídeo, áudio).
    • Vantagens: menos tempo e esforço administrativo, esquema simplificado e governança de dados, reduzida movimentação e redundância de dados, acesso direto aos dados para ferramentas de análise, armazenamento de dados econômico.

    Snowflake

    • Um dos melhores exemplos para abordarmos a plataforma de Lakehouse.

    Delta Lake

    • Garante que todas as alterações de dados gravadas no armazenamento sejam confirmadas para durabilidade e tornada visível para os leitores atomicamente.
    • Escala de petabytes.
    • Aproveita o Spark para dimensionar todo o processamento de metadados.
    • Registra detalhes sobre todas as alterações feitas nos dados, fornecendo uma trilha de auditoria completa das mudanças.
    • Permite acessar e reverter para versões anteriores de dados.
    • Impede automaticamente a inserção de dados com um esquema incorreto.
    • Permite que o esquema da tabela seja desenvolvido para acomodar dados em constante mudança.
    • Suporta mesclagem, atualização e exclusão.
    • Tem a capacidade de funcionar em lote e como uma fonte de streaming.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Eng Dados.pdf

    Description

    Teste seus conhecimentos sobre as arquiteturas Lambda e Kappa. Aprenda a diferença entre os dois modelos, como eles gerenciam dados e os benefícios de cada abordagem. Veja se você consegue identificar os principais conceitos e características de cada arquitetura.

    More Like This

    Big Data Analysis and Data Science Quiz
    10 questions
    Lambda Chi Alpha Core Values Flashcards
    21 questions
    Lambda Phi Epsilon Chapters Overview
    43 questions
    AWS Serverless and Container Services Quiz
    43 questions
    Use Quizgecko on...
    Browser
    Browser