Concepts du Big Data et SGBD NoSQL
50 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quels sont les cinq V du Big Data?

  • Variété, Volumes, Vélocité, Véracité, Valeur (correct)
  • Volume, Variété, Valorisation, Vélocité, Véracité
  • Variété, Volume, Vérification, Vélocité, Valeur
  • Vitesse, Variété, Visibilité, Véracité, Valeur
  • Quelle caractéristique du Big Data est liée à la rapidité à laquelle les données doivent être traitées?

  • Valeur
  • Vélocité (correct)
  • Véracité
  • Volume
  • Lequel des éléments suivants est un exemple d'une source de données classique dans le Big Data?

  • Les données des clients issues des CRM (correct)
  • Les données des réseaux sociaux
  • Les informations gouvernementales
  • Les données météorologiques
  • Quel V du Big Data se rapporte à l'exactitude et à la fiabilité des données?

    <p>Véracité</p> Signup and view all the answers

    Parmi les caractéristiques suivantes, laquelle ne fait pas partie des cinq V du Big Data?

    <p>Vérification</p> Signup and view all the answers

    Quel système est mentionné pour choisir un système NoSQL dans le module?

    <p>Cas Orange Portail</p> Signup and view all the answers

    Quelle est la définition de la valeur dans le contexte du Big Data?

    <p>Pertinence et utilité des données pour la prise de décision</p> Signup and view all the answers

    Laquelle des options suivantes décrit la variété des données du Big Data?

    <p>Différents types de données provenant de diverses sources</p> Signup and view all the answers

    Quelles sont les données qui constituent le Big Data ?

    <p>Données gouvernementales</p> Signup and view all the answers

    Quel exemple illustre les données structurées ?

    <p>Une table dans une base de données relationnelle</p> Signup and view all the answers

    Quelle est la caractéristique principale des données semi-structurées ?

    <p>Elles possèdent une structure partielle, comme XML ou JSON</p> Signup and view all the answers

    Quel volume de données équivaut à un pétaoctet ?

    <p>10^15 octets</p> Signup and view all the answers

    Quelle affirmations concerne le volume des données dans le Big Data ?

    <p>Il augmente à un rythme exponentiel</p> Signup and view all the answers

    Quel type de données est considéré comme non structuré ?

    <p>Textes, images et vidéos</p> Signup and view all the answers

    Quel système est cité comme exemple de gestion des données semi-structurées ?

    <p>MongoDB</p> Signup and view all the answers

    Quelle métrique équivaut à 10^6 octets ?

    <p>Mégabyte</p> Signup and view all the answers

    Quel est un exemple de données générées en temps réel ?

    <p>Les utilisateurs d'un réseau social</p> Signup and view all the answers

    Quel pourcentage approximatif de recherches en France se fait sur Google ?

    <p>90%</p> Signup and view all the answers

    Quel concept décrit la capacité d'une base de données à fournir un accès rapide aux données avec des réplicas illimités ?

    <p>Théorème CAP</p> Signup and view all the answers

    Pourquoi la clé primaire au sens relationnel est souvent inefficace dans un contexte de big data ?

    <p>Elle nécessite trop de blocs d'index pour une seule ligne</p> Signup and view all the answers

    Quelle est l'une des caractéristiques de la réplication asynchrone dans une base de données NoSQL ?

    <p>Elle améliore la disponibilité dans une partition</p> Signup and view all the answers

    Quel modèle de base de données est le plus adapté pour accéder rapidement à des données volumineuses ?

    <p>Modèle key-value</p> Signup and view all the answers

    Quel énoncé est vrai concernant les lectures dans un système utilisant la réplication asynchrone ?

    <p>Les nœuds peuvent lire des valeurs anciennes</p> Signup and view all the answers

    Quelle affirmation décrit le mieux les partitions dans une base de données NoSQL ?

    <p>Chaque partition peut avoir un nœud maître et plusieurs nœuds réplicas</p> Signup and view all the answers

    Quel est un avantage principal de la réplication dans une architecture NoSQL ?

    <p>Renforcement de la tolérance aux pannes</p> Signup and view all the answers

    Lors de l'écriture d'une donnée, que signifie 'Asynchrone' dans le cadre de la réplication ?

    <p>Les écritures sont envoyées au nœud répliqué après l'écriture initiale</p> Signup and view all the answers

    Quel type d'index est moins efficace pour les requêtes dans un contexte de big data ?

    <p>Indexes bitmap</p> Signup and view all the answers

    Quel système de gestion de base de données est souvent cité comme exemple de NoSQL ?

    <p>Cassandra</p> Signup and view all the answers

    Quel type de SGBD est Neo4j?

    <p>Orienté graphe</p> Signup and view all the answers

    Quelle méthode est utilisée pour créer un noeud et établir une relation dans Neo4j?

    <p>createAndConnectNode</p> Signup and view all the answers

    Quels SGBD supportent le CP du théorème CAP?

    <p>Cassandra et Hbase</p> Signup and view all the answers

    L'accès à une valeur dans un modèle Key-Value est influencé par:

    <p>L'efficacité de l'index de hachage</p> Signup and view all the answers

    Quel SGBD est spécifiquement orienté colonne?

    <p>Hbase</p> Signup and view all the answers

    Quelle est une limite de la solution actuelle dans le cas Orange Portail?

    <p>Volumétrie croissante des bases de données</p> Signup and view all the answers

    Comment les SGBD sont-ils classifiés selon leur popularité?

    <p>Nombre de mentions et d'opinions des utilisateurs</p> Signup and view all the answers

    Quelle est la principale différence de vitesse d'accès entre la recherche par l'index B-TREE et le modèle Key/Value?

    <p>La vitesse d'accès avec le modèle Key/Value est en nanoseconde.</p> Signup and view all the answers

    Quels SGBD supportent le AC du théorème CAP?

    <p>Voldemort et Oracle NOSQL</p> Signup and view all the answers

    Quel SGBD est un exemple d'orientation clé/valeur de base?

    <p>Cassandra</p> Signup and view all the answers

    Quelles sont les propriétés du modèle BASE par opposition au modèle ACID?

    <p>Priorise la disponibilité sur la consistance.</p> Signup and view all the answers

    En cas de disparition d'un nœud maître, que se passe-t-il dans la stratégie de réplication?

    <p>Les esclaves restants élisent un nouveau maître.</p> Signup and view all the answers

    Quel est le principal défaut des systèmes de SGBD relationnels par rapport aux SGBD NOSQL?

    <p>Ils ont des difficultés à augmenter le nombre de serveurs.</p> Signup and view all the answers

    Quel type de partitionnement est mentionné comme utilisé par MongoDB?

    <p>Partitionnement par hachage.</p> Signup and view all the answers

    Quelle déclaration concernant les index est correcte?

    <p>La taille d’un index peut atteindre 20% de la taille de la table.</p> Signup and view all the answers

    Qu'est-ce que LRU dans les systèmes de SGBD?

    <p>Least Recently Used.</p> Signup and view all the answers

    Quel est l'affirmation correcte concernant les écritures dans une architecture réplica synchrone?

    <p>Tous les réplicas doivent acquitter avant l'envoi de l'acquittement au client.</p> Signup and view all the answers

    Quelle est la vitesse approximative d'accès en mémoire avec un modèle Key/Value?

    <p>En nanosecondes.</p> Signup and view all the answers

    Quel est le rôle d'un répartiteur dans le contexte d'un SGBD distribué?

    <p>Il répartit équitablement les données sur les partitions.</p> Signup and view all the answers

    Qu'est-ce qui se produit lorsque les clients écrivent dans une architecture de réplication asynchrone?

    <p>Ils reçoivent un acquittement sans attendre.</p> Signup and view all the answers

    Quels types d'architectures sont utilisés dans les SGBD NOSQL?

    <p>Architecture distribuée et répliquée.</p> Signup and view all the answers

    Quel terme décrit une structure de données qui est souvent utilisée pour répondre aux demandes de lecture rapide dans les SGBD NOSQL?

    <p>Table de hachage.</p> Signup and view all the answers

    Study Notes

    Concepts du Big Data

    • Les données du Big Data sont caractérisées par cinq V :
      • Variété : Différents types de données (structurées, semi-structurées et non structurées) provenant de sources diverses (entreprises, capteurs, réseaux sociaux, etc.)
      • Volume : Grande quantité de données (téraoctets, pétaoctets, etc.)
      • Vélocité : Données générées à une vitesse élevée, souvent en temps réel (logs, données de capteurs, etc.)
      • Véracité : Qualité et fiabilité des données, nécessitant des processus de nettoyage et de validation
      • Valeur : Importance des données pour la prise de décision et l'obtention d'insights

    Concepts des SGBD NoSQL

    • Les SGBD NoSQL offrent des solutions pour gérer efficacement les données volumineuses, en s'éloignant du modèle relationnel traditionnel.
    • Ils privilégient la disponibilité plutôt que la consistence (théorème CAP).
    • Le modèle Key/Value est plus performant que les B-Trees pour l'accès aux données, offrant une vitesse d'accès en nanosecondes.
    • Les architectures distribuées et répliquées permettent de garantir la haute disponibilité et la scalabilité.

    Architecture distribuée / répliquée

    • La réplication synchrone assure la cohérence des données en attendant l'acquittement de tous les réplicas, améliorant ainsi la fiabilité.
    • La réplication asynchrone favorise la disponibilité en acceptant les écritures sans attendre l'acquittement de tous les réplicas, mais risque de rendre les données incohérentes.

    Stratégie de partitionnement

    • Le partitionnement des données permet de répartir équitablement la charge et d'améliorer la performance.
    • Le partitionnement par hachage et par intervalle sont des techniques courantes utilisées par les SGBD NoSQL.

    Les propriétés BASE

    • BASE est un acronyme pour Basically Available, Soft state, Eventually Consistent.
    • Ces propriétés reflètent la capacité des systèmes NoSQL à garantir la disponibilité, même si l'état des données peut être temporairement incohérent.

    Le théorème CAP

    • Le théorème CAP d'Éric Brewer stipule qu'il est impossible pour un système distribué de garantir simultanément la consistence, la disponibilité et la tolérance aux pannes.
    • Les systèmes NoSQL privilégient généralement la disponibilité et la tolérance aux pannes, sacrifiant la consistence.

    Oracle NoSQL

    • Oracle NoSQL est un système de gestion de bases de données NoSQL qui utilise une architecture distribuée et répliquée.
    • Il offre des fonctionnalités de partitionnement et de réplication pour assurer la haute disponibilité et la scalabilité.
    • Oracle NoSQL est compatible avec les propriétés BASE et s'adapte aux exigences du Big Data.

    Rappel sur les Concepts des SGBD NOSQL

    • SGBD NoSQL orienté graphe : NEO4J
      • Exemple de code pour créer et connecter un nœud dans un graphe
    • Classification de SGBD
      • Ressources utiles : http://administration-système.blogspot.fr/2013/10/bases-de-données-big-data-et-nosql.html
      • Popularité des SGBD :
        • Référencé par les moteurs de recherche
        • Intérêt général du système
        • Discussions techniques sur le système
        • Offres d'emplois
        • Profiles mentionnant le SGBD
      • Ressource utile : https://db-engines.com/en/ranking
    • Parts de marché des différents types de SGBD, Décembre 2022
      • Ressource utile : https://db-engines.com/en/ranking_categories

    QUIZ

    • Question 1 :
      • A: l'accès à une valeur est indépendante du nombre et de la taille de la clé : Caractéristique du modèle Key value de base
      • C: L'application d'une fonction de hachage à la clé rend l'accès à 1 valeur rapide : Caractéristique du modèle Key value de base
    • Question 2 :
      • A: Voldemort: SGBD NOSQL   - C: Cassandra: SGBD NOSQL   - D: Neo4j: SGBD NOSQL
    • Question 3 :   - A: Cassandra: SGBD NOSQL orienté Clé/valeur de base    - C: Hbase: SGBD NOSQL orienté Clé/valeur de base   - E: Voldemort: SGBD NOSQL orienté Clé/valeur de base   - F: MongoDB: SGBD NOSQL orienté Clé/valeur de base
    • Question 4 :   - A: Cassandra: SGBD NOSQL orienté colonne   - C: Hbase: SGBD NOSQL orienté colonne
    • Question 5 :   - A: Cassandra: SGBD NOSQL supportant le CP du théorème CAP   - C: Hbase: SGBD NOSQL supportant le CP du théorème CAP   - E: Voldemort: SGBD NOSQL supportant le CP du théorème CAP
    • Question 6 :   - G: aucun: Aucun SGBD NOSQL supportant le AC du théorème CAP
    • Question 7 :   - A: Cassandra: SGBD NOSQL supportant le AP du théorème CAP   - C: Hbase: SGBD NOSQL supportant le AP du théorème CAP   - E: Voldemort: SGBD NOSQL supportant le AP du théorème CAP   - F: MongoDB: SGBD NOSQL supportant le AP du théorème CAP
    • Question 8 :   - B: Oracle 21c: SGBD supportant le AC du théorème CAP
        - D: Sqlserver: SGBD supportant le AC du théorème CAP

    Comment choisir un système NoSQL : cas Orange Portail

    • Plan du cours
      • Bases de profiles gérées dans un cluster POSTGRES
      • Base de Syndication : Actuellement gérée dans un cluster MYSQL
      • Limites de la solution actuelle
      • Critères d’évaluation de systèmes NOSQL
      • Environnement de TEST
      • Résultat des évaluations
    • Bases de profiles gérée dans un cluster POSTGRES
      • Informations détaillées sur les profils
    • Base de Syndication : actuelle gérée dans un cluster MYSQL
      • Informations en mémoire sur le nombre de courriels lus, non lus, ...
    • Limites de la solution actuelle
      • Volumétrie croissante de la base de syndication (50Go) et de la base des profiles (100Go) avec des LOGs pour l’analyse d’erreurs importants (1h de log = 12Go, soient 105 Téraoctets de Log par an)
      • De nouveaux types de données Semi-structurées voir Non structurées à supporter.  

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Related Documents

    Description

    Ce quiz explore les concepts essentiels du Big Data, y compris les cinq V qui le caractérisent : variété, volume, vélocité, véracité et valeur. De plus, il aborde les systèmes de gestion de bases de données NoSQL et leur efficacité dans le traitement des données massives. Testez vos connaissances sur ces technologies de données modernes.

    More Like This

    Use Quizgecko on...
    Browser
    Browser