Podcast
Questions and Answers
Quels sont les cinq V du Big Data?
Quels sont les cinq V du Big Data?
Quelle caractéristique du Big Data est liée à la rapidité à laquelle les données doivent être traitées?
Quelle caractéristique du Big Data est liée à la rapidité à laquelle les données doivent être traitées?
Lequel des éléments suivants est un exemple d'une source de données classique dans le Big Data?
Lequel des éléments suivants est un exemple d'une source de données classique dans le Big Data?
Quel V du Big Data se rapporte à l'exactitude et à la fiabilité des données?
Quel V du Big Data se rapporte à l'exactitude et à la fiabilité des données?
Signup and view all the answers
Parmi les caractéristiques suivantes, laquelle ne fait pas partie des cinq V du Big Data?
Parmi les caractéristiques suivantes, laquelle ne fait pas partie des cinq V du Big Data?
Signup and view all the answers
Quel système est mentionné pour choisir un système NoSQL dans le module?
Quel système est mentionné pour choisir un système NoSQL dans le module?
Signup and view all the answers
Quelle est la définition de la valeur dans le contexte du Big Data?
Quelle est la définition de la valeur dans le contexte du Big Data?
Signup and view all the answers
Laquelle des options suivantes décrit la variété des données du Big Data?
Laquelle des options suivantes décrit la variété des données du Big Data?
Signup and view all the answers
Quelles sont les données qui constituent le Big Data ?
Quelles sont les données qui constituent le Big Data ?
Signup and view all the answers
Quel exemple illustre les données structurées ?
Quel exemple illustre les données structurées ?
Signup and view all the answers
Quelle est la caractéristique principale des données semi-structurées ?
Quelle est la caractéristique principale des données semi-structurées ?
Signup and view all the answers
Quel volume de données équivaut à un pétaoctet ?
Quel volume de données équivaut à un pétaoctet ?
Signup and view all the answers
Quelle affirmations concerne le volume des données dans le Big Data ?
Quelle affirmations concerne le volume des données dans le Big Data ?
Signup and view all the answers
Quel type de données est considéré comme non structuré ?
Quel type de données est considéré comme non structuré ?
Signup and view all the answers
Quel système est cité comme exemple de gestion des données semi-structurées ?
Quel système est cité comme exemple de gestion des données semi-structurées ?
Signup and view all the answers
Quelle métrique équivaut à 10^6 octets ?
Quelle métrique équivaut à 10^6 octets ?
Signup and view all the answers
Quel est un exemple de données générées en temps réel ?
Quel est un exemple de données générées en temps réel ?
Signup and view all the answers
Quel pourcentage approximatif de recherches en France se fait sur Google ?
Quel pourcentage approximatif de recherches en France se fait sur Google ?
Signup and view all the answers
Quel concept décrit la capacité d'une base de données à fournir un accès rapide aux données avec des réplicas illimités ?
Quel concept décrit la capacité d'une base de données à fournir un accès rapide aux données avec des réplicas illimités ?
Signup and view all the answers
Pourquoi la clé primaire au sens relationnel est souvent inefficace dans un contexte de big data ?
Pourquoi la clé primaire au sens relationnel est souvent inefficace dans un contexte de big data ?
Signup and view all the answers
Quelle est l'une des caractéristiques de la réplication asynchrone dans une base de données NoSQL ?
Quelle est l'une des caractéristiques de la réplication asynchrone dans une base de données NoSQL ?
Signup and view all the answers
Quel modèle de base de données est le plus adapté pour accéder rapidement à des données volumineuses ?
Quel modèle de base de données est le plus adapté pour accéder rapidement à des données volumineuses ?
Signup and view all the answers
Quel énoncé est vrai concernant les lectures dans un système utilisant la réplication asynchrone ?
Quel énoncé est vrai concernant les lectures dans un système utilisant la réplication asynchrone ?
Signup and view all the answers
Quelle affirmation décrit le mieux les partitions dans une base de données NoSQL ?
Quelle affirmation décrit le mieux les partitions dans une base de données NoSQL ?
Signup and view all the answers
Quel est un avantage principal de la réplication dans une architecture NoSQL ?
Quel est un avantage principal de la réplication dans une architecture NoSQL ?
Signup and view all the answers
Lors de l'écriture d'une donnée, que signifie 'Asynchrone' dans le cadre de la réplication ?
Lors de l'écriture d'une donnée, que signifie 'Asynchrone' dans le cadre de la réplication ?
Signup and view all the answers
Quel type d'index est moins efficace pour les requêtes dans un contexte de big data ?
Quel type d'index est moins efficace pour les requêtes dans un contexte de big data ?
Signup and view all the answers
Quel système de gestion de base de données est souvent cité comme exemple de NoSQL ?
Quel système de gestion de base de données est souvent cité comme exemple de NoSQL ?
Signup and view all the answers
Quel type de SGBD est Neo4j?
Quel type de SGBD est Neo4j?
Signup and view all the answers
Quelle méthode est utilisée pour créer un noeud et établir une relation dans Neo4j?
Quelle méthode est utilisée pour créer un noeud et établir une relation dans Neo4j?
Signup and view all the answers
Quels SGBD supportent le CP du théorème CAP?
Quels SGBD supportent le CP du théorème CAP?
Signup and view all the answers
L'accès à une valeur dans un modèle Key-Value est influencé par:
L'accès à une valeur dans un modèle Key-Value est influencé par:
Signup and view all the answers
Quel SGBD est spécifiquement orienté colonne?
Quel SGBD est spécifiquement orienté colonne?
Signup and view all the answers
Quelle est une limite de la solution actuelle dans le cas Orange Portail?
Quelle est une limite de la solution actuelle dans le cas Orange Portail?
Signup and view all the answers
Comment les SGBD sont-ils classifiés selon leur popularité?
Comment les SGBD sont-ils classifiés selon leur popularité?
Signup and view all the answers
Quelle est la principale différence de vitesse d'accès entre la recherche par l'index B-TREE et le modèle Key/Value?
Quelle est la principale différence de vitesse d'accès entre la recherche par l'index B-TREE et le modèle Key/Value?
Signup and view all the answers
Quels SGBD supportent le AC du théorème CAP?
Quels SGBD supportent le AC du théorème CAP?
Signup and view all the answers
Quel SGBD est un exemple d'orientation clé/valeur de base?
Quel SGBD est un exemple d'orientation clé/valeur de base?
Signup and view all the answers
Quelles sont les propriétés du modèle BASE par opposition au modèle ACID?
Quelles sont les propriétés du modèle BASE par opposition au modèle ACID?
Signup and view all the answers
En cas de disparition d'un nœud maître, que se passe-t-il dans la stratégie de réplication?
En cas de disparition d'un nœud maître, que se passe-t-il dans la stratégie de réplication?
Signup and view all the answers
Quel est le principal défaut des systèmes de SGBD relationnels par rapport aux SGBD NOSQL?
Quel est le principal défaut des systèmes de SGBD relationnels par rapport aux SGBD NOSQL?
Signup and view all the answers
Quel type de partitionnement est mentionné comme utilisé par MongoDB?
Quel type de partitionnement est mentionné comme utilisé par MongoDB?
Signup and view all the answers
Quelle déclaration concernant les index est correcte?
Quelle déclaration concernant les index est correcte?
Signup and view all the answers
Qu'est-ce que LRU dans les systèmes de SGBD?
Qu'est-ce que LRU dans les systèmes de SGBD?
Signup and view all the answers
Quel est l'affirmation correcte concernant les écritures dans une architecture réplica synchrone?
Quel est l'affirmation correcte concernant les écritures dans une architecture réplica synchrone?
Signup and view all the answers
Quelle est la vitesse approximative d'accès en mémoire avec un modèle Key/Value?
Quelle est la vitesse approximative d'accès en mémoire avec un modèle Key/Value?
Signup and view all the answers
Quel est le rôle d'un répartiteur dans le contexte d'un SGBD distribué?
Quel est le rôle d'un répartiteur dans le contexte d'un SGBD distribué?
Signup and view all the answers
Qu'est-ce qui se produit lorsque les clients écrivent dans une architecture de réplication asynchrone?
Qu'est-ce qui se produit lorsque les clients écrivent dans une architecture de réplication asynchrone?
Signup and view all the answers
Quels types d'architectures sont utilisés dans les SGBD NOSQL?
Quels types d'architectures sont utilisés dans les SGBD NOSQL?
Signup and view all the answers
Quel terme décrit une structure de données qui est souvent utilisée pour répondre aux demandes de lecture rapide dans les SGBD NOSQL?
Quel terme décrit une structure de données qui est souvent utilisée pour répondre aux demandes de lecture rapide dans les SGBD NOSQL?
Signup and view all the answers
Study Notes
Concepts du Big Data
- Les données du Big Data sont caractérisées par cinq V :
- Variété : Différents types de données (structurées, semi-structurées et non structurées) provenant de sources diverses (entreprises, capteurs, réseaux sociaux, etc.)
- Volume : Grande quantité de données (téraoctets, pétaoctets, etc.)
- Vélocité : Données générées à une vitesse élevée, souvent en temps réel (logs, données de capteurs, etc.)
- Véracité : Qualité et fiabilité des données, nécessitant des processus de nettoyage et de validation
- Valeur : Importance des données pour la prise de décision et l'obtention d'insights
Concepts des SGBD NoSQL
- Les SGBD NoSQL offrent des solutions pour gérer efficacement les données volumineuses, en s'éloignant du modèle relationnel traditionnel.
- Ils privilégient la disponibilité plutôt que la consistence (théorème CAP).
- Le modèle Key/Value est plus performant que les B-Trees pour l'accès aux données, offrant une vitesse d'accès en nanosecondes.
- Les architectures distribuées et répliquées permettent de garantir la haute disponibilité et la scalabilité.
Architecture distribuée / répliquée
- La réplication synchrone assure la cohérence des données en attendant l'acquittement de tous les réplicas, améliorant ainsi la fiabilité.
- La réplication asynchrone favorise la disponibilité en acceptant les écritures sans attendre l'acquittement de tous les réplicas, mais risque de rendre les données incohérentes.
Stratégie de partitionnement
- Le partitionnement des données permet de répartir équitablement la charge et d'améliorer la performance.
- Le partitionnement par hachage et par intervalle sont des techniques courantes utilisées par les SGBD NoSQL.
Les propriétés BASE
- BASE est un acronyme pour Basically Available, Soft state, Eventually Consistent.
- Ces propriétés reflètent la capacité des systèmes NoSQL à garantir la disponibilité, même si l'état des données peut être temporairement incohérent.
Le théorème CAP
- Le théorème CAP d'Éric Brewer stipule qu'il est impossible pour un système distribué de garantir simultanément la consistence, la disponibilité et la tolérance aux pannes.
- Les systèmes NoSQL privilégient généralement la disponibilité et la tolérance aux pannes, sacrifiant la consistence.
Oracle NoSQL
- Oracle NoSQL est un système de gestion de bases de données NoSQL qui utilise une architecture distribuée et répliquée.
- Il offre des fonctionnalités de partitionnement et de réplication pour assurer la haute disponibilité et la scalabilité.
- Oracle NoSQL est compatible avec les propriétés BASE et s'adapte aux exigences du Big Data.
Rappel sur les Concepts des SGBD NOSQL
-
SGBD NoSQL orienté graphe : NEO4J
- Exemple de code pour créer et connecter un nœud dans un graphe
-
Classification de SGBD
- Ressources utiles :
http://administration-système.blogspot.fr/2013/10/bases-de-données-big-data-et-nosql.html
-
Popularité des SGBD :
- Référencé par les moteurs de recherche
- Intérêt général du système
- Discussions techniques sur le système
- Offres d'emplois
- Profiles mentionnant le SGBD
- Ressource utile :
https://db-engines.com/en/ranking
- Ressources utiles :
-
Parts de marché des différents types de SGBD, Décembre 2022
- Ressource utile :
https://db-engines.com/en/ranking_categories
- Ressource utile :
QUIZ
-
Question 1 :
- A: l'accès à une valeur est indépendante du nombre et de la taille de la clé : Caractéristique du modèle Key value de base
- C: L'application d'une fonction de hachage à la clé rend l'accès à 1 valeur rapide : Caractéristique du modèle Key value de base
-
Question 2 :
- A: Voldemort: SGBD NOSQL - C: Cassandra: SGBD NOSQL - D: Neo4j: SGBD NOSQL
- Question 3 : - A: Cassandra: SGBD NOSQL orienté Clé/valeur de base - C: Hbase: SGBD NOSQL orienté Clé/valeur de base - E: Voldemort: SGBD NOSQL orienté Clé/valeur de base - F: MongoDB: SGBD NOSQL orienté Clé/valeur de base
- Question 4 : - A: Cassandra: SGBD NOSQL orienté colonne - C: Hbase: SGBD NOSQL orienté colonne
- Question 5 : - A: Cassandra: SGBD NOSQL supportant le CP du théorème CAP - C: Hbase: SGBD NOSQL supportant le CP du théorème CAP - E: Voldemort: SGBD NOSQL supportant le CP du théorème CAP
- Question 6 : - G: aucun: Aucun SGBD NOSQL supportant le AC du théorème CAP
- Question 7 : - A: Cassandra: SGBD NOSQL supportant le AP du théorème CAP - C: Hbase: SGBD NOSQL supportant le AP du théorème CAP - E: Voldemort: SGBD NOSQL supportant le AP du théorème CAP - F: MongoDB: SGBD NOSQL supportant le AP du théorème CAP
-
Question 8 :
- B: Oracle 21c: SGBD supportant le AC du théorème CAP
- D: Sqlserver: SGBD supportant le AC du théorème CAP
Comment choisir un système NoSQL : cas Orange Portail
-
Plan du cours
- Bases de profiles gérées dans un cluster POSTGRES
- Base de Syndication : Actuellement gérée dans un cluster MYSQL
- Limites de la solution actuelle
- Critères d’évaluation de systèmes NOSQL
- Environnement de TEST
- Résultat des évaluations
-
Bases de profiles gérée dans un cluster POSTGRES
- Informations détaillées sur les profils
-
Base de Syndication : actuelle gérée dans un cluster MYSQL
- Informations en mémoire sur le nombre de courriels lus, non lus, ...
-
Limites de la solution actuelle
- Volumétrie croissante de la base de syndication (50Go) et de la base des profiles (100Go) avec des LOGs pour l’analyse d’erreurs importants (1h de log = 12Go, soient 105 Téraoctets de Log par an)
- De nouveaux types de données Semi-structurées voir Non structurées à supporter.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Ce quiz explore les concepts essentiels du Big Data, y compris les cinq V qui le caractérisent : variété, volume, vélocité, véracité et valeur. De plus, il aborde les systèmes de gestion de bases de données NoSQL et leur efficacité dans le traitement des données massives. Testez vos connaissances sur ces technologies de données modernes.