Bases de données NoSQL et SGBD relationnels

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quels sont les types de bases de données NoSQL mentionnés?

  • BD NoSQL orientées 'graphes' (correct)
  • BD NoSQL orientées 'agrégats' (correct)
  • BD NoSQL orientées 'relations'
  • BD NoSQL orientées 'utilisateurs'

Quelles propriétés sont respectées par les transactions dans les SGBD relationnels?

  • Durabilité et Fiabilité
  • Atomicité, Cohérence, Isolation, et Durabilité (correct)
  • Simplicité et Efficacité
  • Visibilité et Accessibilité

Quel est le rôle de l'intégrité référentielle dans une base de données?

  • Assurer la cohérence du contenu de la base de données (correct)
  • Contrôler les performances des requêtes
  • Permettre les jointures rapides entre les tables
  • Faciliter la sauvegarde des données

Qu'est-ce qu'une transaction dans le contexte des SGBD?

<p>Une suite de tâches qui modifie l'état de la base de données (D)</p> Signup and view all the answers

Que stipule une clé étrangère dans une base de données relationnelle?

<p>Elle doit référencer des données existantes dans une autre table (D)</p> Signup and view all the answers

Quel exemple illustre le mieux le fonctionnement d'une transaction dans un système bancaire?

<p>Transfert d'argent entre deux comptes (D)</p> Signup and view all the answers

Quelle déclaration est correcte concernant les SGBD relationnels?

<p>Ils offrent un système d'intégrité référentielle. (B)</p> Signup and view all the answers

Quel aspect de l'intégrité référentielle est mis en avant dans l'exemple de l'auteur et du livre?

<p>Un livre ne peut être ajouté sans un auteur existant (D)</p> Signup and view all the answers

Qu'est-ce qu'une supercolonne dans le modèle de données?

<p>Une colonne qui contient d'autres colonnes. (C)</p> Signup and view all the answers

Quel est un avantage majeur du modèle de colonnes?

<p>Permet des lectures optimisées sur les colonnes nécessaires. (C)</p> Signup and view all the answers

Quelle limitation est associée au modèle de colonnes?

<p>Moins adapté aux transactions individuelles complexes. (C)</p> Signup and view all the answers

Comment une famille de colonnes est-elle définie?

<p>Un groupe de colonnes ou de supercolonnes. (A)</p> Signup and view all the answers

Quel outil a été initialement créé par Facebook pour gérer des modèles de colonnes?

<p>Cassandra. (A)</p> Signup and view all the answers

Quelle méthode de traitement est particulièrement adaptée pour le modèle de colonnes?

<p>Traitement des données massives avec MapReduce. (A)</p> Signup and view all the answers

Quelle structure optimise les accès aléatoires dans une base de données à colonnes?

<p>Tri des colonnes sur le disque. (B)</p> Signup and view all the answers

Quelle est une caractéristique de la flexibilité du schéma dans les bases de données à colonnes?

<p>Les colonnes peuvent varier d'une clé de ligne à l'autre. (D)</p> Signup and view all the answers

Que se passe-t-il lorsqu'une transaction 'T1' échoue dans un système de base de données ?

<p>Un rollback-recovery est nécessaire. (A)</p> Signup and view all the answers

Quel est l'effet de la durabilité dans les bases de données ?

<p>Les modifications sont enregistrées de façon permanente après la confirmation. (D)</p> Signup and view all the answers

Pourquoi les SGBDR peinent-ils à évoluer horizontalement ?

<p>Ils dépendent d'une scalabilité verticale limitée. (A)</p> Signup and view all the answers

Quel type de données est mal géré par les SGBDR ?

<p>Graphiques et données hiérarchiques. (C)</p> Signup and view all the answers

Quel défi les SGBDR rencontrent-ils lorsqu’ils gèrent des données massives dans des systèmes distribués ?

<p>Maintenir les contraintes 'ACID' à l'échelle du système. (B)</p> Signup and view all the answers

Quelles opérations peuvent devenir un goulot d'étranglement lorsque la taille des données augmente dans un SGBDR ?

<p>Écriture des données. (C)</p> Signup and view all the answers

Quel problème est associé à la définition d'un schéma fixe dans les SGBDR ?

<p>Cela complique la gestion de types de données non structurées. (B)</p> Signup and view all the answers

Quelle est une caractéristique des SGBDR concernant la scalabilité ?

<p>Ils sont conçus pour évoluer verticalement en ajoutant des ressources à un seul serveur. (B)</p> Signup and view all the answers

Quel type de structure les documents dans une base de données de type 'documents' possèdent-ils ?

<p>Une structure arborescente (C)</p> Signup and view all the answers

Quel est l'impact de modifier le schéma d'une base de données?

<p>Cela peut entraîner des interruptions et des temps d'arrêt. (A)</p> Signup and view all the answers

Quelle caractéristique est associée aux bases de données de type 'documents' ?

<p>Elles sont non schématiques (schemaless) (A)</p> Signup and view all the answers

Quels sont les effets du relâchement des contraintes ACID dans les SGBD distribués?

<p>Ils favorisent la rapidité et la disponibilité au détriment de la cohérence. (B)</p> Signup and view all the answers

Quel est un avantage des bases de données de type 'documents' ?

<p>Elles offrent une flexibilité de schéma (B)</p> Signup and view all the answers

Quel est un exemple d'utilisation des bases de données orientées 'documents' ?

<p>Enregistrement d'événements (C)</p> Signup and view all the answers

Quelle stratégie implique la distribution des traitements sur plusieurs machines?

<p>Par distribution des traitements. (C)</p> Signup and view all the answers

Quelle option définit le concept de 'Soft state' dans les propriétés BASE?

<p>L'état de la base de données n'est pas garanti à un instant donné. (C)</p> Signup and view all the answers

Quelle est une limitation des bases de données de type 'documents' ?

<p>Elles ont des problèmes de cohérence (B)</p> Signup and view all the answers

Quel est le sens de la propriété 'Basically Available' dans le contexte des SGBD BASE?

<p>La disponibilité est garantie mais les données peuvent être inaccessibles. (C)</p> Signup and view all the answers

Quel type de base de données utilise la théorie des graphes ?

<p>Bases de données orientées graphes (C)</p> Signup and view all the answers

Quelle caractéristique est associée aux systèmes NoSQL orientés 'graphes'?

<p>Elles se concentrent sur les relations entre les données. (B)</p> Signup and view all the answers

Parmi les options suivantes, laquelle est généralement utilisée pour l'accès aux bases de données orientées 'documents' ?

<p>Interface d'accès HTTP REST (C)</p> Signup and view all the answers

Pourquoi les bases de données de type 'documents' offrent-elles de bonnes performances pour les lectures/écritures massives ?

<p>Les documents évitent des jointures complexes (A)</p> Signup and view all the answers

Quelle est l'une des limites des SGBD relationnels transactionnels par rapport aux systèmes distribués?

<p>Ils ne permettent pas de traiter de grandes quantités de données efficacement. (B)</p> Signup and view all the answers

Quel énoncé est correct concernant le théorème CAP?

<p>Il stipule que la cohérence, la disponibilité et la tolérance aux partitions peuvent être garanties simultanément. (B)</p> Signup and view all the answers

Quel est le principal avantage des bases de données orientées graphe par rapport aux bases traditionnelles?

<p>Performances améliorées pour les relations complexes (B)</p> Signup and view all the answers

Qu'est-ce qu'un noeud dans une base de données orientée graphe?

<p>Un enregistrement représentant une entité (D)</p> Signup and view all the answers

Quel langage de requête est spécifiquement utilisé pour Neo4j?

<p>Cypher (D)</p> Signup and view all the answers

Quels types de propriétés peuvent avoir les noeuds dans une base de données orientée graphe?

<p>Des attributs variés associés à chaque noeud (D)</p> Signup and view all the answers

Quelle est une des limites des bases de données orientées graphe?

<p>Coûts de maintenance plus élevés en raison de la complexité (C)</p> Signup and view all the answers

Quel terme désigne un ensemble de noeuds connectés par des relations dans une base de données orientée graphe?

<p>Chemin (D)</p> Signup and view all the answers

Quel exemple illustre une utilisation des bases de données orientées graphe?

<p>Modélisation des réseaux sociaux (D)</p> Signup and view all the answers

Comment un 'label' est-il défini dans une base de données orientée graphe?

<p>Un nom organisant des groupes de noeuds (C)</p> Signup and view all the answers

Flashcards

SGBD relationnel

Un système de gestion de base de données (SGBD) qui utilise des relations mathématiques pour stocker et gérer des données.

Transactions

Des opérations sur les données qui doivent être effectuées en totalité ou pas du tout, pour assurer la cohérence des données.

Intégrité référentielle

Une règle qui garantit que les références entre les tables sont valides, en vérifiant l'existence des informations référencées.

BD NoSQL

Un type de système de gestion de base de données qui ne se base pas sur le modèle relationnel traditionnel.

Signup and view all the flashcards

BD NoSQL orientées 'agrégats'

Un type de BD NoSQL qui stocke les données sous forme de documents JSON, idéal pour les données semi-structurées.

Signup and view all the flashcards

BD NoSQL orientées 'graphes'

Un type de BD NoSQL qui utilise des nœuds et des liens pour représenter des relations entre des données.

Signup and view all the flashcards

Transaction ACID

Un ensemble d'opérations qui modifient la base de données d'un état à un autre, en respectant les règles d'atomicité, de cohérence, d'isolement et de durabilité.

Signup and view all the flashcards

Contraintes d'intégrité référentielle

Des contraintes qui définissent les relations entre les tables et garantissent l'intégrité des données.

Signup and view all the flashcards

Rollback-Recovery

Un Rollback-Recovery se produit dans les systèmes de base de données quand une transaction 'T1' provoque un échec et qu'une récupération doit être effectuée. Le système retourne à un état stable en annulant les changements de T1.

Signup and view all the flashcards

Durabilité dans les transactions

La durabilité garantit que les changements effectués par une transaction sont permanents, même en cas de panne système. Les données sont enregistrées de manière fiable pour ne pas être perdues.

Signup and view all the flashcards

Scalabilité des SGBDR

Les SGBDR sont excellents pour la scalabilité verticale, mais ont du mal à évoluer horizontalement. Ajouter des ressources à un seul serveur est plus facile que de répartir les données sur plusieurs serveurs.

Signup and view all the flashcards

SGBDR et données non structurées

Les SGBDR ne sont pas conçus pour les données non structurées ou semi-structurées. Par exemple, gérer des structures JSON complexes ou des réseaux sociaux est moins efficace dans un SGBDR.

Signup and view all the flashcards

SGBDR et volumes massifs de données

Les SGBDR ont des difficultés à gérer des volumes massifs de données non structurées ou semi-structurées générées rapidement. Les systèmes de streaming en temps réel sont difficiles à gérer pour les SGBDR.

Signup and view all the flashcards

Problèmes de distribution dans les SGBDR

Maintenir l'intégrité ACID dans un système distribué est complexe. Placer les données, gérer les opérations d'écriture et assurer la cohérence entre les serveurs sont des défis.

Signup and view all the flashcards

Schéma fixe des SGBDR

Les SGBDR ont un schéma défini à l'avance, rendant la gestion de données non structurées ou semi-structurées moins flexible. Il est difficile d'adapter le schéma aux données changeantes.

Signup and view all the flashcards

Propriétés ACID

Ensemble de propriétés garantissant l'atomicité, la cohérence, l'isolement et la durabilité des transactions dans les SGBD relationnels.

Signup and view all the flashcards

Impact des modifications de schéma

Les modifications du schéma peuvent causer des interruptions majeures et des efforts de migration importants, surtout avec des bases de données volumineuses.

Signup and view all the flashcards

Base de données BASE

Un type de base de données qui privilégie la disponibilité et la rapidité au détriment de la cohérence et de l'exactitude des données.

Signup and view all the flashcards

Basically Available

Le système garantit la disponibilité des données, mais peut répondre avec un "échec" pour obtenir les données demandées en cas d'indisponibilité temporaire.

Signup and view all the flashcards

Soft state

L'état de la base de données n'est pas garanti à un instant donné, les mises à jour ne sont pas immédiates.

Signup and view all the flashcards

Eventual consistency

La cohérence des données est atteinte progressivement, pas nécessairement simultanément. Les changements ne sont pas visibles immédiatement pour tous les utilisateurs.

Signup and view all the flashcards

Traitement de données distribuées

Deux stratégies possibles pour traiter les données dans un environnement distribué : distribuer les traitements ou distribuer les données.

Signup and view all the flashcards

Distribution des données

Capacité à supporter de grandes quantités de données en les répartissant sur plusieurs serveurs.

Signup and view all the flashcards

Modèle 'colonnes'

Un modèle de stockage de données où les données sont organisées en lignes et en colonnes. Chaque ligne représente un enregistrement unique et chaque colonne représente un attribut de cet enregistrement.

Signup and view all the flashcards

Colonne

Une entité de base qui représente un champ de donnée dans une ligne. Elle est définie par un couple clé-valeur.

Signup and view all the flashcards

Supercolonne

Une colonne qui peut contenir d'autres colonnes en tant que sous-éléments.

Signup and view all the flashcards

Famille de colonnes

Un groupe de colonnes ou de supercolonnes.

Signup and view all the flashcards

Cassandra

Un système de gestion de bases de données NoSQL qui stocke les données en colonnes, permettant une grande flexibilité et des lectures optimisées.

Signup and view all the flashcards

Hbase

Un système de gestion de bases de données NoSQL, basé sur Hadoop, qui stocke également les données en colonnes.

Signup and view all the flashcards

Optimisation des lectures

L'accès aux colonnes nécessaires pour une requête sans avoir à lire l'ensemble de la ligne, ce qui améliore les performances.

Signup and view all the flashcards

Flexibilité du schéma

La possibilité de modifier le schéma des colonnes sans affecter toute la table, permettant une grande flexibilité.

Signup and view all the flashcards

Qu'est-ce qu'une base de données orientée graphe ?

Une base de données orientée graphe stocke les données dans un réseau de nœuds interconnectés représentant des relations entre des entités. Chaque nœud représente un enregistrement et les liens représentent les relations entre ces enregistrements. Les nœuds et les liens peuvent avoir des propriétés (attributs) pour stocker des informations supplémentaires.

Signup and view all the flashcards

Quand utiliser les bases de données orientées graphe ?

Les bases de données orientées graphe sont particulièrement adaptées aux données où les relations entre les informations sont aussi importantes que les informations elles-mêmes.

Signup and view all the flashcards

Quel est le langage de requête Cypher ?

Cypher est un langage de requête spécialisé pour les bases de données orientées graphe comme Neo4j. Il permet de naviguer et de manipuler facilement les données dans les graphes.

Signup and view all the flashcards

Quel est l'avantage des bases de données orientées graphe pour les requêtes complexes ?

Les bases de données orientées graphe sont très performantes pour les requêtes de cheminement et de recherche de relations complexes. Elles n'ont pas besoin de jointures massives comme les SGBD relationnels.

Signup and view all the flashcards

Quelles sont les limites des bases de données orientées graphe ?

Les bases de données orientées graphe sont moins adaptées aux données tabulaires et nécessitent des compétences spécifiques pour la modélisation et l'interrogation.

Signup and view all the flashcards

Quels sont les exemples d'implémentation de bases de données orientées graphes ?

Neo4j, OrientDB et ArangoDB sont des exemples de bases de données orientées graphe. Elles sont utilisées dans divers domaines tels que la recherche de connaissances, la modélisation des réseaux sociaux, la recommandation d'articles et la modélisation des systèmes d'infrastructures.

Signup and view all the flashcards

Comment fonctionne la modélisation des données dans un graphe ?

La modélisation des relations entre les données dans un graphe est un concept essentiel. Un graphe est composé de nœuds représentant des entités et de liens qui représentent les relations entre ces entités.

Signup and view all the flashcards

Conclusion sur les bases de données orientées graphe

Les bases de données orientées graphe sont un outil puissant pour la modélisation et la gestion de données relationnelles complexes, mais elles nécessitent une expertise spécifique pour une utilisation et une maintenance optimales

Signup and view all the flashcards

Base de données de type 'Documents'

Une base de données qui stocke des collections de documents semi-structurés, souvent au format JSON ou XML. Les documents ont une structure arborescente et sont organisés en clé-valeur.

Signup and view all the flashcards

Concept de 'sans schéma' (schemaless) dans les bases de données de type 'Documents'

Les bases de données de type 'Documents' sont flexibles car elles n'ont pas de schéma prédéfini. Vous pouvez stocker des documents avec des structures variables sans avoir à définir un schéma à l'avance.

Signup and view all the flashcards

Interface d'accès HTTP REST pour les bases de données de type 'Documents'

Ces bases de données sont souvent accessibles via une interface HTTP REST, ce qui permet de les utiliser facilement avec des applications web ou mobiles.

Signup and view all the flashcards

MongoDB

L'une des bases de données de type 'Documents' les plus populaires, développée par MongoDB Inc.

Signup and view all the flashcards

CouchDB

Une base de données de type 'Documents' qui met l'accent sur la flexibilité du schéma et la scalabilité horizontale.

Signup and view all the flashcards

Flexibilité du schéma des bases de données de type 'Documents'

Un avantage majeur des bases de données de type 'Documents' est leur capacité à gérer des données hétérogènes et à s'adapter facilement aux changements de structure des données.

Signup and view all the flashcards

Performances des bases de données de type 'Documents' pour la lecture et l'écriture

Un autre avantage est leurs performances élevées pour les opérations de lecture et d'écriture en raison de la structure document-orientée et de la réduction des jointures nécessaires.

Signup and view all the flashcards

Limite des bases de données de type 'Documents' pour les relations complexes

Un des inconvénients est qu'elles sont moins adaptées à la gestion de relations complexes entre les données, ce qui peut nécessiter des jointures fréquentes, réduisant ainsi les performances.

Signup and view all the flashcards

Study Notes

Introduction aux Big Data et aux Bases de données NoSQL

  • Ce cours introduit les bases de données NoSQL dans le contexte de l'analyse de Big Data.
  • Le syllabus couvre les sujets suivants : Introduction aux bases de données NoSQL, SGBD relationnels transactionnels et leurs limites, les propriétés BASE et le théorème du CAP, les types de bases de données NoSQL (orientées agrégats et orientées graphes), MongoDB, et une introduction aux Big Data.
  • Le cours aura lieu le 22 Novembre 2024, pour la filière ICCN, 3ème semestre, INE2, à l'Institut National des Postes et Télécommunications (INPT).

Contexte

  • Les Big Data sont générés par de nombreuses sources, notamment les applications Web, les réseaux de capteurs, etc.
  • Les sources données incluent les emails, les images, les vidéos, les transactions, les logs des applications, les données temps réel, et de géolocalisation, les données climat, trafic et pression.
  • Ce volume de données nécessitent des approches de stockage et de gestion distribuées.
  • Les SGBD traditionnels (relationnels) ont des limites pour ce type de traitement distribué de grandes quantités de données.

SGBD Relationnels Transactionnels

  • Les SGBD relationnels fournissent un système de jointure pour créer des requêtes complexes impliquants plusieurs tables.
  • Ils sont transactionnels et respectent les propriétés ACID (Atomicité, Cohérence, Isolation, Durabilité).
  • La cohérence au niveau d'une transaction est assurée par la contrainte d'intégrité référentielle.
  • Les SGBD traditionnels rencontrent des limites dans les contextes de gros volumes de données distribués car ils ne sont pas bien optimisés pour traiter les données volumineuses et non structurées.

Propriété BASE et Théorème du CAP

  • Les bases de données NoSQL adoptent la propriété BASE (Basic Availability, Soft State, Eventual Consistency) à la place d'ACID.
  • Le théorème de CAP (Consistency, Availability, Partition Tolerance) indique qu'il est impossible de satisfaire simultanément les trois propriétés dans un système distribué.
  • Les SGBD NoSQL renoncent à la cohérence immédiate au profit de la disponibilité et de la tolérance aux partitions.

Présentation des bases de données NoSQL

  • Les bases de données NoSQL sont une alternative aux SGBD relationnels.
  • Elles sont conçues pour gérer des volumes importants de données non structurées et semi-structurées.
  • Elles reposent sur différents modèles (agrégats, colonnes, documents, graphes).

Typologie des bases de données NoSQL

  • Les bases de données NoSQL sont classées en modèles orientés clés-valeures, orientés colonnes, orientés documents et orientées graphes.
  • Différents exemples incluent : DynamoDB, Riak, Cassandra, MongoDB, Couchbase...

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser