Bases de données distribuées
74 Questions
5 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Quel est le principal risque d'un système de bases de données centralisé ?

  • Difficulté à accéder aux données pendant les mises à jour
  • Limitation de la capacité de stockage
  • Point de défaillance unique (correct)
  • Augmentation des coûts d'hébergement
  • Quel est un exemple d'un système de base de données centralisé ?

  • Cassandra
  • PostgreSQL (correct)
  • MongoDB
  • Oracle
  • Qu'est-ce qu'une base de données distribuée ?

  • Données centralisées pour des raisons de sécurité
  • Données fragmentées sur plusieurs machines (correct)
  • Données stockées sur une seule machine
  • Données uniquement accessibles sur le cloud
  • Pourquoi une entreprise pourrait-elle choisir d'utiliser une base de données distribuée ?

    <p>Pour répartir la charge et augmenter la fiabilité (C)</p> Signup and view all the answers

    Quel type de systèmes permet de stocker des données dans des clusters répartis ?

    <p>SGBD NoSQL (A)</p> Signup and view all the answers

    Quel est un avantage d'utiliser plusieurs sources de données dans un système distribué ?

    <p>Augmentation de la performance globale (B)</p> Signup and view all the answers

    Qu'implique un système distribué par rapport à un système centralisé ?

    <p>Les données peuvent être fragmentées ou répliquées entre plusieurs machines (D)</p> Signup and view all the answers

    Quel effet la montée en volume des transactions a-t-elle sur les systèmes centralisés ?

    <p>Entrave la capacité de traitement et de gestion des données (A)</p> Signup and view all the answers

    Quel est le rôle des replica sets dans MongoDB ?

    <p>Assurer la redondance et la tolérance aux pannes (D)</p> Signup and view all the answers

    Qu'est-ce que le sharding dans MongoDB ?

    <p>La répartition des données sur plusieurs nœuds (B)</p> Signup and view all the answers

    Pourquoi les systèmes distribués sont-ils préférables aux systèmes centralisés ?

    <p>Ils répartissent la charge sur plusieurs nœuds (B)</p> Signup and view all the answers

    Quel est un avantage des bases de données fragmentées ?

    <p>Une réduction du volume des données transférées (C)</p> Signup and view all the answers

    Qu'est-ce qu'un prédicat simple ?

    <p>Une condition filtrant les données sur un seul attribut (B)</p> Signup and view all the answers

    Quels critères peuvent être utilisés pour déterminer la clé de partitionnement lors du sharding ?

    <p>La fréquentation d’accès et la localisation géographique (A)</p> Signup and view all the answers

    Comment la fragmentation contribue-t-elle à l'optimisation des performances ?

    <p>En réduisant la latence par un stockage pertinent (D)</p> Signup and view all the answers

    Quelle condition garantit que chaque tuple soit inclus dans un fragment ?

    <p>Complétude des prédicats (C)</p> Signup and view all the answers

    Quelle type de fragmentation réduit les échanges réseau lors des requêtes ?

    <p>Fragmentation horizontale (D)</p> Signup and view all the answers

    Qu'est-ce que la minimalité dans le contexte des prédicats ?

    <p>Aucun prédicat n'est redondant (B)</p> Signup and view all the answers

    Pourquoi un système distribué est-il moins vulnérable aux pannes que le système centralisé ?

    <p>Car il peut tolérer la défaillance d'un ou plusieurs nœuds (C)</p> Signup and view all the answers

    Quel type de fragmentation combine les approches horizontale et verticale ?

    <p>Fragmentation hybride (C)</p> Signup and view all the answers

    Quel attribut est souvent utilisé pour déterminer la distribution des données dans un fragment ?

    <p>Emplacement géographique (A)</p> Signup and view all the answers

    Quel est l'effet de l'augmentation du volume de données dans un système centralisé ?

    <p>Goulots d'étranglement possibles (D)</p> Signup and view all the answers

    Quel type de fragmentation permet de segmenter les clients par pays ?

    <p>Fragmentation horizontale (B)</p> Signup and view all the answers

    Quel élément est considéré comme un coût d'allocation de ressources pour un fragment ?

    <p>La taille du fragment (A)</p> Signup and view all the answers

    Quel est l'impact de la duplication inutile sur le coût de stockage ?

    <p>Elle l'augmente (B)</p> Signup and view all the answers

    Quel est l’avantage principal en cas de panne d’un serveur dans une base de données distribuée ?

    <p>Un autre serveur peut prendre le relais. (B)</p> Signup and view all the answers

    Qu'est-ce que la scalabilité horizontale dans le contexte des bases de données distribuées ?

    <p>Ajouter des machines au réseau pour augmenter la capacité. (A)</p> Signup and view all the answers

    Quelle méthode peut réduire les coûts de transfert de données dans un système distribué ?

    <p>Minimiser les transferts de données (D)</p> Signup and view all the answers

    Comment une base de données distribuée améliore-t-elle la localisation des données ?

    <p>En plaçant les données près des utilisateurs pour réduire la latence. (C)</p> Signup and view all the answers

    Quel coût est associé à la garantie de disponibilité des fragments en cas de panne ?

    <p>Coût de réplication (C)</p> Signup and view all the answers

    Quel facteur décide du coût de traitement dans un système distribué ?

    <p>La complexité et le nombre de requêtes (D)</p> Signup and view all the answers

    Quelle est la fonction d'un SGBD dans le cadre d'une base de données distribuée ?

    <p>Assurer la gestion des données et rendre leur distribution transparente. (D)</p> Signup and view all the answers

    Quel est un exemple d'une base de données NoSQL orientée colonnes ?

    <p>Cassandra (A)</p> Signup and view all the answers

    Comment peut-on optimiser le coût total d'allocation d'un fragment ?

    <p>Rationaliser la réplication (A)</p> Signup and view all the answers

    Quel coût est crucial lors de la synchronisation entre nœuds ?

    <p>Coût de transfert de données (A)</p> Signup and view all the answers

    Comment la redondance contribue-t-elle à la disponibilité dans les bases de données distribuées ?

    <p>Elle permet de stocker plusieurs copies des données sur différents nœuds. (A)</p> Signup and view all the answers

    Quel type de transparence assure le système en cachant les détails de la structure de stockage des données aux utilisateurs ?

    <p>Transparence de données (C)</p> Signup and view all the answers

    Quel est l'objectif principal de la fragmentation verticale dans les systèmes distribués ?

    <p>Segmenter les données par attributs (C)</p> Signup and view all the answers

    Quel est un des inconvénients de la réplication dans les bases de données ?

    <p>Quantité de données dupliquées. (A)</p> Signup and view all the answers

    Quelle stratégie est recommandée pour minimiser les coûts de traitement ?

    <p>Placer les fragments près des applications fréquentes (D)</p> Signup and view all the answers

    Quel est le premier critère pour établir une fragmentation efficace des données ?

    <p>Identifier les attributs de fragmentation (B)</p> Signup and view all the answers

    En quoi consiste la fragmentation dans une base de données distribuée ?

    <p>La décomposition d'une base de données logique en plusieurs sous-bases. (B)</p> Signup and view all the answers

    Quel coût augmente avec la fréquence des copies dans un système distribué ?

    <p>Coût de réplique (A)</p> Signup and view all the answers

    Pourquoi est-il important de vérifier la complétude des prédicats ?

    <p>Pour s'assurer que tous les cas possibles sont couverts (C)</p> Signup and view all the answers

    Quelle méthode peut être utilisée pour simplifier la création de fragments ?

    <p>Limiter le nombre d'attributs de fragmentation (B)</p> Signup and view all the answers

    Quel a été l'exemple donné pour illustrer le coût de traitement d’un fragment ?

    <p>1 000 requêtes par jour (D)</p> Signup and view all the answers

    Quel rôle joue un nœud primaire dans un ensemble de répliques (replica set) ?

    <p>Il gère les écritures et le reste des nœuds servent d'archives. (B)</p> Signup and view all the answers

    Quel est l'effet négatif des transferts fréquents de données ?

    <p>Ils augmentent les coûts (A)</p> Signup and view all the answers

    Quel type de fragmentation permet de diviser les tables selon des attributs spécifiques ?

    <p>Fragmentation Verticale (D)</p> Signup and view all the answers

    Quel est l'effet de la défaillance d'un nœud sur un système distribué ?

    <p>Le système continue à fonctionner grâce à d'autres nœuds actifs. (B)</p> Signup and view all the answers

    Comment s'appelle la combinaison de différents prédicats pour obtenir des fragments uniques ?

    <p>Minterms (D)</p> Signup and view all the answers

    Quelle base de données est connue pour sa consistance forte et sa résistance aux partitions ?

    <p>Google Spanner (D)</p> Signup and view all the answers

    Quel est un exemple de prédicat simple pour la fragmentation par âge ?

    <p>Âge &lt; 18 (A)</p> Signup and view all the answers

    Quels sont les attributs de fragmentation dans un exemple d'ensemble minimal ?

    <p>Pays et Département (A)</p> Signup and view all the answers

    Qu'est-ce qu'un prédicat redondant ?

    <p>Un prédicat qui couvre les mêmes valeurs qu'un autre (A)</p> Signup and view all the answers

    Quel est un objectif de la fragmentation hybride ?

    <p>Minimiser la latence de localisation (C)</p> Signup and view all the answers

    Pour une fragmentation verticale, quel type d'information est généralement isolé ?

    <p>Informations de base utiles (A)</p> Signup and view all the answers

    Quelle est la principale raison d'éliminer les prédicats redondants ?

    <p>Pour s'assurer que chaque fragment est unique (D)</p> Signup and view all the answers

    Quel type d'analyses peut bénéficier d'une fragmentation des données ?

    <p>Analyses marketing ciblées (B)</p> Signup and view all the answers

    Quels types d'attributs ne devraient pas être utilisés pour des fragments complexes ?

    <p>Attributs multiples non pertinents (A)</p> Signup and view all the answers

    Quelle approche permettrait d'optimiser l'accès aux données après fragmentation ?

    <p>Assigner chaque fragment à un nœud spécifique (D)</p> Signup and view all the answers

    Quels types de fragmentation sont mentionnés ?

    <p>Verticale (B), Horizontale (C)</p> Signup and view all the answers

    Quel défi prévoit le théorème de CAP pour les systèmes distribués ?

    <p>Consistance, Disponibilité, Tolérance aux partitions (C)</p> Signup and view all the answers

    Qu'est-ce que la réplication maître-esclave dans une base de données distribuée ?

    <p>Un nœud primaire gère toutes les écritures (C)</p> Signup and view all the answers

    Dans un système distribué, qu'est-ce qui peut être compromise pour garantir la disponibilité lors d'une partition réseau ?

    <p>La consistance des données (A)</p> Signup and view all the answers

    Quel type de modèle de données est utilisé par MongoDB ?

    <p>Documents (C)</p> Signup and view all the answers

    Pourquoi les bases de données NoSQL sont-elles souvent choisies pour des applications spécifiques ?

    <p>Elles sont adaptées aux données non structurées (B)</p> Signup and view all the answers

    Quel est l’avantage principal du partitionnement (sharding) ?

    <p>Répartition de la charge sur plusieurs machines (C)</p> Signup and view all the answers

    Quel est un des modèles de données flexibles dans les bases de données NoSQL ?

    <p>Documents (C)</p> Signup and view all the answers

    Quel type de réplication nécessite des mécanismes complexes de gestion des conflits ?

    <p>Réplication peer-to-peer (D)</p> Signup and view all the answers

    Quel est un exemple de base de données orientée colonnes ?

    <p>Cassandra (C)</p> Signup and view all the answers

    Qu'est-ce qui caractérise principalement la scalabilité horizontale des bases NoSQL ?

    <p>Ajout de serveurs supplémentaires (D)</p> Signup and view all the answers

    Qu'est-ce qui déclenche la nécessité d'agir par fragmentation dans une base distribuée ?

    <p>La distribution des fragments sur plusieurs sites (C)</p> Signup and view all the answers

    Quel scénario met en question la consistance d'un système distribué ?

    <p>Partition réseau (A)</p> Signup and view all the answers

    Flashcards

    Base de données centralisée

    Un système de base de données où les données sont stockées et accessibles sur un seul serveur.

    Base de données distribuée

    Un système de base de données où les données sont réparties sur plusieurs machines, souvent géographiquement dispersées.

    Single Point of Failure (SPOF)

    Un seul point de défaillance est un élément crucial qui, s'il échoue, rendra l'ensemble du système inopérant.

    Problèmes liés à la croissance

    L'augmentation du volume de données, de traitements et de transactions dans un système de base de données.

    Signup and view all the flashcards

    Concept clé de la base de données distribuée

    Une base de données distribuée regroupe un ensemble de données dispersées sur plusieurs machines, mais accessibles comme un système unique.

    Signup and view all the flashcards

    Réplication de données

    Répliquer les mêmes données sur plusieurs nœuds d'un système distribué.

    Signup and view all the flashcards

    Fragmentation de données

    Diviser les données en fragments et les distribuer sur plusieurs machines.

    Signup and view all the flashcards

    Système centralisé vs. système distribué

    Un système centralisé a toutes ses données sur une seule machine, tandis qu'un système distribué répartit les données sur plusieurs machines.

    Signup and view all the flashcards

    Client d'un système de gestion de bases de données distribuées

    Une application qui accède aux informations distribuées par les interfaces du système de gestion de bases de données.

    Signup and view all the flashcards

    SGBD (Système de gestion de bases de données distribuées)

    L'application gérant la base de données distribuée. Elle rend la distribution transparente pour les utilisateurs.

    Signup and view all the flashcards

    MongoDB

    MongoDB est une base de données NoSQL orientée documents, conçue pour le sharding et la réplication.

    Signup and view all the flashcards

    Cassandra

    Cassandra est une base de données NoSQL orientée colonnes, utilisée pour des systèmes massivement distribués.

    Signup and view all the flashcards

    Google Spanner

    Google Spanner est une base de données SQL globale avec consistance forte, résistant aux partitions et distribuant les données à grande échelle.

    Signup and view all the flashcards

    Scalabilité

    La capacité d'un système à prendre en charge un nombre croissant de demandes et de données.

    Signup and view all the flashcards

    Scalabilité horizontale

    Augmenter la capacité d'un système en ajoutant des machines ou serveurs au réseau.

    Signup and view all the flashcards

    Disponibilité accrue

    Plusieurs copies des données sont stockées sur des nœuds différents dans un système distribué, améliorant la résistance aux pannes.

    Signup and view all the flashcards

    Résiliance aux défaillances

    Un système distribué peut, grâce à la multiplication des copies de données, tolérer des pannes matérielles et réseau tout en maintenant une certaine disponibilité.

    Signup and view all the flashcards

    Localisation des données

    La localisation des données près des utilisateurs réduit la latence.

    Signup and view all the flashcards

    Transparence de données physiques

    Indépendance de données physiques

    Signup and view all the flashcards

    Transparence de données logiques

    Indépendance de données logiques

    Signup and view all the flashcards

    Transparence des données

    Le système gère la récupération des informations, rendant l'utilisation des données facile pour les utilisateurs grâce à la transparence.

    Signup and view all the flashcards

    Fragmentation horizontale

    Technique de partitionnement d'une table en plusieurs sous-tables, chacune contenant un sous-ensemble de lignes de la table originale.

    Signup and view all the flashcards

    Fragmentation verticale

    Technique de partitionnement d'une table en plusieurs sous-tables, chacune contenant un sous-ensemble d'attributs (colonnes) de la table originale.

    Signup and view all the flashcards

    Fragmentation hybride

    Combine les deux techniques de fragmentation horizontale et verticale pour maximiser l'efficacité.

    Signup and view all the flashcards

    Distribution relationnelle

    Répartir les fragments d'une même relation sur plusieurs sites pour améliorer la disponibilité et la performance.

    Signup and view all the flashcards

    Théorème CAP

    Un système distribué ne peut pas garantir la cohérence, la disponibilité et la tolérance aux partitions simultanément. Il faut faire un choix entre ces trois propriétés en fonction des besoins de l'application.

    Signup and view all the flashcards

    Consistance

    Garanter que toutes les répliques de données ont les mêmes informations. Important pour l'intégrité des données.

    Signup and view all the flashcards

    Tolérance aux partitions

    Assurer que le système fonctionne sans interruption même en cas de panne ou de perte de communication entre les noeuds.

    Signup and view all the flashcards

    Disponibilité

    Assurer que le système répond à toutes les requêtes, même en cas de pannes, en accordant une priorité à la disponibilité des données.

    Signup and view all the flashcards

    Réplication

    Mécanisme visant à garantir la redondance et la disponibilité des données dans une base de données distribuée.

    Signup and view all the flashcards

    Réplication maître-esclave

    Un serveur principal gère toutes les écritures de données, et les serveurs secondaires les répliquent pour la lecture ou la sauvegarde.

    Signup and view all the flashcards

    Réplication peer-to-peer

    Chaque serveur peut gérer les écritures, ce qui nécessite des mécanismes complexes pour résoudre les conflits.

    Signup and view all the flashcards

    Partitionnement

    Divise les données en fragments (shards) qui sont stockés sur différents nœuds, permettant de distribuer la charge et d'améliorer les performances.

    Signup and view all the flashcards

    Modèle de données document

    Les données sont stockées sous forme d'objets structurés, comme le format JSON. MongoDB utilise ce modèle.

    Signup and view all the flashcards

    Absence de schéma rigide

    Les bases de données NoSQL n'exigent pas un schéma prédéfini, ce qui permet de gérer des données non structurées ou semi-structurées de manière flexible.

    Signup and view all the flashcards

    Utilisation des minterms

    Créer des fragments bien définis en combinant des prédicats simples. Cela permet de garder les fragments précis et pertinents.

    Signup and view all the flashcards

    Prédicat

    Détermine la partie des données que chaque nœud du réseau distribué devra gérer.

    Signup and view all the flashcards

    Tests de complétude et de minimalité

    Vérifier la présence de tous les cas possibles (complétude) et de chaque fragment unique non redondant (minimalité).

    Signup and view all the flashcards

    Choix des attributs de fragmentation

    Choisir les meilleurs attributs pour la fragmentation. Le nombre d'attributs doit être limité afin de simplifier la création de fragments, sauf si les besoins analytiques nécessitent une segmentation plus complexe.

    Signup and view all the flashcards

    Exemple d'application de fragmentation

    Séparer les données en fonction de l'âge et de la localisation.

    Signup and view all the flashcards

    Fragmentation horizontale : Minterms

    Chaque fragment est affecté à un nœud spécifique du réseau pour améliorer l'accès local aux données.

    Signup and view all the flashcards

    Fragmentation horizontale : Prédicats simples

    Diviser en fragments en fonction de la localisation des clients.

    Signup and view all the flashcards

    Fragmentation verticale : Prédicats

    Diviser les données en fragments basés sur les besoins en accès aux données.

    Signup and view all the flashcards

    Créer des prédicats simples

    Créer des prédicats simples qui permettent de séparer les données en fragments basés sur des attributs spécifiques.

    Signup and view all the flashcards

    Identifier les attributs de fragmentation

    Identifier les attributs qui seront utilisés pour diviser les données en fragments.

    Signup and view all the flashcards

    Replica set dans MongoDB

    Un ensemble de serveurs MongoDB qui travaillent ensemble pour assurer la redondance et la tolérance aux pannes.

    Signup and view all the flashcards

    Nœud primaire dans un replica set

    Le serveur principal dans un replica set qui gère les écritures.

    Signup and view all the flashcards

    Nœuds secondaires dans un replica set

    Les serveurs qui répliquent les données du nœud primaire et gèrent les lectures.

    Signup and view all the flashcards

    Tolérance aux pannes

    La capacité d'un système à continuer de fonctionner même si un serveur tombe en panne.

    Signup and view all the flashcards

    Sharding dans MongoDB

    La répartition des données sur plusieurs serveurs pour améliorer les performances et la scalabilité.

    Signup and view all the flashcards

    Clé de partitionnement

    Un identifiant qui indique où une donnée doit être stockée dans un système de sharding.

    Signup and view all the flashcards

    Goulot d'étranglement

    Le problème de performance qui survient lorsqu'un seul point central doit gérer un volume croissant de données et de requêtes.

    Signup and view all the flashcards

    Prédicat simple

    Un prédicat qui filtre les données en fonction d'une seule condition sur un attribut.

    Signup and view all the flashcards

    Minterm prédicat

    Un prédicat qui combine plusieurs conditions simples pour une sélection plus précise.

    Signup and view all the flashcards

    Complétude et minimalité des prédicats

    Un ensemble complet de prédicats couvre toutes les données, tandis qu'un ensemble minimal ne contient pas de prédicats redondants.

    Signup and view all the flashcards

    Coût de stockage

    Le coût de stockage d'un fragment dépend de sa taille en Go et du prix par Go. Plus le fragment est volumineux, plus il coûte cher.

    Signup and view all the flashcards

    Coût des requêtes

    Le coût des requêtes dépend de la fréquence et de la complexité des requêtes. Plus de requêtes ou des requêtes plus complexes impliquent des coûts plus élevés.

    Signup and view all the flashcards

    Coût de transfert de données

    Le coût de transfert de données est lié à la quantité de données transférées et au coût par Go. Transférer des fragments volumineux entre les nœuds peut être coûteux.

    Signup and view all the flashcards

    Coût de réplication

    Le coût de réplication dépend du nombre de copies et des coûts de stockage et de transfert des réplicues. Plus il y a de copies, plus le coût est élevé.

    Signup and view all the flashcards

    Coût total d'un fragment

    Le coût total d'un fragment englobe tous les coûts associés : stockage, requêtes, transfert de données et réplication.

    Signup and view all the flashcards

    Minimisation des coûts

    La minimisation des coûts vise à réduire les dépenses tout en garantissant la performance et la disponibilité du système.

    Signup and view all the flashcards

    Allocation des ressources

    L'allocation des ressources optimise l'utilisation des ressources pour chaque fragment afin de maximiser la performance et la disponibilité tout en minimisant les coûts.

    Signup and view all the flashcards

    Fragment

    Un fragment est une partie des données qui est stockée et traitée de manière indépendante sur un nœud du système distribué.

    Signup and view all the flashcards

    Nœud

    Un nœud est un serveur ou une machine qui compose un système distribué. Chaque nœud stocke et traite un ou plusieurs fragments de données.

    Signup and view all the flashcards

    Coût de stockage

    Le coût de stockage est le coût de l'espace disque utilisé pour stocker les données sur les nœuds du système distribué.

    Signup and view all the flashcards

    Coût des requêtes

    Le coût des requêtes est le coût de l'utilisation du processeur CPU pour traiter les requêtes et les opérations sur les données.

    Signup and view all the flashcards

    Study Notes

    Bases de données distribuées

    • Les bases de données distribuées stockent les données sur plusieurs machines, géographiquement dispersées, mais apparaissant comme un seul système pour l'utilisateur.
    • Les bases de données centralisées, en revanche, stockent toutes les données sur un seul serveur.
    • Un serveur unique est un point unique de défaillance (SPOF) dans un système centralisé.
    • Les bases de données distribuées augmentent la disponibilité, la performance et la scalabilité horizontale.

    Avantages des bases de données distribuées

    • Continuité de service: Si un serveur tombe en panne, un autre peut prendre le relais.
    • Haute performance: Les requêtes sont réparties sur les différents serveurs.
    • Transparence des données: Les développeurs et les utilisateurs n'ont pas besoin de se préoccuper de l'emplacement des données.
    • Scalabilité horizontale: L'ajout de serveurs au système augmente sa capacité sans affecter la puissance de chaque serveur individuel.
    • Disponibilité accrue: Plusieurs copies des données sont stockées sur plusieurs nœuds, rendant le système plus robuste aux pannes matérielles ou réseau. La suppression du SPOF est un gain important.
    • Localisation des données: Les données sont plus proches des utilisateurs, réduisant la latence.
    • Résilience aux défaillances: Les systèmes distribués peuvent tolérer des pannes matérielles ou des coupures réseau, et maintenir la disponibilité.

    Transparence dans les bases de données distribuées

    • Transparence de données (indépendance): Les applications d'utilisateur ne modifient pas la structure logique des données (schema), et les détails du stockage physique sont cachés.
    • Transparence du réseau: Le système gère automatiquement la communication entre les nœuds.
    • Transparence de réplication: Les copies de données sur différents sites sont gérées automatiquement.
    • Transparence de fragmentation: Les fragments de données sont gérés globalement par le système, rendant leur utilisation similaire à une base de données unique.

    Fragmentation des bases de données

    • La fragmentation est le processus de décomposition d'une base de données logique en plusieurs "sous" bases de données.
    • Fragmentation horizontale: Découpage de la base en lignes (tuples) selon des conditions sur cet attributs.
    • Fragmentation verticale: Découpage de la base en colonnes en regroupant des attributs (colonnes) qui sont souvent utilisés ensemble.
    • Fragmentation hybride: Combinaison des deux approches précédentes.

    Théorème CAP

    • Le théorème CAP indique qu'un système distribué ne peut pas garantir simultanément la consistance, la disponibilité et la tolérance aux partitions. Il faut faire des choix.

    Réplication

    • Maître-esclave (primary-secondary): Un seul serveur gère les écritures, les autres faisant des copies pour la lecture et le secours.
    • Peer-to-peer: Chaque serveur peut gérer les écritures, impliquant des mécanismes plus complexes pour résoudre les conflits.

    Partitionnement (Sharding)

    • Le partitionnement (sharding) divise les données en fragments (shards) qui sont stockés sur différents nœuds.
    • Cela permet de répartir la charge sur plusieurs machines.

    MongoDB (exemple)

    • MongoDB est une base de données NoSQL orientée documents.
    • Elle est distribuée nativement et utilise des replica sets pour assurer la résilience.
    • Le sharding permet de distribuer les données sur plusieurs nœuds.

    Comparaison avec un système centralisé

    • Performances: Les bases de données distribuées peuvent gérer de plus grands volumes de données et requêtes sans goulots d'étranglement.
    • Disponibilité: Les systèmes distribués sont plus résistants aux pannes.

    Conclusion

    • Les bases de données distribuées offrent une importante escalabilité, disponibilité et résilience.
    • Elles sont essentielles dans les applications modernes qui nécessitent de gérer de vastes volumes de données et d’utilisateurs à l'échelle mondiale.

    Calculs de coûts

    • Les systèmes distribués impliquent des coûts de stockage, de traitement, de transfert de données et de réplication.
    • L'optimisation de ces coûts est clé pour la performance et la disponibilité d'un système distribué.

    Studying That Suits You

    Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

    Quiz Team

    Description

    Ce quiz explore les concepts fondamentaux des bases de données distribuées, en mettant l'accent sur leurs avantages par rapport aux bases de données centralisées. Vous découvrirez comment elles améliorent la performance, la continuité de service et la scalabilité. Testez vos connaissances sur ce sujet essentiel en informatique.

    More Like This

    Use Quizgecko on...
    Browser
    Browser