Cours 2: Gestion des bases de données PDF
Document Details
Uploaded by AffectionateHeliotrope9042
Université de Paris
Hassane TAHIR
Tags
Related
- TD 2 - Administration Bases de Données - FST Béni-Mellal - 2023/2024 PDF
- Chapitre 3 : Connexions et Sécurité (PDF)
- Cours d'administration de bases de données 2024-2025 PDF
- Gestion des utilisateurs BD PDF
- BD: Architecture & Administration PDF
- Introduction à l'administration de bases de données - 4.administrationbdpart21 (PDF)
Summary
Ce document est un cours sur l'administration et la gestion de données. Il couvre les concepts clés tels que les bases de données, les instances, les schémas, et les fichiers de configuration. Il met également l'accent sur les technologies de stockage physique, les groupes de stockage et les partitions.
Full Transcript
Administration et gestion de données Cours 2: Gestion des bases de données Hassane TAHIR UFR de MATHÉMATIQUES et INFORMATIQUE Master Informatique M1: Parcours Données, Connaissances et Intelligence UNIVERSITÉ DE PARIS 2 Feuille de route Cours...
Administration et gestion de données Cours 2: Gestion des bases de données Hassane TAHIR UFR de MATHÉMATIQUES et INFORMATIQUE Master Informatique M1: Parcours Données, Connaissances et Intelligence UNIVERSITÉ DE PARIS 2 Feuille de route Cours 2 : Gestion des bases de données →Introduction →Objets d’une base de données →Instance d’une base de données →Hiérarchie des objets de base de données →Exemples d’instances sur un même serveur →Exemples d’instances sur plusieurs serveurs →Schéma d’une base de données →Objets Système →Objets Système (PostgreSQL) →Objets Système (MySQL) →Objets Système (Oracle) →Fichiers de configuration →Fichiers de configuration : Exemples →Comment configurer une base de données →Planifier le stockage d’une base de données →Tablespaces et conteneurs de stockage physique →Groupes de stockage →Avantages de groupes de stockage →Les partitions d’une base de données UNIVERSITÉ DE PARIS 3 Introduction Définition d’une base de Données Une base de données est un ensemble structuré de données stockées électroniquement dans un système informatique. Elle permet la gestion, la manipulation et la récupération efficace de grandes quantités d'informations. SGBD (Système de Gestion de Bases de Données) Un logiciel qui permet de créer, gérer et manipuler des bases de données. Exemples : PostgreSQL, MySQL, Oracle. Rôle de l'Administrateur de Bases de Données (DBA) Gestion et Maintenance Sécurité Optimisation Support aux Utilisateurs Planification de la Capacité UNIVERSITÉ DE PARIS 4 Objets d’une base de données Tables Vues Clés Indexes Contraintes Triggers UNIVERSITÉ DE PARIS 5 Instance d’une base de données Définition Une instance représente une limite logique pour une base de données, où les objets de la base sont structurés et les paramètres de configuration définis. Caractéristiques Attribuer un nom unique pour chaque base de données d’une instance Possède un ensemble de catalogue des tables système. Possède sa propre configuration de fichiers Avantages de l'Utilisation des Instances Plusieurs instances peuvent être créées sur un même serveur physique. Permet d'isoler les environnements de développement, test, et production. Les objets (bases, tables, etc.) d’une instance sont isolés de ceux des autres. Utiliser des instances pour restreindre l'accès aux données sensibles. Contrôler les droits administratifs au sein de chaque instance. UNIVERSITÉ DE PARIS 6 Hiérarchie des objets de base de données Instance d’une base de données Schéma Tables Vues Autres objets UNIVERSITÉ DE PARIS 7 Exemples d’instances sur un même serveur Serveur Physique Instance de Développement : INST_DEV Base de Comptabilité Base de Ventes Base de Marketing Instance de Production : INST_PROD Base de Comptabilité Base de Ventes Base de Marketing UNIVERSITÉ DE PARIS 8 Exemples d’instances sur plusieurs serveurs Serveur Physique de Développement Instance de Développement : INST_DEV Base de Comptabilité Base de Ventes Base de Marketing Serveur Physique de Production Instance de Production : INST_PROD Base de Comptabilité Base de Ventes Base de Marketing UNIVERSITÉ DE PARIS 9 Schéma d’une base de données Un schéma est un objet de base de données spécialisé qui permet de regrouper logiquement d'autres objets de bases de données. Un schéma peut contenir des tables, des index, des contraintes et d'autres objets. Dans la plupart des SGBDRs, le schéma par défaut est le schéma utilisateur de l'utilisateur actuellement connecté. Un schéma système peut contient des informations de configuration et des métadonnées concernant une base de données particulière. Par exemple, les tables d'un schéma système peuvent stocker des listes d'utilisateurs de la base de données et leurs autorisations d’accès, les informations sur les index des tables, les détails des partitions existantes de la base de données et les types de données définis par l'utilisateur. UNIVERSITÉ DE PARIS 10 Schéma d’une base de données Base de données Schéma Utilisateur Schéma Système UNIVERSITÉ DE PARIS 11 Objets Système Les SGBDRs stockent des types spécifiques d'informations concernant une base de données appelés métadonnées. Les métadonnées sont stockées dans des bases de données spéciales, des schémas, ou des catalogues. Exemple des métadonnées : nom d'une base de données ou d’une table, le type de données d'une colonne ou les privilèges d'accès. Les autres termes utilisés pour ce magasin (ou cette banque) d'informations sont dictionnaire de données et catalogue système. Les objets systèmes sont stockés dans des objets spéciaux connu comme base de données (ou repository), schéma système, catalogue ou dictionnaire. UNIVERSITÉ DE PARIS 12 Objets Système (PostgreSQL) Catalogue Système Tables système (métadonnées) Vues système (métadonnées) UNIVERSITÉ DE PARIS 13 Objets Système (MySQL) Instance MySQL Sys Information_schema MySQL Performance_schema Tables (en lecture seules) UNIVERSITÉ DE PARIS 14 Objets Système (Oracle) Serveur Oracle Instance Base de données Collection des fichiers SGA Processus d'arrière-plan Collection d’objets CRD (Contrôle, Redo (System Global Area) (Background Process) (Tables, vues, etc...) logs, Données) UNIVERSITÉ DE PARIS 15 Fichiers de configuration Le processus d'installation de la base de données enregistre ces informations dans des fichiers, appelés des fichiers de configuration ou d'initialisation. La base de données utilise les informations contenues dans ces fichiers pour définir les paramètres lors de son démarrage. Les SGBDRs utilisent différents fichiers, des emplacements de fichiers et paramètres. Les informations de configuration peuvent inclure des paramètres généraux tels que l'emplacement des données et les fichiers log (journal) et le port sur lequel le serveur écoute les requêtes. Les informations de configuration peuvent également être plus ciblées (avoir un focus sur ces fichiers), comme les paramètres qui affectent les performances, notamment l'allocation de mémoire, le délai d'expiration de connexion (timeout) et la taille maximale du paquet. UNIVERSITÉ DE PARIS 16 Fichiers de configuration : Exemples Postgresql.conf init.ora my.ini, my.cnf PostgreSQL MySQL Oracle UNIVERSITÉ DE PARIS 17 Comment configurer une base de données Base de données locale (on-premises) Arrêter le service de base de données Modifier le fichier de configuration Redémarrer le service de base de données Base de données Cloud Modifier les paramètres en utilisant les outils graphiques ou API. La base de données évolue dynamiquement UNIVERSITÉ DE PARIS 18 Planifier le stockage d’une base de données Le processus d'installation de la base de données enregistre ces informations dans des fichiers, appelés des fichiers de configuration ou d'initialisation. La base de données utilise les informations contenues dans ces fichiers pour définir les paramètres lors de son démarrage. Les SGBDRs utilisent différents fichiers, des emplacements de fichiers et paramètres. Les informations de configuration peuvent inclure des paramètres généraux tels que l'emplacement des données et les fichiers log (journal) et le port sur lequel le serveur écoute les requêtes. Les informations de configuration peuvent également être plus ciblées (avoir un focus sur ces fichiers), comme les paramètres qui affectent les performances, notamment l'allocation de mémoire, le délai d'expiration de connexion (timeout) et la taille maximale du paquet. UNIVERSITÉ DE PARIS 19 Tablespaces et conteneurs de stockage physique Définition Les tablespaces sont des structures qui contiennent des objets de base de données tels que des tables, des index, des grands objets et des données longues. Les conteneurs de stockage physique hébergent les données des objets de tablespaces. Les tablespaces définissent la correspondance entre les objets logiques de la base de données et les conteneurs de stockage physique. Un conteneur de stockage peut-être : un fichier de données, un répertoire ou périphérique brut. Les administrateurs de bases de données (DBA) utilisent les tablespaces pour organiser logiquement les objets de base de données en fonction de l'emplacement de leurs données. Cela permet de gérer efficacement les données et de les répartir de manière optimale sur les supports de stockage. UNIVERSITÉ DE PARIS 20 Tablespaces et conteneurs de stockage physique Exemple de contenu Tablespace 1 : Contient plusieurs petites tables.. Tablespace 2 : Contient deux grandes tables. Tablespace 3 : Contient des index fréquemment utilisés. Exemple de configuration Conteneur 1 : Stocke Tablespace 1 Conteneur 2,3 et 4: Stockent Tablespace 2 Conteneur 5 : Stocke Tablespace 3. Synthèse Les tablespaces permettent de : →Séparer les objets logiques des supports de stockage physiques, offrant ainsi une flexibilité dans la gestion des données. →Optimiser les performances en configurant les conteneurs de stockage de manière stratégique. →Organiser les données de manière à faciliter leur gestion et leur accès. UNIVERSITÉ DE PARIS 21 Tablespaces et conteneurs de stockage Table 1 Table 2 Table 3 Conteneur 1 Tablespace 1 Conteneur 2 Table 4 Table 5 Conteneur 3 Tablespace 2 Conteneur 4 Index 1 Index 2 Index 3 Index 4 Conteneur 5 Tablespace 3 UNIVERSITÉ DE PARIS 22 Groupes de stockage Définition Les groupes de stockage sont des regroupements de chemins de stockage ou de conteneurs ayant des caractéristiques de performance similaires.Ils facilitent la gestion des données en fonction de leur accessibilité et performance. Concept de Température des Données La température des données fait référence à la fréquence d'accès aux données. Données chaudes (Hot data) : Accédées très fréquemment, nécessitent des temps de réponse rapides. Données tièdes (Warm data) : Accédées de manière modérée, équilibre entre coût et performance. Données froides (Cold data) : Accédées rarement, favorisent la réduction des coûts de stockage. UNIVERSITÉ DE PARIS 23 Groupes de stockage Organisation selon la Température En organisant les données et le stockage en fonction de leur température, on peut optimiser à la fois les performances et les coûts de stockage. Tablespaces pour données chaudes Exemple : Tablespace C pour les tables très fréquemment consultées. Configuration : Distribué sur un groupe de dispositifs de stockage rapides (comme des SSD), permettant des temps d'accès rapides et des performances optimisées. Tablespaces pour données tièdes Exemple : Tablespaces T1, T2 et T3 pour les tables modérément consultées. Configuration : Stockées dans un groupe de stockage tiède, offrant un compromis entre coût et performance. Tablespaces pour données froides Exemple : Tablespace F pour les tables rarement consultées. Configuration : Utilise des dispositifs de stockage plus lents et moins coûteux (comme des disques durs magnétiques), optimisant ainsi les coûts de stockage. UNIVERSITÉ DE PARIS 24 Groupe de stockage Tablespace C Groupe de Stockage Chaud Tablespace T1 Tablespace T2 Groupe de Stockage Tiède Tablespace T3 Tablespace F Groupe de Stockage Froid UNIVERSITÉ DE PARIS 25 Avantages de groupes de stockage Optimisation des Performances Placer les données fréquemment consultées sur des dispositifs de stockage rapides, ce qui améliore les temps de réponse et les performances globales de la base de données. Distribuer les objets de la base de données de manière stratégique pour équilibrer la charge et optimiser les performances/ Réduction des Coûts Stocker les données rarement consultées sur des dispositifs de stockage moins coûteux permet de réduire les dépenses sans compromettre l'accessibilité des données lorsque nécessaire. Tirer parti des technologies de stockage moins chères pour les données froides tout en allouant les ressources premium (comme les SSD) pour les données chaudes. UNIVERSITÉ DE PARIS 26 Les partitions d’une base de données Définition Une base de données relationnelle partitionnée est une base de données dont les données sont réparties sur plusieurs partitions. Chaque partition est un segment plus petit de la base de données, contenant un sous-ensemble des données totales. Le partitionnement est utilisé pour améliorer la gestion et la performance des bases de données contenant de très grandes quantités de données. Pourquoi Partitionner Les tables peuvent devenir extrêmement volumineuses, ce qui peut affecter la performance des requêtes, la gestion et la maintenance des données. Le partitionnement permet de diviser ces tables volumineuses en partitions plus petites et plus faciles à gérer. Fonctionnement de Partitionnement Partitions Logiques : Une table est divisée en plusieurs partitions logiques, chacune contenant une partie des données globales. Exemple : Une table de ventes peut être partitionnée par année, avec chaque partition contenant les données de vente d'une année spécifique. UNIVERSITÉ DE PARIS 27 Les partitions d’une base de données Nœud 1 Partition 1 Base de données Nœud 2 Table 1 Partition 2 Nœud 3 Partition 3