Cours d’informatique décisionnelle (BI) - Chapitre 3 - Modélisation des données PDF
Document Details
Uploaded by AgreeableDalmatianJasper4570
Université Virtuelle du Burkina Faso
2024
Cheik OUEDRAOGO
Tags
Summary
Ce document est un cours sur la modélisation des données pour le BI, incluant des discussions sur la modélisation multidimensionnelle. Des concepts importants tels que les cubes de données ainsi que les schémas en étoile, en flocon et constelation sont expliqués dans le détail.
Full Transcript
Cours d’informatique décisionnelle Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme I. Chapitre 1 : Introduction à l’informatique décisionnelle (Business intelligence...
Cours d’informatique décisionnelle Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme I. Chapitre 1 : Introduction à l’informatique décisionnelle (Business intelligence) II. Chapitre 2 : Architecture des systèmes de BI III. Chapitre 3 : Modélisation des données pour BI IV. Chapitre 4 : Outils et technologies de BI V. Chapitre 5 : Analyse et exploration des données VI. Chapitre 6 : Visualisation des données VII. Chapitre 7 : Applications et études de cas 2 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme III. Chapitre 3 : Modélisation des données BI I. Modélisation multidimensionnelle II. Cube de donnée III. Stratégies d’implantation d’un Entrepôt de données IV. Schéma en étoile, en flocon et en constellation 3 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI I. Architecture globale d’un système BI Ingestion Stockage Préparation Modèle de Visualisation Données données Streaming Hub data Entrepôt de données Fichier Agent collecteur Data Lake Relationnel Master data Modèles de données 4 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI I. Modélisation multidimensionnelle ❖ Vision proche de l’analyste ❖ Basé sur une vision de la donnée sur plusieurs dimensions ❖ Le sujet d’analyse est vu comme un point dans l’espace ❖ Le sujet d’analyse et les différents points d’analyse 5 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI I. Modélisation multidimensionnelle Catégories de produits Ventes Temps 6 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI III. Modélisation multidimensionnelle– Fait ❖ Un fait : ❖ Modélise le sujet de l'analyse ❖ Est formé de mesures correspondant aux informations de l'activité analysée. ❖ Ces mesures sont numériques et généralement valorisées de façon continue, on peut les additionner, les dénombrer ou bien calculer le minimum, le maximum ou la moyenne. Exemple : le fait de « Vente » peut être constitué des mesures d'activités suivantes : quantité de produits vendus et montant total des ventes 7 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI III. Modélisation multidimensionnelle– Dimension ❖ Le sujet analysé, le fait, est analysé suivant différentes perspectives ou axes caractérisant ses mesures de l’activité : on parle de dimensions. ❖ Une dimension : modélise un axe d'analyse se compose de paramètres correspondant aux informations faisant varier les mesures de l'activité. Ex: Dans l'exemple précédent, le fait « Vente » peut être analysé suivant différentes perspectives correspondant à trois dimensions : la dimension Temps, la dimension Géographie et la dimension Catégorie : 8 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI III. Modélisation multidimensionnelle – Hiérarchie de dimension ❖ Les faits sont analysés selon les dimensions qui les caractérisent ❖ Nécessaire de définir pour chaque dimension ses différents niveaux hiérarchiques de détail (d’agrégation), ❖ Les hiérarchies de dimensions définissent des niveaux de détail de l'analyse sur les dimensions ❖ Ex: ❖ Dimension « temps» : H1 : jour ® mois ® trimestre ® année ; H2 : jour ® mois ® trimestre ® année ; H3 : jour ® mois ® saison ® année ; ❖ Dimension « géographie » : ville ® département ® région (chaque ville appartient à un département qui est situé dans une région) ❖ Dimension « catégorie» : couleur ® nomProduit ® gamme ® typeProduit (chaque produit appartient à une gamme de produit qui appartient à un type de produit) 9 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI II. Le Cube de données « Un cube de données est une méthode de stockage des données qui contient aussi la définition des mesures, des dimensions, des hiérarchies ». 10 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI II. Le Cube de données 11 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI III. Stratégies d’implantation d’un Entrepôt de données 3 stratégies : 1 - Usage d’un SGBD Relationnel (systèmes ROLAP) ❖ Les SGBDR représentant plus de 80% des SGBD : ils sont principalement envisagés pour le développement d’ED mais doivent être adaptés ❖ Ils doivent cependant être adaptés car ils n’ont pas les caractéristiques adéquates pour répondre aux besoins des ED. 2 - Usage d’un SGBD Multidimensionnel (systèmes MOLAP) ❖ Un SGBD Multidimensionnel (SGBDM) est un SGBD capable de stocker et traiter des données multidimensionnelles ❖ A ce jour pas encore de cadre technologique commun pour le développement de tels systèmes : chaque produit est spécifique 3 - Usage d’un SGBD Hybride (systèmes HOLAP) Tire profit des avantages des technologies ROLAP et MOLAP : ❖ un ROLAP pour stocker, gérer les données détaillées ET ❖ un MOLAP pour stocker, gérer les données agrégées 12 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI III. Stratégies d’implantation d’un Entrepôt de données Niveau logique « ROLAP » : 3 grands types de schémas : ❖ schéma en étoile ❖ schéma en flocon ❖ schéma en constellation le schéma en étoile est souvent utilisé pour l'implantation physique 13 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI IV. Schéma en étole, en flocon et en constellation Schéma en étoile ❖ Table des faits : normalisée, de taille très importante, avec de nombreux champs ❖ Tables de dimensions : dimensions de l'analyse, taille peu importante, avec peu de champs Ex 1 : Vente de médicaments dans des pharmacies Schéma en étoile modélisant les analyses des quantités et des montants des médicaments dans les pharmacies selon 3 dimensions : le temps, la catégorie et la situation géographique ❖ Table de faits : Vente ❖ Tables de dimension : Temps, Catégorie, Géographie 14 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI IV. Schéma en étole, en flocon et en constellation Schéma en flocon ❖ Evolution du schéma en étoile avec une décomposition des tables de dimensions du modèle en étoile selon leurs hiérarchies (normalisation des tables de dimensions) ❖ Ex 3: Vente de médicaments dans des pharmacies 15 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Modélisation des données pour BI IV. Schéma en étole, en flocon et en constellation Schéma en constellation ❖ fusionne plusieurs modèles en étoile qui utilisent des dimensions communes. ❖ comprend en conséquence plusieurs faits et des dimensions communes ou non Ex : Vente de médicaments dans des pharmacies ❖ une constellation est constituée de 2 schémas en étoile : ❖ l'un correspond aux VENTES effectuées dans les pharmacies et ❖ l'autre analyse les PRESCRIPTIONS des médecins ❖ les dimensions Temps et Géographie sont partagées par les faits PRESCRIPTION et VENTE. 16 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Outils et technologie de la BI Modélisation en étoile pour suivre la performance des Athlètes pour les JO ▪ Données opérationnelles 17 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) III. Chapitre 3 : Outils et technologie de la BI Références Introduction à l’Informatique Décisionnelle et aux entrepôts de données : Bernard ESPINASSE - Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille. Ingénierie des Systèmes d’Information : Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille. Analyse de données : Polytech’Marseille -Patrice Bellot 18 12/08/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO