Chapitre 5 : Analyse et exploration des données PDF

Document Details

AgreeableDalmatianJasper4570

Uploaded by AgreeableDalmatianJasper4570

Université de Ouagadougou

Cheik OUEDRAOGO

Tags

business intelligence data analysis decision-making information systems

Summary

This document is a course on business intelligence and data analysis. It covers topics such as data analysis, definitions, methods, and exploration of data for business decision-making. The document provides relevant information on data analysis using various methods.

Full Transcript

Cours d’informatique décisionnelle Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme I. Chapitre 1 : Introduction à l’informatique décisionnelle (Business intelligence...

Cours d’informatique décisionnelle Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme I. Chapitre 1 : Introduction à l’informatique décisionnelle (Business intelligence) II. Chapitre 2 : Architecture des systèmes de BI III. Chapitre 3 : Modélisation des données pour BI IV. Chapitre 4 : Outils et technologies de BI V. Chapitre 5 : Analyse et exploration des données VI. Chapitre 6 : Visualisation des données VII. Chapitre 7 : Applications et études de cas 2 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) Programme V. Chapitre 5 : Analyse et exploration des données I. Définitions II. Les méthodes d’analyses exploratoires III. TP exploration des données 3 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données I. Définitions ❖ Etapes préliminaire dans une démarche d’une analyse Analyse de données ❖ Extension nouvelle dans la recherche et la statistique ❖ Réponse à une problématique donnée Analyse Analyse exploratoire des confirmatoire données Idées/ Découverte Vérifier des hypothèses 4 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données I. Définitions ❖ Analyses multidimensionnelles et descriptives ❖ Trouver des relations entre les données ❖ Synthétiser l’information ❖ S’approprier la donnée, trouver des corrélations 5 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données I. Définitions L’analyse de données peut être conduite suivant ❖ Les individus : recherche de ressemblance entre les individus (suivant la valeur des variables) = classification automatique des individus ❖ Les variables : quelles sont les variables qui expliquent le mieux les données (différences entre les individus) 6 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données I. Méthodes d’analyses exploratoires ❖ Variables quantitatives (continue) : Analyse en composantes principales (ACP) ❖ Variables quantitatives + une variable qualitative : Analyse factorielle discriminante (AFD) ❖ Croisement de 2 variables qualitatives (nominales) ou tableau lexical : Analyse Factorielle des Correspondances (AFC). ❖ Ensemble de variables qualitatives : Analyse des Correspondances Multiples (ACM) 7 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Rappel de quelques notions de statistique 8 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Rappel de quelques notions de statistique 9 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Rappel de quelques notions de statistique Valeur aberrante Maximum ❖ La valeur centrale du graphique est la médiane (il existe autant de valeurs supérieures qu'inférieures à cette valeur dans l'échantillon). Troisième quartile ❖ Les bords du rectangle sont les quartiles (Pour le bord inférieur, un Médiane quart des observations ont des valeurs plus petites et trois quart ont des valeurs plus grandes, le bord supérieur suit le même raisonnement). Premier quartile ❖ Les extrémités des moustaches sont calculées en utilisant 1.5 fois l'espace interquartile (la distance entre le 1er et le 3ème quartile). Minimum Diagramme Boxplot 10 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Rappel de quelques notions de statistique ❖ Il est utilisé pour déterminer la solidité d'une relation entre deux variables numériques. L’axe des x représente la variable indépendante et l’axe des y, la variable dépendante. Nuages de points 11 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Analyse en composantes principales (ACP) ❖ Permet de représenter en 1,2 ou 3 dimensions des nuages d’individus ❖ En conservant les distances entre les individus ❖ En privilégiant les dimensions de plus grande variabilité 12 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Analyse en composantes principales (ACP) ❖ Variables quantitative (continue) ❖ Quelles sont les corrélations entre les variables ❖ Quels sont les liens qui unissent les variables ❖ Utile lorsque le nombre de variables est très grands 13 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Méthode ACP ❖ Recherche des valeurs propres |M – I| = 0; puis des vecteurs propres ❖ Les plus fortes valeurs propres correspondent aux inerties (variance) des axes principaux. 14 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Analyse en composantes principales (ACP) ❖ Variables quantitative (continue) ❖ Quelles sont les corrélations entre les variables ❖ Quels sont les liens qui unissent les variables ❖ Utile lorsque le nombre de variables est très grands 15 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données II. Méthodes d’analyses exploratoires Analyse Factorielle des Correspondances (AFC) ❖ Permet de représenter en 1,2 ou 3 dimensions des nuages d’individus ❖ En conservant les distances entre les individus ❖ En privilégiant les dimensions de plus grande variabilité ❖ Introduction d’une dimension qualitative 16 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données III. TP exploratoire des données ❖ ACP ❖ AFD 17 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO Licence L3 – Informatique décisionnelle (BI) V. Chapitre 5 : Analyse et exploration des données Références Introduction à l’Informatique Décisionnelle et aux entrepôts de données : Bernard ESPINASSE - Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille. Ingénierie des Systèmes d’Information : Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille. Analyse de données : Polytech’Marseille -Patrice Bellot 18 06/11/2024 Informatique décisionnelle – Business intelligence Cheik OUEDRAOGO

Use Quizgecko on...
Browser
Browser