Cours 2-1 PDF - Statistique descriptive
Document Details
Uploaded by RobustRomanticism
Université Hassan II
Z. Serhier
Tags
Summary
This document is a presentation on descriptive statistics. It covers topics such as variables, data representation, and analysis techniques. The presentation is suitable for students or professionals.
Full Transcript
Statistique descriptive : organisation et présentation des données Z. Serhier LIM,FMPC Introduction La statstque descriptve: méthodes dont l’objectf principal est la descripton des données étudiées Cete descripton se fait à travers : leur présenta...
Statistique descriptive : organisation et présentation des données Z. Serhier LIM,FMPC Introduction La statstque descriptve: méthodes dont l’objectf principal est la descripton des données étudiées Cete descripton se fait à travers : leur présentaton (la plus commode et la plus synthétque possible, tableaux ou graphiques) calcul de résumés numériques (ou caractéristques numériques) 2 Introduction Statistique descriptive : Méthodes de représentation et de réduction des données But : faciliter la prise de connaissance des données (visualisation globale des données) Consiste à trier, regrouper et décrire la distribution des données 3 Population et individus Individu ou unité statistique Une unité distincte chez laquelle on peut observer une ou plusieurs caractéristiques données Population : ensemble d’unités statistiques Population cible : population à laquelle on veut généraliser les résultats Échantillon Sous-ensemble des individus (ou unités statistiques) pour lesquels on considère une ou plusieurs Variable statistique Caractéristique susceptible de variations observables Valeurs (attributs) : les mesures distinctes d'une caractéristique donnée Valeurs possibles tous les résultats possibles a priori si on fait une observation d'une variable Valeur observée résultat a posteriori d'une observation d'une variable 5 Diférentes échelles de mesures Quatre types d’échelles (Stevens 1946) Echelle nominale ou classifcatoire : Les nombres assignés ne défnissent aucune relaton quanttatve entre les objets (ex : numérotaton des joueurs de football) Echelle ordinale : résultats des mesures rangés dans le même ordre d’intensité du phénomène mesuré Echelle d’intervalle : résultats rangés dans le même ordre d’intensité du phénomène et respectent la distance Echelle de proportonnalité ou de rato : échelle d’intervalle avec l’existence d’un vrai 0 (rare) 6 Types de variables Variable qualitative Comporte des catégories qui ne sont pas "naturellement" associées à une valeur numérique (exemple : sexe, groupe sanguin…) Variable quantitative Représente la mesure d’une quantité, elle prend des valeurs numériques qui ont une signifcation concrète (exemple : âge, taille, poids…) 7 Variable qualitative Nominale : Famille de modalités non ordonnées ex : catégorie socioprofessionnelle Ordinale : Famille de modalités ordonnées ex : évolution (aggravation, stationnaire, amélioration) Dichotomique (binaire) Deux modalités ex : sexe 8 Variable quantitative Discrète : nombre fni de valeurs possibles valeurs distinctes et séparées ex : nombre d’enfants, terme de gestation en semaine Continue : nombre infni de valeurs possibles entre deux valeurs, il y a une valeur intermédiaire possible ex : dosage biologique 9 Types de variables Variable Qualitative Quantitative Ordinale Nominale Discrète Continue 10 Tri des données Organisation de façon cohérente de la masse des données d’une variable quantitative ou qualitative ordinale Le tri consiste à ranger les unités statistiques par ordre croissant ou décroissant des valeurs de la variable 11 Distribution Regroupement en classes On transforme une variable quantitative continue en variable ordinale à plusieurs classes Distribution Ensemble des efectifs (ou fréquences) répartis entre les classes de la variable étudiée 12 Représentation en tableau Nombre d’individus généralement grand Série brute de données est difcilement interprétable Inventaire des modalités rencontrées dans la série avec les efectifs correspondants : base à la construction de tableaux But : obtenir des résumés clairs en conservant l’essentiel de l’information 13 Exemple données brutes Age de 100 patients hospitalisés en traumatologie 62 41 25 28 40 26 30 29 32 39 64 38 34 25 28 28 52 46 33 22 22 25 24 41 33 46 34 29 36 25 60 20 42 31 44 29 55 51 38 21 34 22 55 18 26 51 31 25 36 34 45 33 31 34 33 26 22 33 34 26 25 29 22 39 32 33 23 26 32 52 36 51 23 36 36 34 50 35 33 49 28 48 50 25 28 36 45 45 30 27 45 27 45 38 37 33 21 53 26 43 Aucune interprétatin pissible 14 Série ordonnée 18 23 26 28 31 33 36 39 45 51 20 24 26 28 32 33 36 39 45 51 21 25 26 29 32 34 36 40 45 52 21 25 26 29 32 34 36 41 46 52 22 25 26 29 33 34 36 41 46 53 22 25 27 29 33 34 36 42 48 55 22 25 27 30 33 34 37 43 49 55 22 25 28 30 33 34 38 44 50 60 22 25 28 31 33 34 38 45 50 62 23 26 28 31 33 35 38 45 51 64 Infirmatin plus claire (minimum, maximum…) 15 Distribution observée Age efectf 15-19 1 20-24 11 Données regroupées en classes 25-29 24 (intervalles) 30-34 23 Efectif d’une classe= nombre 35-39 13 40-44 6 d’observations dans cette classe 45-49 9 (fréquence absolue) 50-54 8 55-59 2 60-64 3 total 100 16 Tableaux Le tableau le plus simple est à deux colonnes (liste des catégories, efectifs de chaque catégorie) Il peut être agrandi pour inclure des sous-groupes (ex : classes d’âge selon le sexe) 17 Classe d’âge selon le sexe âge femmes hommes 15-19 1 0 20-24 4 7 25-29 11 13 30-34 12 11 35-39 6 7 40-44 3 3 45-49 4 5 50-54 4 4 55-59 1 1 60-64 2 1 18 Fréquence relative Ou Fréquence Rapport entre l’efectif (fréquence absolue) et la taille de l’échantillon 19 Exemple : Distribution de nombre de garçons par famille Fréquence Nombre de garçons Nombre de famille relative xi (valeur) ni (efectif) Fi = ni/N 0 120 0,12 1 470 0,47 2 330 0,33 3 50 0,05 4 20 0,02 5 10 0,01 Total N= 1000 1 20 Exemple tableaux 21 Fréquence cumulée N’a de sens que si la variable est ordinale ou quantitative Fréquence cumulée associée à une valeur xi : proportion d’observations inférieures ou égales à xi 22 Exemple : distribution des poids de 100 adultes de sexe féminin 23 Représentations graphiques Représentation graphique permet – Visualiser l’information pertinente à retenir – Mettre en évidence contrastes ou tendances Préférer la simplicité Bien choisir les unités et les axes 24 Représentations graphiques Plusieurs types de graphiques : Variable qualitative Variable – Diagramme en quantitative secteurs – Histogramme – Diagramme en – Boite à barres/ en bâtons moustache – Diagramme en radar – Nuage de points (deux variables) 25 Diagramme en secteurs Répartition de variables nominales Exemple : répartitions des circonstances du traumatisme Diagramme en barres Représenter l’efectif ou la fréquence de chaque modalité d’une variable qualitative Nom des modalité sur l’axe des abscisses Les efectifs sur l’axe des ordonnées Représentation peut être inversée pour une meilleure lisibilité 27 Diagramme en barres Recommandé pour une variable qualitative ordinale 28 Diagramme en barres horizontal Adapté pour variable qualitative nominale 29 Diagramme en barres 30 Erreur d’utilisation des diagrammes en barre représentaton des moyennes et écart-types 31 Erreur d’utilisation des diagrammes en barre représentaton des moyennes et écart-types 32 Erreur d’utilisation des diagrammes en barre 33 Tracés de Moyennes avec Barres d'Erreur 34 Tracés de Moyennes avec Barres d'Erreur 35 Histogramme Représentation graphique des variables quantitatives continues Bornes minimale et maximale fxées Il faut déterminer des intervalles La surface des rectangles est proportionnelle à la fréquence Il faut bien choisir le nombre de classes Pour simplifer la lecture : intervalles de même amplitude 36 Histogramme 37 Polygone des efectifs Abscisse : centre de classe Ordonnée : efectf (fréquence) 38 Polygone des efectifs cumulés croissant Abscisse : limite supérieure de la classe Ordonnée : efectf (fréquence) cumulé croissant Lecture directe des quartles efectf cumulé Distribution du poids 90 80 70 60 50 40 30 20 10 0 30 40 50 60 70 80 90 100 39 Polygone des fréquences cumulées Distributon du poids Chart Title 100 90 80 70 60 50 40 30 20 10 0 30 40 50 60 70 80 90 100 40 Boite à moustache Moyen simple pour résumer une variable quanttatve Représente la médiane, 1er et 3e quartles Les limites sont souvent représentées par le 1 er et 9e déciles Permet une comparaison visuelle entre deux séries 41 Boite à moustache 42 Exemple de boite à moustache 43 Exemple de boite à moustache 44 Exemple Expression du gène PES 1 par des cellules normales et des cellules tumorales 45 Diagramme en radar Ou diagramme en toile d’araignée Représentaton de plusieurs ensembles de données sur le même plan Plusieurs axes Chaque catégorie sur un axe séparé Tous les axes partent du centre Les catégories sont indiquées autour du graphique 46 Diagramme en radar Congestion nasale 10 Fatigue Troubles du goût 5 0 Renfement Douleur faciale Mauvaise haleine 47 Nuage de points Deux variables quantitatives Exemple : Variation de la TA en fonction de l’âge 48 Nuage de points Variation du score EDSS (Expanded Disability Status Scale) en fonction des valeurs de Thyroxine libre FT4 49 Graphique en courbe Souvent décrit une évolution dans le temps d’un paramètre Exemple : Tendance de la mortalité par cancer en fonction du sexe ASR : Age standardized rate 50 Graphique en courbe Courbes de tendance des incidences standardisées des cancers du sein et de la prostate 51 Conclusion Représentation graphique des données : étape préliminaire indispensable à toute analyse statistique Visualisation globale des données Doit être synthétique et informative 52