Statistiques descriptives: Mesures de tendances centrales et de dispersion PDF

Summary

Ce document présente des notes de cours sur les statistiques descriptives, se concentrant sur les mesures de tendance centrale et de dispersion. Il comprend des définitions, des exemples et des explications détaillés. Le contenu traite de la moyenne, de la médiane, du mode, de la variance et de l'écart-type.

Full Transcript

Statistiques descriptives: Mesures de tendances centrale et de dispersion Pr Asmae Khattabi Méthodes Biostatistiques Licence Professionnelle...

Statistiques descriptives: Mesures de tendances centrale et de dispersion Pr Asmae Khattabi Méthodes Biostatistiques Licence Professionnelle Semestre: S1 Année 2024-2025 www.um6ss.ma Plan du cours: Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: La Moyenne Sous-Chapitre 1.2: La Médiane Sous-Chapitre 1.3:Le Mode Chapitre 2:Mesures de dispersion Sous-Chapitre 2.1: L’Etendue Sous-Chapitre 2.2: Les Quartiles Sous-Chapitre 2.3: La Variance et l’Ecart-type 2 Objectifs pédagogiques: Mesures de Tendance Centrale 1. Comprendre le concept de tendance centrale et son importance dans l'analyse des données. 2. Savoir calculer et interpréter la moyenne arithmétique d'un ensemble de données. 3. Savoir calculer et interpréter la médiane d'un ensemble de données. 4. Comprendre le mode et savoir comment et quand l'utiliser. 5. Comparer la moyenne, la médiane et le mode. Mesures de Dispersion 1. Comprendre le concept de dispersion et son importance dans l'analyse des données. 2. Savoir calculer et interpréter la variance et l'écart-type. 3. Connaître et savoir utiliser les quartiles et l'intervalle interquartile. 3 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: La Moyenne Moyenne arithmétique (1) µ = moyenne = somme des valeurs observées divisée par le nombre d’observations N = nombre d’observations Xi = valeur de l’observation i i allant de 1 à N 4 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: La Moyenne Moyenne arithmétique (2) Exemple: Nombre d’enfants par famille dans un échantillon de 10 familles Famille Nombre d’enfants A 2 B 8 C 1 D 1 E 4 F 5 G 2 H 3 I 0 J 1 Total 27 Quel est le nombre moyen d’enfants par famille ? 27 / 10 = 2,7 5 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: La Moyenne Exemple: Soit une série de données sur l’âge (ans): 12, 10, 20, 60 Moyenne =12+10+20+60 =25.5 ans 4 6 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: La Moyenne Moyenne arithmétique (2) Avantages Inconvénients  Universellement répandue et  Fortement influencée par les acceptée valeurs extrêmes  Se prête facilement aux calculs  Représente mal les valeurs d’une population hétérogène (bimodale par exemple) ou fortement asymétrique 7 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.2: Médiane (1) valeur qui divise en 2 parties égales une série de valeurs ordonnées les valeurs observées sont disposées en ordre croissant ou décroissant 50% des valeurs sont inférieures à la médiane et 50% sont supérieures N+1 N = nombre rang de la médiane = d’observations 2 8 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.2: Médiane (2) Si N est un nombre impair : Médiane = observation située au milieu ex : 13 observations, rang = (13+1)/2=7 médiane = valeur de la 7e observation Si N est un nombre pair : Médiane est à mi-chemin entre les deux valeurs du milieu de la distribution 9 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.2: Médiane (3) Exemple: Nombre d’enfants dans chacune des 10 familles Famille Nombre d’enfants A 2 B 8 C 1 Valeurs : 0 1 1 1 2 2 3 4 5 8 D 1 E 4 Rangs : 1 2 3 4 5 6 7 8 9 10 F 5 G 2 H 3 2 I 0 J 1 Total 27 Quel est le nombre médian d’enfants par famille ? 10 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.1: Médiane (4) Avantages Inconvénients  Peu influencée par les valeurs  Se prête mal aux calculs extrêmes  Ne représente que la valeur qui  Le choix de l’intervalle de classe sépare l’échantillon en deux agit peu sur sa valeur parties de même effectif sans tenir compte de l’ensemble des données  Bon indicateur pour des variables asymétriques 11 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.3: Mode (1) Valeur prise par le plus grand nombre de sujets Famille Nombre d’enfants A 2 B 8 Quel est le mode du nombre d’enfants par famille ? C 1 D 1 Valeurs : 0 1 1 1 2 2 3 4 5 8 E F 4 5 Le mode c’est : 1 G 2 Exemple 2: Age: 10, 10, 12, 20, 18 H 3 =>Mode=? I 0 J 1 Exemple 3: Cholestérol: 120, 125, 150, 130, 130, 150 Total 27 =>Modes: ? 12 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.3: Mode (2) Exemple: Délai d’incubation Classe [27-30[ heures Quel est le mode du délai d’incubation ? 13 1 Chapitre 1: Mesures de Tendance centrale Sous-Chapitre 1.3: Mode (3) Avantages Inconvénients  Non affecté par les valeurs  Se prête mal aux calculs exceptionnelles  Varie beaucoup selon la largeur  Permet de représenter des choisie pour les classes populations hétérogènes qui présentent plusieurs valeurs dominantes 14 1 Chapitre 1: Mesures de Tendance centrale Question: Quel est le paramètre le plus représentatif des données? Nombre d’enfants dans chacune des 10 familles Famille Nombre d’enfants A 2 B 8 moyenne = 2,7 C D 1 1 médiane = 2 ? E 4 mode =1 F 5 G 2 H 3 I 0 J 1 Total 27 15 1 Chapitre 1: Mesures de Tendance centrale Exercice : Pour chaque phrase suivante, de quelle mesure de tendance centrale parle-t-on ? a) Il peut y en avoir plusieurs dans une distribution. b) C'est la mesure la plus utilisée. c) Elle est souvent utilisée pour exprimer des données démographiques, afin d'éviter que les valeurs extrêmes n'influencent trop la valeur. d) Elle peut être grandement influencée par le choix des classes. 16 1 Chapitre 1: Mesures de Tendance centrale Comparaison: Forme de la distribution Distribution symétrique (Normale) moyenne = médiane = mode Mo Me X X Me Mo Asymétrique à droite: Asymétrique à gauche : moyenne > médiane > mode mode > médiane > moyenne 17 1 Chapitre 1: Mesures de Tendance centrale Ces paramètres résument t-il bien la distribution ? 18 18 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.1: Etendue (1) différence entre la plus grande valeur et la plus petite valeur d'une série d'observations Exemple: Une série d’observations: 10, 20, 25, 40 => étendue= 40-10 =30 19 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.1: Etendue (2) moyenne = 70 moyenne = 70 étendue = 0 étendue = 4 moyenne = 70 moyenne = 70 étendue = 20 étendue = 20 20 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.2: Variance et écart-Type Écart-moyen: distance moyenne (en valeur absolue) séparant les observations de la moyenne L’écart moyen par rapport à la moyenne est nul par définition 21 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.2: Variance et écart-Type La variance (²) exprime la dispersion des observations autour de la moyenne. Elle tient compte de toutes les observations Variance : moyenne des carrés des écarts à cette moyenne N  2 = variance  (xi - µ)2 xi= valeur de l’observation i i=1 i allant de 1 à N 2 =  = moyenne N N= nombre total d’observations Ecart-type () : racine carrée de la variance En anglais, standard deviation 22 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.2: Variance et écart-Type Distribution du poids d’une population d’enfants de 6 à 36 mois Fréquence 10,9 kg moyenne variance = 1,21 kg 2 ??? écart-type = = 1,1 kg même unité que la variable 23 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.2: Variance et écart-Type ET = 0,5 ² = 0,25 ET = 1,2 ² = 1,44 variance = 1,21 kg 2 ??? 24 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.1: Variance et écart-Type N  i=1 (xi - µ)2 2 = N (68 - 70)2+(69 - 70)2+(71 - 70)2+(72 - 70)2 2 = 5 (-2)2+(-1)2+(1)2+(2)2 2 = 5 moyenne = 70 variance = Écart-type = 10 2 = =2 5 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.1: Variance et écart-Type moyenne = 70 moyenne = 70 variance = variance = 2 Écart-type = Écart-type = 1,4 moyenne = 70 moyenne = 70 variance = variance = Écart-type = Écart-type = 26 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.1: Variance et écart-Type moyenne = 70 moyenne = 70 variance = 0 variance = 2 Écart-type = 0 Écart-type = 1,4 moyenne = 70 moyenne = 70 variance = 40 variance = 50 Écart-type = 6,3 Écart-type = 7,1 27 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.3: Percentiles (1) Nième percentile : valeur en dessous de laquelle se situent n% des observations Percentiles les plus utilisés : décile (10%), quartile (25%) La médiane correspond au 50ème percentile et au second quartile 28 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.4: Quartiles L’intervalle de variation peut être découpé en quartiles (4 groupes) Les quartiles : Q1 Q2 = médiane Q3 25% 25% 25% 25% Q1 Q2 Q3 Q3 – Q1 = intervalle inter quartiles 29 1 Chapitre 2: Mesures de dispersion Sous-Chapitre 2.4: Quartiles Exemple: Les observations ci-dessous représentant les diamètres (en cm) de sarcomes enlevés des utérus de 20 femmes : 0.5 1.2 2.1 2.5 2.5 3 3.8 4 4.2 4.5 5 5 5 5 6 6.5 7 8 9.5 13 Q1=(20+1)/4=5.25ieme observation=(2.5)+(0.25)*(3-2.5)=2.625 Q2=(20+1)/2=10.5ieme observation=4.5+(0.5)*(5-4.5)=4.75 Q3=3(20+1)/4=15.75ieme observation=6+(0.75)*(6.5-6)=6.375 30 1 Chapitre 2: Mesures de dispersion Les paramètres qui résument les données d’une distribution moyenne Paramètres de position mode quartile médiane médiane 1er quartile 3ème quartile mode moyenne pourcentage écart-type écart-type Paramètres de dispersion extrêmes, intervalle interquartile étendue intervalle inter-quartile variance mini étendue max écart-type 31 1 Chapitre 2: Mesures de dispersion Paramètres mesurés sur une population Paramètres de position médiane quartile mode moyenne Population pourcentage Paramètres de dispersion extrêmes, étendue intervalle inter-quartile variance écart-type 32 Conclusion série de données peut être résumée en quelques paramètres : = mesures de tendance centrale (moyenne, médiane, mode) de dispersion (variance, écart-type, …) + Tableau de distribution de fréquence + graphique de distribution de fréquence paramètre de tendance centrale le plus utilisé : moyenne paramètre de tendance centrale (distribution dissymétrique) : médiane moyenne + (écart-type) médiane + (intervalle interquartile) 33 A retenir Les mesures de tendances centrales : Moyenne: mesure de tendance centrale la plus utilisée. Il s’agit de la somme des valeurs de toutes les observations, divisée par le nombre d'observations. Médiane: valeur qui occupe la place du milieu dans le rangement ascendant ou descendant des valeurs de la variable. Mode: valeur la plus fréquemment rencontrée dans une série de données. Les mesures de dispersion : Étendue: différence entre la plus grande valeur et la plus petite valeur d'une série d'observations. Variance : écart-type élevé au carré. S’interprète en termes d’unités carrées. Écart-type mesure la dispersion des observations autour de la moyenne. Un écart-type qui est grand indique la présence de données dispersées autour de la moyenne donc hétérogènes, alors qu’un écart-type petit indique la présence de données concentrées autour de la moyenne donc relativement homogènes.. 34 Bibliographie: Liens: Mesures de tendances centrales et de dispersion: 21427.doc (live.com) Livres: Biostatistique – Volume 1 (Bruno Scherrer) 35

Use Quizgecko on...
Browser
Browser