Statistiques et Analyse des données (Chapitre 2) PDF
Document Details
Uploaded by Deleted User
Université Constantine 2
2024
BOUARROUDJ Kenza
Tags
Summary
Ce document présente les concepts de base de Statistique et de l'analyse des données, spécifiquement l'étude d'une variable statistique discrète. Il détaille les exemples, les représentations graphiques (diagrammes différentiel et intégral) et les paramètres de position (mode, médiane, moyenne. Les différents quartiles sont également abordés. Les concepts clés et les exemples constituent les points forts du document, qui présente une analyse approfondie et pratique de la statistique. Le résumé ne couvre que l'aperçu du document et contient les principales parties qui sont abordées.
Full Transcript
Statistique et Analyse des données – Chapitre 2 – Étude d’une variable statistique discrète BOUARROUDJ Kenza NTIC/TLSI...
Statistique et Analyse des données – Chapitre 2 – Étude d’une variable statistique discrète BOUARROUDJ Kenza NTIC/TLSI [email protected] Université Constantine 2 2024/2025. Semestre 1 Statistique et Analyse des données – Chapitre 2 – Étude d’une variable statistique discrète BOUARROUDJ Kenza NTIC/TLSI [email protected] Faculté/Institut Département Niveau Spécialité Nouvelles technologies TLSI Master 1 ILSI Université Constantine 2 2024/2025. Semestre 1 Exemple 2.1 Exemple 1 Un quartier est composé de 50 ménages, et la variable statistique représente le nombre de personnes par ménage. Les valeurs de la variable sont: 1111122222222233333333333333344444 4444455555566688 On va construire le tableau statistique suivant Université Constantine 2 © BOUARROUDJ Kenza 2 / 21 Exemple 2.1 Exemple 1 xi ni Ni fi = ni /N Fi 1 5 5 0.10 0.10 2 9 14 0.18 0.28 3 15 29 0.30 0.58 4 10 39 0.20 0.78 5 6 45 0.12 0.90 6 3 48 0.06 0.96 8 2 50 0.04 1.00 Σ N=50 1.00 Université Constantine 2 © BOUARROUDJ Kenza 3 / 21 Représentations graphiques des données Essentiellement deux types de graphique permettant de visualiser les effectifs (ou fréquences) cumulés Diagramme différentiel On porte sur l’axe des abscisses les valeurs discrètes de la variable et les effectifs ou les fréquences en ordonnées. Chaque valeur discrète de la variable est représentée par une barre verticale dont la hauteur correspond à l’effectif. reprenons l’exemple 1: Université Constantine 2 © BOUARROUDJ Kenza 4 / 21 Représentations graphiques des données Diagramme différentiel Figure: Diagramme différentiel. Université Constantine 2 © BOUARROUDJ Kenza 5 / 21 Représentations graphiques des données Diagramme intégral On porte sur l’axe des abscisses les valeurs discrètes de la variable et les effectifs cumulés croissants sur l’axe des ordonnées. On trace alors une courbe en escalier qui sera ouverte à gauche et fermée à droite en chaque point de discontinuité. Celle-ci donne pour chaque xi la proportion des individus dont la valeur est inférieure à xi : Université Constantine 2 © BOUARROUDJ Kenza 6 / 21 Représentations graphiques des données Diagramme intégral Figure: Diagramme intégral Université Constantine 2 © BOUARROUDJ Kenza 7 / 21 Paramètres de position Les indicateurs statistiques de tendance centrale (dits aussi de position) considérés fréquemment sont la moyenne, la médiane, le mode et Les quartiles. Mode Le mode d’une V.S est la valeur qui a le plus grand effectif partiel (ou la plus grande fréquence partielle) et il est dénoté par M0 Université Constantine 2 © BOUARROUDJ Kenza 8 / 21 Paramètres de position Mode On reprend l’exemple précédent: Figure: Diagramme différentiel. le mode égale à 3 Université Constantine 2 © BOUARROUDJ Kenza 9 / 21 Paramètres de position La médiane La médiane, désignée par Me , la valeur de la variable statistique qui divise la population en deux populations égaux dans le nombre d’individu. Pour trouver la médiane on a deux méthodes. Université Constantine 2 © BOUARROUDJ Kenza 10 / 21 Paramètres de position La médiane La première c’est d’utiliser la colonne des effectifs cumulés dans le tableau statistique, c’est à dire on détermine la N position de , ensuite nous verrons qu’elle est la variable 2 statistique qui correspond à cette position. Exemple N Revenons à l’exemple 1. Nous trouvons que = 25 et N = 50, 2 donc M = 3. Université Constantine 2 © BOUARROUDJ Kenza 11 / 21 Paramètres de position La médiane La deuxième méthode c’est d’utiliser la colonne des fréquences cumulées, car par définition de la médiane on trouve: F (M) = 0.5.. Donc il faut chercher les valeurs Fi et Fi1 qui encadre 0.5. C’est à dire Fi−1 ≤ 0.5 ≤ Fi. Il nous reste de déterminer la variable statistique. Exemple Dans l’exemple 1, on trouve que 0.28 ≤ 0.5 ≤ 0.58. Donc M = 3 Université Constantine 2 © BOUARROUDJ Kenza 12 / 21 Paramètres de position Moyenne On appelle moyenne de X, la quantité: n n 1 X X x= ni xi = fi xi N i=1 i=1 avec N = card (Ω). On peut donc exprimer et calculer la moyenne dite ”arithmétique” avec des effectifs ou avec des fréquences. Exemple Dans l’exemple 1, on trouve que x = 3.44 Université Constantine 2 © BOUARROUDJ Kenza 13 / 21 Paramètres de position Les quartiles il y on a trois: 1 Q1 : dans cette valeur de la population accumule. Pour le 4 déterminer nous utilisons la colonne des effectif cumul2s N (déterminer la position de ) ou bien la colonne des 4 fréquences cumulées (déterminer la position de 0.25). 1 Q2 : dans cette valeur de la population accumule. Donc 2 Q2 = Médiane. Université Constantine 2 © BOUARROUDJ Kenza 14 / 21 Paramètres de position Les quartiles 3 Q3 : dans cette valeur de la population accumule. Pour le 4 déterminer nous utilisons la colonne des effectif cumulés 3N (déterminer la position de ) ou bien la colonne des 4 fréquences cumulées (déterminer la position de 0.75). Exemple Dans l’exemple 1, on trouve que Q1 = 2 , Q2 = 3 , Q3 = 4 Université Constantine 2 © BOUARROUDJ Kenza 15 / 21 Paramètres de dispersion L’étendue La différence entre la plus grande valeur et la plus petite valeur du caractère, donnée par la quantité : e = xmax − xmin Exemple Dans l’exemple 1, on trouve que e= 7 Université Constantine 2 © BOUARROUDJ Kenza 16 / 21 Paramètres de dispersion L’écart inter-quartile L’écart inter-quartile est la différence entre le 3e quartile et le 1er quartile : IQ = Q3 − Q1 Exemple Dans l’exemple 1, on trouve que IQ = 2 Université Constantine 2 © BOUARROUDJ Kenza 17 / 21 Paramètres de dispersion La variance On appelle variance de cette série statistique X, le nombre n X Var (x) = fi (x − xi )2 i=1 Le théorème suivant (Théorème de König-Huygens) est plus pratique dans le calcule de la variance. Théorème Soit (xi , ni ) une série statistique de moyenne x et de variance Var (x). Alors, n X Var (x) = fi xi2 − x 2 i=1 Université Constantine 2 © BOUARROUDJ Kenza 18 / 21 Paramètres de dispersion L’écart type La quantité p σx = Var (x) Exemple Dans l’exemple 1, Var (x) = 2.6064 et σx = 1.614 Université Constantine 2 © BOUARROUDJ Kenza 19 / 21 Paramètres de dispersion L’écart type Remarque Le paramètre σx mesure la distance moyenne entre x et les valeurs de X. Il sert à mesurer la dispersion d’une série statistique autour de sa moyenne. Plus il est petit, plus les variables statistique sont concentrés autour de la moyenne (on dit que la série est homogène). Plus il est grand, plus les caractères sont dispersés autour de la moyenne (on dit que la série est hétérogène). Université Constantine 2 © BOUARROUDJ Kenza 20 / 21 Paramètres de dispersion L’écart type Figure: La dispersion d’une série statistique autour de sa moyenne Université Constantine 2 © BOUARROUDJ Kenza 21 / 21