IMG_6025.HEIC
Document Details

Uploaded by ConvenientPeridot4215
Full Transcript
# Statistiques descriptives univariées ## Définitions ### Définition 1 On appelle **population** l'ensemble sur lequel porte l'étude statistique. Les éléments de la population sont appelés **individus** ou **unités statistiques**. Le nombre d'individus s'appelle la **taille** de la population. #...
# Statistiques descriptives univariées ## Définitions ### Définition 1 On appelle **population** l'ensemble sur lequel porte l'étude statistique. Les éléments de la population sont appelés **individus** ou **unités statistiques**. Le nombre d'individus s'appelle la **taille** de la population. ### Définition 2 Un **caractère** (ou variable statistique) est une propriété que l'on peut observer ou mesurer sur chaque individu de la population. Les différentes valeurs que peut prendre le caractère sont appelées **modalités**. ### Définition 3 Un caractère est dit **qualitatif** si ses modalités ne sont pas numériques. Un caractère qualitatif est dit **ordinal** si ses modalités peuvent être ordonnées. ### Définition 4 Un caractère est dit **quantitatif** si ses modalités sont des nombres. Un caractère quantitatif est dit **discret** si l'ensemble de ses modalités est fini ou dénombrable. Il est dit **continu** si ses modalités peuvent prendre toutes les valeurs d'un intervalle réel. ## Tableaux d'effectifs et fréquences ### Définition 5 Soit $x_1, \dots, x_n$ les valeurs distinctes prises par un caractère quantitatif ou les modalités d'un caractère qualitatif. - L'**effectif** de la valeur ou modalité $x_i$ est le nombre $n_i$ d'individus qui présentent cette valeur ou modalité. - La **fréquence** de la valeur ou modalité $x_i$ est le rapport $f_i = \frac{n_i}{n}$, où $n$ est la taille de la population. - Pour les caractères quantitatifs, on appelle **effectif cumulé croissant** de la valeur $x_i$ la somme des effectifs des valeurs inférieures ou égales à $x_i$. On le note $N_i = \sum_{k=1}^{i} n_k$. - Pour les caractères quantitatifs, on appelle **fréquence cumulée croissante** de la valeur $x_i$ le rapport $F_i = \frac{N_i}{n} = \sum_{k=1}^{i} f_k$. ### Exemple 1 Voici le relevé des notes obtenues par les étudiants d'une promotion: 10; 12; 18; 12; 08; 12; 10; 04; 18; 12; 10; 10; 12; 14; 14; 08; 12; 12; 10; 14; 18; 16; 14; 12; 08 Le tableau d'effectifs et de fréquences est le suivant: | Notes | 04 | 08 | 10 | 12 | 14 | 16 | 18 | | :-------- | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | Effectifs | 1 | 3 | 5 | 8 | 4 | 1 | 3 | | Fréquences| 0.04| 0.12| 0.20| 0.32| 0.16| 0.04| 0.12| Le tableau des effectifs cumulés croissants et des fréquences cumulées croissantes est le suivant: | Notes | 04 | 08 | 10 | 12 | 14 | 16 | 18 | | :------------------------ | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | Effectifs cumulés croissants| 1 | 4 | 9 | 17 | 21 | 22 | 25 | | Fréquences cumulées croissantes | 0.04 | 0.16 | 0.36 | 0.68 | 0.84 | 0.88 | 1.00 | ## Paramètres de position ### Définition 6 Le **mode** d'une variable statistique est la valeur ou modalité qui a le plus grand effectif. *Dans l'exemple 1, le mode est la note 12.* ### Définition 7 La **moyenne** d'une variable statistique quantitative est le nombre: $\qquad \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i = \sum_{i=1}^k f_i x_i$ où $x_1, \dots, x_k$ sont les valeurs distinctes prises par le caractère. *Dans l'exemple 1, la moyenne est:* $\qquad \bar{x} = 0.04 \times 4 + 0.12 \times 8 + 0.20 \times 10 + 0.32 \times 12 + 0.16 \times 14 + 0.04 \times 16 + 0.12 \times 18 = 11.84$ ### Définition 8 La **médiane** d'une variable statistique quantitative est une valeur $m$ telle que (au moins) 50% des individus ont une valeur inférieure ou égale à $m$ et (au moins) 50% des individus ont une valeur supérieure ou égale à $m$. *Dans l'exemple 1, la médiane est la note 12.* ### Remarque 1 - Le mode est un paramètre de position qui peut être calculé pour tous les types de caractères (qualitatifs ou quantitatifs). - La moyenne est un paramètre de position qui ne peut être calculé que pour les caractères quantitatifs. - La médiane est un paramètre de position qui ne peut être calculé que pour les caractères quantitatifs ordonnés. Elle est souvent utilisée lorsque la distribution est asymétrique ou contient des valeurs aberrantes. ## Paramètres de dispersion ### Définition 9 L'**étendue** d'une variable statistique quantitative est la différence entre la valeur maximale et la valeur minimale observées. *Dans l'exemple 1, l'étendue est: $18 - 4 = 14$* ### Définition 10 La **variance** d'une variable statistique quantitative est le nombre: $\qquad V = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2 = \sum_{i=1}^k f_i (x_i - \bar{x})^2 = \left( \frac{1}{n} \sum_{i=1}^{n} x_i^2 \right) - \bar{x}^2$ où $x_1, \dots, x_k$ sont les valeurs distinctes prises par le caractère et $\bar{x}$ est la moyenne. L'**écart-type** est la racine carrée de la variance: $\sigma = \sqrt{V}$. *Dans l'exemple 1, la variance est:* $\qquad V = 0.04 \times (4 - 11.84)^2 + 0.12 \times (8 - 11.84)^2 + 0.20 \times (10 - 11.84)^2+ 0.32 \times (12 - 11.84)^2 + 0.16 \times (14 - 11.84)^2 + 0.04 \times (16 - 11.84)^2 + 0.12 \times (18 - 11.84)^2 = 14.77$ *L'écart-type est donc: $\sigma = \sqrt{14.77} = 3.84$*