Cours d'échantillonnage et d'estimation Sara GOTTI PDF
Document Details
Uploaded by Deleted User
Faculté des sciences juridiques économiques et sociales de Kelâa des Sraghna
2022
Sara Gotti
Tags
Summary
Ce document est un cours d'échantillonnage et d'estimation pour les étudiants de la filière Economie et Gestion au troisième semestre. Il couvre les concepts statistiques, les lois de probabilité, la théorie de l'échantillonnage, l'estimation et les tests d'hypothèses. Le cours est dispensé par Sara GOTTI.
Full Transcript
Module: Echantillonnage et Estimation Professeur: Sara GOTTI [email protected] Filière Economie et Gestion (Semestre 3) Faculté des sciences juridiques économiques et sociales kelaa des Sraghna 2021-2022 ...
Module: Echantillonnage et Estimation Professeur: Sara GOTTI [email protected] Filière Economie et Gestion (Semestre 3) Faculté des sciences juridiques économiques et sociales kelaa des Sraghna 2021-2022 PLAN DU COURS 1. Chapitre 1: Rappels sur les concepts statistiques 2. Chapitre 2: Lois de probabilité 3. Chapitre 3: Théorie d’échantillonnage 4. Chapitre 4: Estimation 5. Chapitre 5: Tests d’hypothèses Sara GOTTI SEG S3, 2021-2022 2 CHAPITRE 1 Rappels sur les concepts statistiques ✓Définitions Sara GOTTI SEG S3, 2021-2022 3 Chapitre 1: Rappels sur les concepts statistiques Définitions Variable aléatoire: c’est une variable X associée à une expérience aléatoire dans le but de caractériser le résultat de cette expérience. On distingue les variables aléatoires discrètes et les variables aléatoires continues. Variable aléatoire discrète: c’est une variable qui prend un nombre fini ou dénombrable de valeurs. o la loi de la variable aléatoire X est la loi de probabilité sur l'ensemble des valeurs possibles de X qui calcule la probabilité P(X=xk ) pour chaque valeur xk. o Le total des probabilités est égal à 1. Sara GOTTI SEG S3, 2021-2022 4 Chapitre 1: Rappels sur les concepts statistiques Définitions Variable aléatoire continue: c’est une variable dont le résultat d'une expérience aléatoire n’est pas un entier et n'appartient pas à un ensemble fini, c’est un nombre réel défini sur ℝ sur un intervalle de ℝ. o Pour une variable aléatoire continue, on calcule la probabilité d'observer une valeur comprise dans un intervalle donné. o la probabilité d’appartenance à un intervalle se calcule à l’aide de l’aire de la fonctions densité sur cet intervalle. Esperance mathématique: c’est la valeur moyenne d’une variable. o Dans le cas d’une variable aléatoire discrète: 𝐸(𝑋)=∑𝑝𝑖 𝑥𝑖 o Dans le cas d’une variable aléatoire X qui suit une loi uniforme sur [a, b]: E(X) = (𝑎+𝑏)/2 Sara GOTTI SEG S3, 2021-2022 5 Chapitre 1: Rappels sur les concepts statistiques Définitions Lorsqu’il s’agit d’une variable statistique, sa valeur moyenne est la moyenne arithmétique. Moyenne arithmétique: La moyenne arithmétique (noté 𝑥ҧ ) ou moyenne empirique d'une série statistique est la moyenne ordinaire, elle est définie par la somme des valeurs 𝑥𝑖 divisée par l’effectif total. σ𝑛 𝑖=1 𝑛𝑖 ×𝑥𝑖 Elle est égale à: 𝑥ҧ = 𝑁 Fréquence: C’est le nombre ou l’effectif d’individus possédant un caractère spécial divisé par l’effectif total de la population. On le note 𝑛𝑖 𝑓𝑖. Elle est égale à: 𝑓𝑖 = σ 𝑛𝑖 Sara GOTTI SEG S3, 2021-2022 6 Chapitre 1: Rappels sur les concepts statistiques Définitions Écart-type: L'écart-type mesure la dispersion autour de la moyenne. Il est noté σ ou s et correspond à la racine carrée de la variance, comme dans la formule : 𝜎 = 𝑉𝑥 σ𝒏 𝒊=𝟏 𝒏𝒊 ×𝒙𝑖 𝟐 Avec 𝑉𝑥 = σ𝒏 ഥ2 −𝒙 𝒊=𝟏 𝒏𝒊 Sara GOTTI SEG S3, 2021-2022 7 CHAPITRE 2 Lois de probabilité Lois de probabilité discrètes ✓Loi de Bernoulli ✓Loi Binomiale Lois de probabilité continues ✓Loi Normale ✓La loi normale centrée réduite ✓Approximation de la loi binomiale par la loi normale Sara GOTTI SEG S3, 2021-2022 8 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi de Bernoulli Une variable aléatoire X qui suit une loi de Bernoulli se caractérise par une expérience aléatoire comportant deux issues (ou résultats) possibles: succès ou échec. On définit alors la variable aléatoire X comme étant le nombre de points obtenus; 1 en cas de succès, 0 en cas d’échec => X(Ω)={0, 1} La fonction de probabilité de la variable X est de la forme: 1 avec probabilité 𝒑 𝑋=ቊ 0 avec probabilité 𝟏−𝒑 où p est la probabilité de succès et 1-p est la probabilité d’échec. On note 𝑋↝ℬ(𝑝) Sara GOTTI SEG S3, 2021-2022 9 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi de Bernoulli L'Esperance mathématique de la loi de Bernoulli est le paramètre p de la loi: 𝐸(𝑋)= σ2𝑖=1 𝑥𝑖 𝑝𝑖 = (0×𝑃(𝑋=0))+(1×𝑃(𝑋=1))=𝑝 La variance de la loi de Bernoulli est: 𝑽 𝑿 = σ𝟐𝒊=𝟏 𝑿𝟐𝒊 𝑷𝒊 − 𝒑 𝟐 = 𝟎 + 𝟏. 𝐩 − 𝒑𝟐 𝑽 𝑿 = 𝒑 𝟏−𝒑 L’écart-type 𝜎 (𝑋 ): 𝜎 (𝑋 )= 𝑉(𝑥) Sara GOTTI SEG S3, 2021-2022 10 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi de Bernoulli Exemple On lance une pièce de monnaie et on s’intéresse au résultat pile. Si on obtient pile on réussit Si on obtient face on échoue La variable aléatoire X associé au résultat obtenu suit une loi de Bernoulli de paramètre 0,5 (la probabilité en cas de succès). 𝑋↝ℬ(0,5) E(X)=p=0,5 V(X)=p(1-p)=0,5×0,5=0,25 𝜎 (𝑋 )= V(X)= 0,25=0,5 Sara GOTTI SEG S3, 2021-2022 11 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi Binomiale Si on répète un schéma de Bernoulli n fois c-à-d on répète une expérience aléatoire à deux issues, on parle d’une loi binomiale; à condition que les répétitions soient indépendantes. Autrement dit, la loi binomiale correspond au comptage des succès en s’arrêtant à un nombre de répétitions fixé à l’avance. La loi binomiale dépend de deux paramètres n et p, et dont les valeurs possibles sont: 𝑋(Ω)= {0, 1, 2, …, 𝑛}; n est le nombre de répétitions et p est la probabilité en cas de succès. On note 𝑋↝ℬ(n, 𝑝) Sara GOTTI SEG S3, 2021-2022 12 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi Binomiale Une variable aléatoire X suit une loi binomiale de paramètres n et p si sa fonction de probabilité est de la forme : 𝑥 𝑥 𝑛−𝑥 𝑛! 𝑃(𝑋=𝑥) = 𝐶𝑛 𝑝 (1 − 𝑝) = 𝑝 𝑥 (1 − 𝑝)𝑛−𝑥 𝑥! 𝑛−𝑥 ! Avec 𝑥 ∈{0,1,2,3,…𝑛} et 𝑝 : 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑡é 𝑑𝑒 𝑠𝑢𝑐𝑐è𝑠, L'Esperance mathématique de𝑛 la loi Binomiale 𝑛 est égal à: 𝐸 𝑋 = 𝐸 𝑋𝑖 = 𝑝 = 𝑛𝑝 𝑖=1 𝑖=1 La variance de la loi de Binomiale est égal à: 𝑉 𝑋 = σ𝑛𝑖=1 𝑉 𝑋𝑖 = σ𝑛𝑖=1 𝑝(1 − 𝑝) = 𝑛𝑝(1 − 𝑝) L’écart-type 𝜎 (𝑋 ): 𝜎 (𝑋 )= 𝑉(𝑥) = 𝑛𝑝(1 − 𝑝) Sara GOTTI 13 Chapitre 2: Lois de probabilités Lois de probabilité discrètes Loi Binomiale Exemple On lance 10 fois une pièce de monnaie. Soit la variable aléatoire X représentant le nombre de piles apparues. 1 𝐴𝑙𝑜𝑟𝑠, 𝑋↝ 𝐵 (𝟏𝟎; ), 2 1 1 1 𝐸(𝑋)=𝑛𝑝=10× =5 et V(𝑋)=𝑛𝑝(1-p)=10× × =2,5 2 2 2 La probabilité d’obtenir exactement 8 fois piles est donc égale à 8 1 8 1 2 𝑃(𝑋=8)=𝐶10 ×( ) ×( ) =0,044 2 2 Sara GOTTI SEG S3, 2021-2022 14 Chapitre 2: Lois de probabilités Lois de probabilité continues Loi Normale La loi normale est la loi continue la plus importante et la plus utilisée dans le calcul de probabilité. Elle est aussi appelée loi de LAPLACE GAUSS. On appelle variable normale toute variable aléatoire continue X définie dans l'intervalle ]−∞,+∞[par la fonction de densité de probabilité suivante : 1 1 𝑥−𝜇 2 𝑓 𝑥 = 𝑒 2( 𝜎 ) 𝜎 2𝜋 Sara GOTTI SEG S3, 2021-2022 15 Chapitre 2: Lois de probabilités Lois de probabilité continues Loi Normale 𝜇 et 𝜎 sont des paramètres quelconques qui représentent respectivement la moyenne (ou espérance) et l'écart type de la variable. L’aire totale sur la courbe de la fonction densité (délimitée par la courbe de la fonction et l’axe des X) est égale à 1. La loi normale dépend de deux paramètres 𝜇 et 𝜎. Une variable aléatoire X qui suit une loi normale de paramètres 𝜇 et 𝜎 est notée comme suit: 𝑋 ↝ 𝑁(𝜇, 𝜎²) Sara GOTTI SEG S3, 2021-2022 16 Chapitre 2: Lois de probabilités Lois de probabilité continues Loi Normale La courbe de la loi Normale possède la forme en «CLOCHE» La distribution normale est symétrique par rapport à la droite verticale: x=μ Points d’inflexion sont situés à une distance 𝜎 de cet axe de symétrie. f atteint son maximum lorsque x=μ il est difficile de calculer sa fonction de répartition f(x). Pour tous les calculs, on se ramène à la fonction de répartition de la loi normale centrée réduite (une loi TABULÉE). Sara GOTTI SEG S3, 2021-2022 17 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite La loi normale centrée réduite est le cas particulier de la loi normale générale. On appelle variable normale réduite toute variable aléatoire normale Z de paramètres 𝜇 = 0 et 𝜎 = 1. Elle est notée comme suit: 𝑋 ↝ Ν(0,1) La loi normale centrée réduite est la loi de probabilité absolument continue dont la densité de probabilité est donnée par la fonction: 1 𝑥2 − 𝑓 𝑥 = 𝑒 2 2𝜋 Sara GOTTI SEG S3, 2021-2022 18 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite En particulier la loi normale réduite est symétrique par rapport à l'axe des abscisses (x=0) et caractérisée par l'existence d'un maximum en 1 z = 0 et f(z) = ≈ 0,40. 2𝜋 La fonction de répartition correspond à l'aire comprise entre cette courbe et l'axe des abscisses. Sara GOTTI SEG S3, 2021-2022 19 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Pour le calcul de probabilités sans utiliser la fonction de densité, la table de la loi normale centrés réduite a été élaborée. En raison de la symétrie de la distribution, ces tables sont limitées aux valeurs positives de z. 𝑋−𝜇 Par le changement de variable Z= la variable normale X se 𝜎 ramènent à la loi normale centrée réduite. Sara GOTTI SEG S3, 2021-2022 20 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite F(X) 𝐹 1,96 = 𝑃 𝑋 < 1,96 = 0,975 1 2𝜋 0 1,96 X Sara GOTTI SEG S3, 2021-2022 21 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Pour une variable normale quelconque X de paramètres 𝜇 et 𝜎: X−𝜇 a−𝜇 a−𝜇 P(X≤a) = f(a) = P( ≤ ) = P(Z ≤ ) = P(Z ≤t)=𝜋(𝑡) 𝜎 𝜎 𝜎 a−𝜇 avec t= 𝜎 Pour lire une valeur 𝜋(𝑡) dans la table, il suffit de lire l'intersection entre la ligne correspondante à la valeur de t et la colonne correspondante au deuxième chiffre après la virgule de t. La valeur de P(Z ≤1,29) (ou 𝜋(1,29)) correspond à l’intersection entre la ligne correspondante à 1,2 et la colonne correspondante à 0,09, on peut lire la valeur 0,9015. Sara GOTTI SEG S3, 2021-2022 22 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Sara GOTTI SEG S3, 2021-2022 23 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite La loi Normale centrée réduite est symétrique, c. à. d pour tout t ∈ ℝ: P(X≤ 𝑡) = P(X≥ −𝑡) 1 En particulier P(X≤0) = P(X≥0) = 2 On peut aussi écrire que: P(X≤ 𝑡) = 1− P(X≥ 𝑡) = 1− P(X≤ −𝑡) P(a≤X≤ 𝑏) = 1−P(X≤a)−P(X≥b) = P(X≤ b)−P(X≤a) Sara GOTTI SEG S3, 2021-2022 24 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Dans une table statistique de la loi centrée réduite, on ne peut lire que P(X≤x) pour (x≥0). Comment calculer par exemple P(X≥ −1,87) et P(X≤ −0,93) ? Il suffit d'appliquer la remarque précédente et utiliser la table statistique : D'une part: P(X≥ −1,87) = P(X≤1,87) = 0,9693 D'autre part: P(X≤ −0,93) = P(X≥0,93) = 1− P(X≤0,93) = 1−0,8238= 0,1762 Sara GOTTI SEG S3, 2021-2022 25 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Exemple: Pour qu'une pièce fabriquée par une machine soit utilisable, sa longueur doit être comprise entre 14,7 et 15,3 cm, sinon elle est rejetée. Sachant que la longueur de cette pièce est une variable normale de moyenne 𝜇 =15 cm et d’ecart-type 𝜎 =0,2 cm. Quelle est la probabilité de pièces pouvant être rejetées? Si on désigne par la variable X la longueur des pièces, X suit une loi normale : 𝑋 ↝ Ν(15; 0,2) La probabilité de rejet d'une pièce est : P(rejet) = 1 − P(acceptation) Et la probabilité d’acceptation est: P(acceptation)= P(14,7 ≤ X ≤ 15,3) Sara GOTTI SEG S3, 2021-2022 26 Chapitre 2: Lois de probabilités Lois de probabilité continues La loi normale centrée réduite Exemple: 14,7−μ X−μ 15,3−μ 14,7−15 X−μ 15,3−15 P(14,7 ≤ X ≤ 15,3) = P( ≤ ≤ ) = P( ≤ ≤ ) 𝜎 𝜎 𝜎 0,2 𝜎 0,2 X−15 On pose Z= , alors Z ↝ Ν(0; 1) 0,2 14,7−15 15,3−15 P(14,7 ≤ X ≤ 15,3) = P( ≤𝑍≤ ) 0,2 0,2 15,3−15 14,7−15 = P(𝑍 ≤ ) − P(𝑍 ≤ ) 0,2 0,2 = P(𝑍 ≤ 1,5) − P(𝑍 ≤ −1,5) = P(𝑍 ≤ 1,5) −(1− P(𝑍 ≤ −1,5)) = 2 × P(𝑍 ≤ 1,5)−1 = 2 × 0,9332 −1 = 0,8664 P(rejet) = 1 − 0,8664 = 0,1336 Il y a un risque de rejet de 13,36% des pièces fabriquées. Sara GOTTI SEG S3, 2021-2022 27 Chapitre 2: Lois de probabilités Lois de probabilité continues Approximation de la loi binomiale par la loi normale Parfois les problèmes relatifs à la loi binomiale se rapportent aux calculs de probabilités dans un ou plusieurs intervalles donnés : p(X < x) p(X > x) ou p(xl < X < x2 ) La recherche de ces probabilités est souvent longue, car il faut déterminer individuellement et d'additionner les différentes probabilités p(X = x). Ex: p(X < 10) = p(0)+p(1)+p(2)+p(3)+p(4)+p(5)+p(6)+p(7)+p(8)+p(9) On peut effectuer ce calcul d'une manière approchée à l'aide de la loi normale de paramètres 𝜇 =np et σ = 𝑛𝑝𝑞. On écrit alors: 𝑋 ↝ 𝐵 𝑛, 𝑝 ≈ 𝑋 ↝ 𝑁 𝑛𝑝, 𝑛𝑝𝑞. Sara GOTTI SEG S3, 2021-2022 28 Chapitre 2: Lois de probabilités Lois de probabilité continues Approximation de la loi binomiale par la loi normale Trois conditions à vérifier avant d’approximer une loi binomiale 𝑋↝𝐵(𝑛,𝑝) par une loi normale 𝑋↝𝑁(𝑛𝑝, 𝑛𝑝𝑞): ✓La taille de l’échantillon ou le nombre de fois de répétitions n doit être supérieur ou égale à 30 c- à-d 𝑛≥30 ✓La probabilité relative à la survenance d’évènement p multipliée par n doit être supérieure ou égale à 5 c-à-d n𝑝≥5 ✓La probabilité relative à la non survenance d’évènement q multipliée par n doit être supérieure ou égale à 5 c-à-d n𝑞≥5 Autrement dit : Si 𝑛≥30 𝑒𝑡 𝑛𝑝≥5 𝑒𝑡 n𝑞≥5 Sara GOTTI SEG S3, 2021-2022 29 Chapitre 2: Lois de probabilités Lois de probabilité continues Approximation de la loi binomiale par la loi normale Exemple: On suppose que la probabilité qu'un étudiant réussisse un examen est de 0,8. Quelle est la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen ? Désignons par X le nombre d'étudiants qui réussissent l'examen. X est une variable discrète qui prend les valeurs entières de 0 à 100. Elle suit une loi binomiale de paramètres 100 et 0,8. X ↝ B(100 ; 0,8) La probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen est : p(X≥75) Les produits np et nq sont respectivement 100x0,8 = 80 et 100x0,2 = 20, ils sont supérieurs à 5. Sara GOTTI SEG S3, 2021-2022 30 Chapitre 2: Lois de probabilités Lois de probabilité continues Approximation de la loi binomiale par la loi normale Exemple: On peut donc effectuer le calcul de cette probabilité d'une manière approchée à l'aide de la loi normale de paramètres np = 80 et 𝜎 = 𝑛𝑝𝑞 = 4. X ↝ B(100 ; 0,8)≈ N(80 ; 4) X−80 On pose Z= , alors Z ↝ Ν(0; 1) 4 X−80 75−80 p(X≥75) = p( ≥ ) = p(𝑍 ≥ −1,25) 4 4 = 1 − p(𝑍 ≤ −1,25) = 1 − (1 − p(𝑍 ≤ 1,25) ) = p(𝑍 ≤ 1,25) = 0,8944 la probabilité qu'au moins 75 étudiants parmi 100 étudiants réussissent l'examen est de 0,8944. Sara GOTTI SEG S3, 2021-2022 31 CHAPITRE 3 Théorie d’échantillonnage ✓Introduction ✓Définitions ✓Méthodes d’échantillonnage ✓Distributions d’échantillonnage Sara GOTTI SEG S3, 2021-2022 32 Chapitre 3: Théorie d’échantillonnage Introduction Pour collecter les informations sur une population, deux possibilités s'offrent : ❑L’enquête complète: (enquête exhaustive) elle consiste à observer ou interroger tous les éléments de la population. ❑L’enquête partielle: (sondage) elle consiste à observer ou interroger une partie de la population. Les éléments de la population qui sont réellement observés constituent l'échantillon et l'opération qui consiste à choisir ces éléments est appelée échantillonnage. L’échantillonnage a pour but d’étudier des propriétés caractéristiques d’une population quand on ne dispose pas encore de données. Il nécessite d’examiner et d’observer une partie de la population. Sara GOTTI SEG S3, 2021-2022 33 Chapitre 3: Théorie d’échantillonnage Introduction L’échantillonnage offre une série d'avantages: ✓ Le coût global de l'enquête partielle (l’échantillonnage) est en général plus réduit que le coût global d'une enquête complète. ✓L'enquête partielle est plus rapide que l'enquête complète, surtout lorsque la caractéristique étudiée présente des modifications assez importantes au cours du temps. ✓Les erreurs d'observations dans l'enquête partielle sont plus réduites que dans l'enquête complète. Sara GOTTI SEG S3, 2021-2022 34 Chapitre 3: Théorie d’échantillonnage Définitions Enquête: ensemble d’opérations de collecte et de traitement de données relatives à quelques domaines. Population: ensemble des unités statistiques (personnes ou objets) aux quelles on s'intéresse et sur lesquelles porte une étude. Et on appelle individu chaque élément (entité) de cette population pour lequel des données sont collectées. Paramètres de la population: Ce sont les paramètres observés de la population statistique: Moyenne de la population (μ); Ecart-type de la population (σ); Proportion de la population (P) La taille de la population (N): est le nombre d’unités de la population. Sara GOTTI SEG S3, 2021-2022 35 Chapitre 3: Théorie d’échantillonnage Définitions Unité de base: unité d'échantillonnage ou unité de sondage, c'est l'élément pris en considération dans l'enquête. Recensement: Enquête complète ou enquête exhaustive, c'est une enquête au cours de laquelle toutes les unités de base de la population sont observées. Sondage: Enquête incomplète, enquête partielle ou enquête par échantillonnage, c'est une enquête au cours de laquelle seulement une partie des unités de base de la population sont observée. Echantillonnage: ensembles des opérations permettant de sélectionner de façon organisée les éléments de l’échantillon. Erreur d’échantillonnage: écart entre les résultats obtenus auprès d’un échantillon et ce que nous apprendrait un recensement comparable de la population. Plus la taille de l’échantillon est grande plus l’erreur d’échantillonnage diminue. Sara GOTTI SEG S3, 2021-2022 36 Chapitre 3: Théorie d’échantillonnage Définitions Echantillon: une partie (sous ensemble) représentative de la population statistique observée. La population d’où on tire l’échantillon s’appelle «population mère» ou «population échantillonnée». Paramètres de l’échantillon: Ce sont les caractéristiques statistiques calculées de l’échantillon: ത Moyenne de l’échantillon (𝑋); Ecart-type de l’échantillon (s); Proportion de l’échantillon (f) La taille de l’échantillon (n): est le nombre d'unités de l’échantillon. Sara GOTTI SEG S3, 2021-2022 37 Chapitre 3: Théorie d’échantillonnage Définitions Exemple 1: Les membres d’un parti politique marocain sont supposés soutenir un candidat particulier aux élections du parlement, et les responsables du parti voudraient estimer la proportion d’électeurs favorables à leur candidat. Un échantillon de 400 électeurs a été sélectionné et 160 de ces électeurs ont indiqué être favorables au candidat. Une estimation de la proportion d’électeurs favorables au candidat est donc 160 sur 400 soit 0,40. Sara GOTTI SEG S3, 2021-2022 38 Chapitre 3: Théorie d’échantillonnage Définitions Exemple 2: Un fabriquant de pneu a conçu un nouveau type de pneu permettant d’accroitre le kilométrage effectué. Pour estimer le nombre moyen de kilomètres effectués avec les nouveaux pneus, le fabricant a sélectionné un échantillon de 120 nouveaux pneus, dans le but de les tester. D’après les résultats du test, la moyenne de l’échantillon est égale a 36500 kilomètres. Par conséquent, une estimation du kilométrage moyen pour la population des nouveaux pneus est de 36500 kilomètres. Sara GOTTI SEG S3, 2021-2022 39 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage Pour que les résultats d'une enquête par sondage puissent être généralisés à l'ensemble de la population faisant l'objet de l'étude, il est indispensable que cette enquête soit conduite selon des règles bien définies et que les calculs conduisant à ces synthèses soient conformes à la procédure d'échantillonnage utilisée. L'échantillon choisi doit être le plus représentatif possible de la population étudiée. Avec des méthodes d’échantillonnage adéquates, les résultats de l’échantillons fournissent de «bonnes» estimations des paramètres de la population (une moyenne d’échantillon fournit une estimation de la moyenne de la population, une proportion d’échantillon fournit une estimation de la proportion de la population) Sara GOTTI SEG S3, 2021-2022 40 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage Méthode d’échantillonnage (ou de sondage) : Procédure par laquelle on choisit dans une population un sous-groupe représentatif. ✓Objectif : avoir un échantillon suffisamment représentatif pour que les données puissent être affectées à la population. Sara GOTTI SEG S3, 2021-2022 41 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires Un échantillon aléatoire fournit un échantillon représentatif dont chaque individu de la population a une probabilité connue et non nulle d’être inclus dans l’échantillon. Sara GOTTI SEG S3, 2021-2022 42 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires a. Echantillonnage aléatoire simple Il consiste simplement à choisir des individus au hasard parmi ceux de la base de sondage (liste des individus à partir de laquelle on prélève un échantillon par exemple l'annuaire téléphonique). Les étapes sont les suivantes : Numéroter les unités statistiques de 1 à n. Tirer au hasard des unités statistiques de la population qui feront partie de l'échantillon. Sara GOTTI SEG S3, 2021-2022 43 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires b. Echantillonnage systématique C'est une technique où les unités statistiques sont choisis à intervalle régulier dans la base de sondage. Les étapes de cette technique sont les suivantes : 1. Numéroter les unités statistiques de 1 à N. 2. Calculer l'intervalle de sélection que l'on appelle aussi le pas de sondage. On le calcule en divisant la taille totale de la population N observée par la taille de l'échantillon recherchée k =. n 3. Tirer au hasard une unité statistique entre la première et la kème unité. Par exemple la ième unité avec 1 ≤i ≤k. 4. 4 Pour compléter l'échantillon, on choisit la (i + k) ème unité, et la (i + 2k)ème.....jusqu’à (i + (n−1)k)ème. On constitue ainsi un Sara GOTTI échantillon de taille (n-1+1=n) SEG S3, unités. 2021-2022 44 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires b. Echantillonnage systématique Exemple: On veut sélectionner un échantillon de 30 entreprises au sein d'une population de 1800 entreprises. 1800 K= = 30 60 Ainsi on va tirer une entreprise toutes les 60 en partant d'un nombre tiré aléatoirement entre 1 et 60. Supposons ce nombre est le 15. On va donc sélectionner la 15 ème entreprise puis la 75 ème , la 135 ème jusqu'à la 1755ème ce qui nous donnera l'échantillon de 30 entreprises. Sara GOTTI SEG S3, 2021-2022 45 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires c. Echantillonnage par grappe Il consiste à choisir des groupes (toute une grappe de raisin) plutôt que de choisir des unités statistiques isolées (un seul raisin). Une grappe est un sous-ensemble non homogènes de la population défini selon la proximité (par exemple un groupe d’élèves faisant partie de la même classe, des habitants du même immeuble, des habitants du même quartier ou même des équipes sportives d'une ligue amateur). Il est plus facile de faire une liste des groupes et de choisir au hasard parmi ces dizaines de groupes et d'interroger toutes les unités statistiques du groupe. Sara GOTTI SEG S3, 2021-2022 46 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires c. Echantillonnage par grappe Cette méthode permet de sauver beaucoup de temps en déplacement. Les étapes de cette techniques sont : 1. Diviser la population en grappes. 2. Choisir de façon aléatoire simple un certain nombre de grappes. 3. L'échantillon sera alors composé de toutes les unités statistiques appartenant aux grappes choisies. la méthode peut entrainer des résultats imprécis (moins précis que les méthodes précédentes) puisque les unités voisines ont tendance de se rassembler. De plus elle ne permet pas de contrôler la taille finale de l’échantillon. Sara GOTTI SEG S3, 2021-2022 47 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires d. Echantillonnage stratifié L'échantillonnage stratifié est une technique qui consiste à subdiviser une population hétérogène en sous groupes plus homogènes selon un critère ( Caractère qualitatif ou quantitatif: des étudiants par leur sexe, âge ou diplôme préparé, des entreprises par chiffre d’affaires ou secteur d'activités …) lié à la nature et aux objectifs de l'étude. Ces différents groupes sont appelés des strates. Les strates sont des sous-ensembles de la population ayant des caractéristiques communes. Sara GOTTI SEG S3, 2021-2022 48 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires d. Echantillonnage stratifié Pour la répartition de l’effectif n, de l’échantillon dans les différentes strates, la solution proportionnelle consiste à conserver la même fraction de sondage dans chacune des strates. Désignons par 𝑤𝑖 le poids de la strate et par 𝑓 la fraction de sondage constante: 𝑛 𝑁𝑖 𝑓= 𝑤𝑖 = 𝑁 𝑁 Le nombre d’unités à choisir dans chacune des strates est donc: 𝑛𝑖 = 𝑓 × 𝑁𝑖 = 𝑤𝑖 × 𝑛 Sara GOTTI SEG S3, 2021-2022 49 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages aléatoires d. Echantillonnage stratifié Exemple: Dans une population de 10000 entreprises, reparties en 5000 petites entreprises, 3000 moyenne entreprises et 2000 grandes entreprises, on souhaite avoir un échantillon de 500 entreprises. 500 Fraction de sondage constante: 𝑓 = = 0,05 10000 Strate Effectif de la strate (𝑁𝑖 ) Taille de l’échantillon Petite 5000 5000 × 0,05 = 250 Moyenne 3000 3000 × 0,05 = 150 Grande 2000 2000 × 0,05 = 200 Total 10000 500 Sara GOTTI SEG S3, 2021-2022 50 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages non aléatoires On parle d’un échantillon non aléatoire (ou empirique ou par choix raisonné) lorsque l’échantillon est construit par des procédés comportant une part d’arbitraire et ne permettant pas l’évaluation de la précision d’estimation. Ces méthodes sont beaucoup moins coûteuses, plus rapides et plus simples. Il est par contre, peu recommandé de généraliser les résultats provenant de ces méthodes à l'ensemble de la population, puisque toutes les unités statistiques n'ont pas la même chance d'être choisi ce qui influence la représentativité de l'échantillon. On peut citer deux exemples de ce type d'échantillonnage : a. échantillonnage à l'aveuglette b. échantillonnage au volontariat Sara GOTTI SEG S3, 2021-2022 51 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages non aléatoires a. Echantillonnage à l'aveuglette L'échantillonnage à l'aveuglette est une technique simple et peu coûteuse. Cet échantillonnage n'est pas normalement représentatif de la population cible, parce qu'on ne sélectionne des unités d'échantillonnage dans son cas que si on peut y avoir facilement et commodément accès. Les reporters des stations de télévision sont, en outre, souvent à la recherche de soi-disant « interviews de gens de la rue » pour déterminer comment la population perçoit un enjeu ou une question. Sara GOTTI SEG S3, 2021-2022 52 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage 1. Echantillonnages non aléatoires b. Echantillonnage au volontariat C'est une des méthodes les plus utilisées actuellement sur le marché des médicaments. Les compagnies pharmaceutiques sont les pionniers en la matière. Les unités statistiques décident de faire partie de l'étude de leur propre gré. Sara GOTTI SEG S3, 2021-2022 53 Chapitre 3: Théorie d’échantillonnage Méthodes d’échantillonnage Toutes les méthodes d’échantillonnage peuvent être combinées. La complexité de la procédure d’échantillonnage entraine une complexité des calculs. Il n’y a pas un critère standard de choix: appel au bon sens et à l’expérience. Cependant, il est recommandé d’utiliser les méthodes aléatoires au détriment des méthodes non aléatoires, car des formules permettent d’évaluer la qualité des estimations des caractéristiques de la population, fournies par les résultats de l’échantillon. Sara GOTTI SEG S3, 2021-2022 54 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Dans toute la suite, on traite le cas de l’échantillonnage aléatoire simple. Les concepts fondamentaux et les formules importantes découlent de cette méthode. Sara GOTTI SEG S3, 2021-2022 55 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Modélisation d'échantillonnage aléatoire simple L'échantillonnage simple consiste à extraire un échantillon de taille n dans une population de taille N par des tirages aléatoires équiprobables et indépendants (tirages avec remise). Ω = {𝜔1 , 𝜔2 , … , 𝜔𝑛 }: la population constituée d'éléments appelés unités d'observation. X: le caractère que l'on voudrait étudier sur l'ensemble de cette population. Xk : le résultat aléatoire du kème tirage est une V.A qui suit la même loi que X. (𝑋1 , … , 𝑋𝑛 ) : les résultats aléatoires des n tirages modélisant l'échantillon étudié. Sara GOTTI SEG S3, 2021-2022 56 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Modélisation d'échantillonnage aléatoire simple 𝑋1 , … , 𝑋𝑛 sont n V.A. indépendantes et de même loi (celle de X) ; il est appelé n-échantillon ou échantillon de taille n de X. Une réalisation (𝑥1 , … , 𝑥𝑛 ) de l'échantillon (𝑋1 , … , 𝑋𝑛 ) est l'ensemble des valeurs observées. Une statistique Y sur un échantillon (𝑋1 , … , 𝑋𝑛 ) est une V.A., fonction mesurable des 𝑋𝑘 : Y = 𝜑(𝑋1 , … , 𝑋𝑛 ) Après réalisation, la statistique Y prend la valeur 𝜑(𝑥1 , … , 𝑥𝑛 ) Exemple de valeur statistique: la moyenne empirique. Sara GOTTI SEG S3, 2021-2022 57 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Modélisation d'échantillonnage aléatoire simple En supposant que l'échantillon est aléatoire et simple, la variable aléatoire X possède une distribution de probabilité, dite distribution d 'échantillonnage. On peut donc calculer l'espérance E(X) (la moyenne) et l’écart-type 𝜎(X) de cette distribution. La distribution d'échantillonnage est donc la distribution des différentes valeurs que peut prendre la variable aléatoire X, pour les différents échantillons possibles. Son écart type 𝜎𝑡 est appelé erreur standard. Les principales distributions d'échantillonnage sont la distribution d'échantillonnage de la moyenne, la distribution d'échantillonnage de l’écart-type et la distribution d'échantillonnage de la proportion. Sara GOTTI SEG S3, 2021-2022 58 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Supposons que dans une population infinie quelconque, on ait prélevé au hasard un premier échantillon de n observations : 𝑥1 , 𝑥2 , 𝑥3 , … , 𝑥𝑛 σ𝑛 𝑖=1 𝑥𝑖 et qu'on ait calculé la moyenne : 𝑥ҧ = 𝑛 Si on prélève, dans les mêmes conditions, un deuxième échantillon de même effectif : 𝑥1′ , 𝑥2′ , 𝑥3′ , … , 𝑥𝑛′ σ 𝑛 ′ 𝑥 La moyenne correspondante 𝑥ഥ′ = 𝑖=1 𝑖 sera généralement différente 𝑛 de la première moyenne observée. Il en sera de même pour les moyennes d’autres échantillons prélevés dans les mêmes conditions. σ 𝑛 ′′ 𝑥 𝑖=1 𝑖 𝑥1′′ , 𝑥2′′ , 𝑥3′′ , … , 𝑥𝑛′′ 𝑥 ′′ = 𝑛 Sara GOTTI SEG S3, 2021-2022 59 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne On peut considérer la suite des premières observations 𝑥1 , 𝑥1′ , 𝑥1′′ ,... des différents échantillons comme des valeurs observées d'une même variable aléatoire 𝑋1 , la suite des deuxièmes observations des différents échantillons comme des valeurs observées d'une même variable aléatoire 𝑋2 , etc. Les moyennes observées 𝑥,ҧ 𝑥ഥ′ , 𝑥 ′′ ,... sont alors des valeurs observées d'une même variable aléatoire X ഥ qui est fonction de 𝑋1 , 𝑋2 , …, 𝑋𝑛. 𝑛 σ𝑖=1 𝑋𝑖 𝑋ത = 𝑛 Sara GOTTI SEG S3, 2021-2022 60 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Comme 𝑋1 , 𝑋2 , …, 𝑋𝑛 , la variable aléatoire X possède une distribution de probabilité, dite distribution d'échantillonnage de la moyenne. On peut donc calculer la moyenne et l’écart-type de cette distribution, en supposant que l'échantillon est aléatoire et simple, les variables aléatoires 𝑋1 , 𝑋2 , …, 𝑋𝑛 ont toutes la même distribution de probabilité, dont la moyenne est désignée par 𝜇 (la moyenne de la population) et l’écart-type par 𝜎 (l’écart-type de la population). Sara GOTTI SEG S3, 2021-2022 61 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne On a E(𝑋𝑖 ) = 𝜇 On démontre alors que la moyenne de la distribution de la moyenne est: σ𝑛 𝑖=1 𝑋𝑖 1 1 𝜇𝑋ത = E( ) = × σ𝑛𝑖=1 𝐸(𝑋𝑖 ) = ×𝑛×𝜇 =𝜇 𝑛 𝑛 𝑛 Donc: 𝜇𝑋ത = 𝜇 Sara GOTTI SEG S3, 2021-2022 62 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne On a 𝑉(𝑋𝑖 )=𝜎 2 L’écart-type de la distribution de la moyenne est: σ𝑛 𝑖=1 𝑋𝑖 𝜎𝑋ത = ത 𝑉(𝑋)= V( ) 𝑛 1 = × σ𝑛𝑖=1 𝑉(𝑋𝑖 ) 𝑛2 1 𝜎2 = × 𝑛 × 𝜎2 = 𝑛2 𝑛 Donc: 𝜎 𝜎𝑋ത = 𝑛 Sara GOTTI SEG S3, 2021-2022 63 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Dans le cas d'une population finie d'effectif N, au sein de laquelle est prélevé, sans remise, un échantillon aléatoire est simple d'effectif n, l’écart-type de la distribution de la moyenne est : 𝜎 𝑁−𝑛 𝜎𝑋ത = 𝑛 𝑁−1 𝑁−𝑛 Avec est le coefficient d’exhaustivité. 𝑁−1 Sara GOTTI SEG S3, 2021-2022 64 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Loi de la distribution d’échantillonnage de la moyenne La loi de 𝑋ത dépend de: ✓La loi de la population (Normale ou quelconque) ✓la taille de l'échantillon (n petite ou grande) La distribution d’échantillonnage de la moyenne est donnée par : 𝜎 ത ❑Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋 ↝ 𝑁 𝜇; 𝑛 ❑Si la loi de X est quelconque avec la taille de l’échantillon n≥30, par le théorème central limite, 𝑋ത suit approximativement 𝜎 une loi normale 𝑁 𝜇; 𝑛 Sara GOTTI SEG S3, 2021-2022 65 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 1: Prenons la population P{1, 2, 3}. On prélève des échantillons de taille n=2. On considère cette population infinie (on effectue des tirages successives avec remise pour construire les échantillons). La moyenne de la population 𝜇? 1+2+3 6 𝜇= = =2 3 3 L’écart-type de la population 𝜎? σ 𝑥𝑖 2 𝜎= − 𝑋ത 2 𝑎𝑣𝑒𝑐 𝑋= ത 𝜇 𝑛 1+4+9 2 𝜎= − 22 = 3 3 Sara GOTTI SEG S3, 2021-2022 66 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 1: (suite) Tous les échantillons possibles sont: 11 12 13 21 22 23 31 32 33 1+1 1+2 1+3 𝑋11 = = 1 ; 𝑋12 = = 1,5 ; 𝑋13 = =2 2 2 2 2+1 2+2 2+3 𝑋21 = = 1,5 ; 𝑋22 = = 2 ; 𝑋23 = = 2,5 2 2 2 3+1 3+2 3+3 𝑋31 = = 2 ; 𝑋32 = = 2,5 ; 𝑋33 = =3 2 2 2 Sara GOTTI SEG S3, 2021-2022 67 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 1: (suite) Nous somme face à une distribution d’échantillonnage de moyenne. σ 𝑋𝑖 1+1,5+2+1,5+2+2,5+2+2,5+3 La moyenne 𝜇𝑥ҧ = = =2=μ 𝑛 9 σ 𝑋𝑖 2 39 1 L’écart-type 𝜎𝑋ത = − 𝜇𝑥ҧ = 2 −4= 𝑛 9 3 2 2 𝜎 3 1 On a trouvé 𝜎 = alors = = = 𝜎𝑋ത 3 𝑛 2 3 Sara GOTTI SEG S3, 2021-2022 68 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 2: Une machine fabrique des rondelles d’un diamètre moyen 𝜇 = 20 𝑚𝑚 et d’écart-type 𝜎 = 2 𝑚𝑚. On suppose que la production est très importante (c-à-d. la population est infinie). On prélève un échantillon de 100 pièces. Quelle est la loi de probabilité de la moyenne des diamètres de ces 100 pièces? Quelle est la probabilité que la moyenne des diamètres de l’échantillon soit inferieure à 20,4? Quelle est la probabilité que cette moyenne soit comprise entre 19,8 et 20,2? Sara GOTTI SEG S3, 2021-2022 69 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 2: (suite) La moyenne de la distribution d’échantillonnage de la moyenne des diamètres est 𝜇𝑋ത = 𝜇 = 20 L’écart-type de la distribution 𝜎 2 d’échantillonnage de la moyenne des diamètres est 𝜎𝑋ത = = = 0,2 𝑛 100 La loi de probabilité de la moyenne des diamètres de ces 100 pièces? ത Examinons la situation. On cherche la loi suivie par 𝑋. La taille de l’échantillon est: n = 100. Nous sommes en présence d’un échantillon (n>30). Donc 𝑋ത suit une loi normale 𝜎 ത 𝑋 ↝ 𝑁 𝜇; = 𝑁(20, 0,2). 𝑛 𝑋ത −20 On en déduit que Z = suit 𝑁(0, 1). 0,2 Sara GOTTI SEG S3, 2021-2022 70 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 2: (suite) La probabilité que la moyenne des diamètres de l’échantillon soit inferieure à 20,4? On cherche à déterminer P(𝑋ത ≤ 20,4). 𝑋ത −20 On a 𝑋ത ↝ 𝑁 20; 0,2. On en déduit que Z = suit 𝑁(0, 1). 0,2 𝑋ത −20 20,4 −20 P(𝑋ത ≤ 20,4)=P( ≤ ) 0,2 0,2 =P(Z≤2) =0,9772 Sara GOTTI SEG S3, 2021-2022 71 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la moyenne Exemple 2: (suite) La probabilité que cette moyenne soit comprise entre 19,8 et 20,2? On cherche à déterminer P(19,8 ≤ 𝑋ത ≤ 20,2). 19,8−20 𝑋ത −20 20,2 −20 P(19,8 ≤ 𝑋ത ≤ 20,2)=P( ≤ ≤ ) 0,2 0,2 0,2 =P(−1 ≤Z≤ 1) = 2×P(≤Z≤ 1)−1 = 2× 0,8413 − 1 =0,6826 Sara GOTTI SEG S3, 2021-2022 72 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Si on considère une population infinie et si on y prélève un échantillon aléatoire et simple d'effectif n, on désigne par X le nombre d'individus possédant, dans l'échantillon, le caractère étudié. 𝑋𝑛 𝑓𝑛 = est la fréquence ou proportion des individus 𝑛 possédant, dans l'échantillon, le caractère étudié. On désigne par 𝑝 la proportion des individus possédant, dans la population, le caractère étudié. Sara GOTTI SEG S3, 2021-2022 73 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion De la même manière que la moyenne, chacun des échantillons possède une fréquence : 𝑋𝑛 𝑋 𝑛′ 𝑋𝑛′′ 𝑓𝑛 = 𝑓𝑛 ′ = 𝑓𝑛′′ = 𝑛 𝑛 𝑛 Ces fréquences peuvent être considérées comme des valeurs observées d'une même variable aléatoire 𝐹𝑛 : 𝑋𝑛 𝐹𝑛 = 𝑛 La variable aléatoire 𝐹𝑛 possède une distribution de probabilité, dite distribution d'échantillonnage de la proportion. On peut donc calculer la moyenne et l’écart-type de cette distribution, en supposant que l'échantillon est aléatoire et simple. Sara GOTTI SEG S3, 2021-2022 74 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion On peut démontrer alors la moyenne de la distribution de la proportion: 𝑋𝑛 1 1 𝜇𝐹 = E( 𝑛 ) = × 𝐸 𝑋𝑛 = × 𝑛𝑝 = 𝑝 𝑛 𝑛 Donc: 𝜇𝐹 = 𝑝 Sara GOTTI SEG S3, 2021-2022 75 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion L’écart-type de la distribution de la proportion est: 𝑋𝑛 𝜎𝐹 = 𝑉(F)= V( ) 𝑛 1 = × 𝑉(𝑋𝑛 ) 𝑛2 1 𝑝𝑞 = × 𝑛 × 𝑝𝑞 = 𝑛2 𝑛 Donc: 𝑝𝑞 𝜎𝐹 = 𝑛 Sara GOTTI SEG S3, 2021-2022 76 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Dans le cas d'une population finie d'effectif N, au sein de laquelle est prélevé, sans remise, un échantillon aléatoire est simple d'effectif n, l’écart-type de la distribution de la proportion est : 𝑝𝑞 𝑁−𝑛 𝜎𝐹 = 𝑛 𝑁−1 𝑁−𝑛 Avec est le coefficient d’exhaustivité. 𝑁−1 Sara GOTTI SEG S3, 2021-2022 77 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Loi de la distribution d’échantillonnage de la proportion La loi de 𝐹 dépend de: ✓la taille de l'échantillon (n petite ou grande) La distribution d’échantillonnage de la moyenne est donnée par : ❑Si la taille de l’échantillon n≥30, le produit 𝑛𝑝 ≥ 5 et 𝑛𝑞 ≥ 5, par le théorème central limite, 𝐹 suit approximativement une loi 𝑝𝑞 normale 𝑁 𝑝; 𝑛 Sara GOTTI SEG S3, 2021-2022 78 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Exemple: Une machine fabrique des rondelles d’un diamètre moyen 𝜇 = 20 𝑚𝑚 et d’écart-type 𝜎 = 2 𝑚𝑚. On suppose que la production est très importante (c-à-d. la population est infinie). On trouve 8% des rondelles sont défectueuses. On prélève un échantillon de 100 pièces. Quelle est la loi de probabilité de la proportion des rondelles défectueuses de ces 100 pièces? Quelle est la probabilité que la proportion des rondelles défectueuses de l’échantillon dépasse 10%? Sara GOTTI SEG S3, 2021-2022 79 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Exemple: (suite) La moyenne de la distribution d’échantillonnage de la proportion des rondelles défectueuses est 𝜇𝐹 = 𝑝 = 0,08 L’écart-type de la distribution d’échantillonnage de la proportion des 𝑝𝑞 0,08×0,92 rondelles défectueuses est 𝜎𝐹 = = = 0,02713 𝑛 100 La loi de probabilité de la proportion des rondelles défectueuses de ces 100 pièces? On cherche la loi suivie par 𝐹. Examinons la situation. La taille de l’échantillon est: n = 100. Nous sommes en présence d’un échantillon (n>30), en plus 𝑛𝑝 = 100 × 0,08 = 8 > 5, 𝑒𝑡 𝑛𝑞 = 100 × 0,92 = 92 > 5. 𝑝𝑞 Donc 𝐹 suit une loi normale F ↝ 𝑁 𝑝; 𝑛 = 𝑁(0,08; 0,02713). Sara GOTTI SEG S3, 2021-2022 80 Chapitre 3: Théorie d’échantillonnage Distributions d’échantillonnage Distribution d'échantillonnage de la proportion Exemple: (suite) La probabilité que la proportion des rondelles défectueuses de l’échantillon dépasse 10%? On cherche à déterminer P(𝐹 ≥ 0,1). F −0,08 On aF ↝ 𝑁(0,08; 0,02713). On en déduit que Z = suit 0,02713 𝑁(0, 1). F−0,08 0,1 −0,08 P(𝐹 ≥ 0,1)=P( ≥ ) 0,02713 0,02713 =P(Z≥ 0,74) =1−P(Z≤ 0,74) =1−0,7704= 0,2296 Sara GOTTI SEG S3, 2021-2022 81 CHAPITRE 4 Estimation ✓Introduction ✓Estimation ponctuelle ✓Estimation par intervalle de confiance Sara GOTTI SEG S3, 2021-2022 82 Chapitre 4: Estimation Introduction Après avoir prélevé l’échantillon, et étudié les distributions d’échantillonnage, on peut alors généraliser, à la population, les résultats expérimentaux obtenus à partir de l’échantillon. L’estimation consiste en l’évaluation d’un paramètre de la population à partir des valeurs calculées sur les échantillons. Les paramètres à estimer sont: ❑ 𝜇 la moyenne de la population. ❑ 𝜎 l’écart type de la population. ❑ 𝑝 pour la proportion dans la population. La théorie de l’estimation se divise en deux parties: ❑L’estimation ponctuelle ❑L’estimation par intervalle de confiance Sara GOTTI SEG S3, 2021-2022 83 Chapitre 4: Estimation Estimation ponctuelle L’estimation ponctuelle ou l’estimation de point d’un paramètre est la connaissance de la seule valeur estimée de ce paramètre. Les paramètres recherchés sont: la moyenne, l’écart-type et la proportion de la population. Sara GOTTI SEG S3, 2021-2022 84 Chapitre 4: Estimation Estimation ponctuelle Généralités sur les estimateurs Un estimateur T = f (𝑋1 ; …; 𝑋𝑛 ) d'un paramètre 𝜃 est une statistique et sa réalisation f ( 𝑥1 ; …; 𝑥𝑛 ) sera appelée estimation ponctuelle de 𝜃. On appelle erreur d'estimation la différence entre l'estimateur et le paramètre : Erreur = T − 𝜃. Cette Erreur peut être décomposer de la façon suivante : Fluctuation autour de la moyenne 𝑇 − 𝜃 = 𝑇−𝐸 𝑇 + 𝐸 𝑇 −𝜃 Biais de l'estimateur Sara GOTTI SEG S3, 2021-2022 85 Chapitre 4: Estimation Estimation ponctuelle Généralités sur les estimateurs Un estimateur T de 𝜃 est dit sans biais si E(T) = 𝜃. Sinon, on dit que c'est un estimateur biaisé : ❑ Si le biais 𝐸(𝑇) − 𝜃 est positif, ( E(T) > 𝜃), alors l'estimateur surestime la valeur du paramètre. ❑ Si le biais 𝐸(𝑇) − 𝜃 est négatif, ( E(T) < 𝜃), alors l'estimateur sous-estime la valeur du paramètre. Un estimateur T de 𝜃 est dit asymptotiquement sans biais si 𝐸(𝑇) → 𝜃 quand 𝑛 → ∞. Sara GOTTI SEG S3, 2021-2022 86 Chapitre 4: Estimation Estimation ponctuelle Généralités sur les estimateurs Un estimateur T de 𝜃 est dit convergent si 𝑉𝑎𝑟 𝑇 → 0 quand 𝑛 → ∞. Soit T et 𝑇 ′ deux estimateurs sans biais de 𝜃. On dit que T est plus efficace que 𝑇 ′ si Var (T)≤Var (𝑇 ′ ). L'estimateur sans biais et de variance minimale est appelé estimateur efficace. Sara GOTTI SEG S3, 2021-2022 87 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une moyenne Soit X un caractère (une variable aléatoire) dont on veut estimer la moyenne 𝜇 à partir d'un échantillon (𝑋1 ; …; 𝑋𝑛 ) de même loi que X. La loi de X est inconnue. 𝑋1 + 𝑋2 + …+ 𝑋𝑛 La moyenne empirique 𝑿 ഥ= est un estimateur 𝑛 efficace de la moyenne 𝝁. Sara GOTTI SEG S3, 2021-2022 88 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une moyenne Justification: ഥ est o En fait, l'estimateur X ❑sans biais car E(X ഥ ) = 𝜇. Var (X) ❑convergeant car 𝑉𝑎𝑟 (X) = ഥ → 0; quand n tend 𝑛 vers ∞. o On peut montrer qu'il est de variance minimale. Sara GOTTI SEG S3, 2021-2022 89 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une moyenne Exemple: Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en dhs) 9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7 8,7 9,8 10,2 9,3 10,4 9,5 10,9 On suppose que la loi suivie par le salaire horaire est normale de moyenne 𝜇 et d’écart-type 𝜎. 1. Donner une estimation de 𝜇. Sara GOTTI SEG S3, 2021-2022 90 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une moyenne Exemple: (suite) Une estimation ponctuelle de la moyenne 𝜇: σ15 𝑖=1 𝑋𝑖 𝜇 = 𝑋ത = 15 9,8+8,6+9,7+10,2+8,9+10,1+9,9 +9,7 +8,7 +9,8+10,2 +9,3+10,4+9,5 +10,9 = 15 145,7 = 15 = 9,71 Sara GOTTI SEG S3, 2021-2022 91 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’un écart-type On considère maintenant l’estimation de la variance (écart-type) par la variance empirique de l’échantillon: 2 1 σ𝑛 ത 2 1 𝑛 σ 2 ത 2 𝑆 = (𝑋 − 𝑋) = 𝑋 − 𝑋 𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖 S est un estimateur de l’écart-type. Déterminons le biais de cet estimateur: 1 𝑛 2 1 𝑛 2 2 𝐸(𝑆 ) = 𝐸 σ 𝑋 − 𝑋ത 2 = σ 𝐸 𝑋 − 𝐸 𝑋ത 2 𝑛 𝑖=1 𝑖 𝑛 𝑖=1 𝑖 = 𝐸(𝑋 2 ) − 𝐸(𝑋ത 2 ) = 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋)2 − 𝑉𝑎𝑟(𝑋) ത − 𝐸(𝑋)ത 2 Var(X) = 𝑉𝑎𝑟(𝑋) + 𝐸(𝑋) − 2 ത 2 − 𝐸(𝑋) 𝑛 1 𝑛−1 2 = (1 − )𝑉𝑎𝑟(𝑋)= 𝜎 ≠ 𝜎2 𝑛 𝑛 Sara GOTTI SEG S3, 2021-2022 92 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’un écart-type Donc contrairement à ce qu’on pourrait croire, l’écart-type empirique S n’est pas un estimateur sans biais de 𝜎. Cet estimateur n’est qu’asymptotiquement sans biais. Pour corriger le biais on prend l'estimateur 2 𝑛 S′ = 𝑆2 𝑛−1 ′2 𝑛 2 𝑛 𝑛−1 2 On remarque que: E(S ) = 𝐸(𝑆 ) = × 𝜎 = 𝜎2 𝑛−1 𝑛−1 𝑛 Sara GOTTI SEG S3, 2021-2022 93 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’un écart-type La statistique ( la variance 𝑛 corrigée ): ′2 𝑛 1 S = 2 𝑆 = (𝑋𝑖 − 𝑋) ത 2 𝑛−1 𝑛−1 𝑖=1 𝑛 𝑆2est un estimateur efficace de la variance 𝜎 2 qui est sans biais et 𝑛−1 convergeant. 𝒏 Alors, 𝑺 × est un estimateur efficace de l’écart-type 𝝈 de la 𝒏−𝟏 population qui est sans biais et convergeant. L'écart-type estimé est noté 𝑆𝑐 et on l’appelle l’écart-type corrigé. 𝒏 𝑆𝑐 = 𝑺 × 𝒏−𝟏 Sara GOTTI SEG S3, 2021-2022 94 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’un écart-type Exemple: L'objet d'une enquête menée sur la région Larache-El Ksar El Kebir est d'étudier la variable X représentant la dépense moyenne de foyer. On choisit au hasard 100 foyers, les réalisation de l'échantillon permettent d’affirmer que 1 100 2 σ100 𝑖=1 𝑋𝑖 = 3007 𝑒𝑡 σ𝑖=1 𝑋𝑖 = 940,4 100 Donner une estimation de l’écart-type 𝜎 Sara GOTTI SEG S3, 2021-2022 95 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’un écart-type Exemple: (suite) Une estimation ponctuelle de l'écart-type σ: 𝑛 100 1 2 𝑆𝑐 = × 𝑆= × σ100 𝑋 − 𝑋ത 2 𝑛−1 99 100 𝑖=1 𝑖 100 1 2 σ100 𝑖=1 𝑋𝑖 2 = × σ100 𝑋 − ( ) 99 100 𝑖=1 𝑖 100 100 3007 2 = × 940,4 − ( ) 99 100 = 6,05 Sara GOTTI SEG S3, 2021-2022 96 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une proportion Soit une population ayant des individus possédant une certaine caractéristique A. On veut estimer à partir d'un échantillon de taille n la proportion d'individus possédant cette caractéristique A. Soit K la V.A qui représente le nombre d'individus dans l'échantillon possédant la caractéristique A. On rappelle que p est la proportion d'individus de la population possédant la modalité A. Sara GOTTI SEG S3, 2021-2022 97 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une proportion K En fait, f = est un estimateur sans biais car: n comme X1 ; X2 ; …; Xn sont des variables de Bernoulli, alors: E(X1)+E(X2 )+ …+E(Xn ) E(f)= 𝑛 𝑝+𝑝+ ……+𝑝 𝑛×𝑝 = = =𝑝 𝑛 𝑛 Sara GOTTI SEG S3, 2021-2022 98 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une proportion En plus f est un estimateur convergeant, car: Var(X1 )+Var(X2)+ …+Var(Xn) Var (f) = 2 𝑛 𝑝(1−𝑝)+𝑝(1−𝑝)+ ……+𝑝(1−𝑝) 𝑝(1−𝑝) = = 𝑛2 𝑛 alors 𝑉𝑎𝑟 (𝑓) → 0, quand 𝑛 → +∞. K Alors, la fréquence empirique f= est l'estimateur efficace x n de p. Sara GOTTI SEG S3, 2021-2022 99 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une proportion Exemple: On s'intéresse à la proportion p des étudiants ayant un Baccalauréat Sciences-économiques inscrit en première année à la FSJES de Kelaa des sraghna. On a prélevé indépendamment un échantillon de taille n=120. On constate que 48 étudiants de l’échantillon ont une un bac Sciences économiques. Donner une estimation ponctuelle de p. Sara GOTTI SEG S3, 2021-2022 100 Chapitre 4: Estimation Estimation ponctuelle Estimation ponctuelle d’une proportion Exemple: (Suite) Une estimation ponctuelle de la proportion p des étudiants ayant un Baccalauréat Sciences-économiques : 48 𝑝=𝑓= = 0,4 120 Sara GOTTI SEG S3, 2021-2022 101 Chapitre 4: Estimation Estimation par intervalle de confiance L'estimation d'un paramètre inconnu par une seule valeur est quelque fois insuffisante, on préfère souvent donner un intervalle de valeurs. On cherche des intervalles dit "intervalle de confiance" qui contiennent ❑ La moyenne 𝜇 inconnue ❑ La proportion p d'une certaine propriété que possède la population. Sara GOTTI SEG S3, 2021-2022 102 Chapitre 4: Estimation Estimation par intervalle de confiance L'estimation par intervalle de confiance consiste à déterminer autour de la valeur estimée un intervalle dont on a de fortes chances de croire qu'il contient la vraie valeur du paramètre recherché. Si on s'intéresse à un paramètre 𝜃, dont on possède un estimateur T, l'estimation par intervalle de confiance consiste à déterminer de part et d'autre de T les bornes T1 et T2 d'un intervalle qui a une forte probabilité de contenir 𝜃. Cette probabilité est appelée niveau de confiance 𝛽 et désignée par (𝛽 = 1 − 𝛼), avec 𝛼 est un risque d'erreur. Sara GOTTI SEG S3, 2021-2022 103 Chapitre 4: Estimation Estimation par intervalle de confiance Soit X une V.A. dont la loi dépend d'un paramètre inconnu 𝜃. On appelle intervalle de confiance de niveau de confiance 𝛽 (𝛽 = 1 − 𝛼 ou de seuil de risque 𝛼), un intervalle qui a la probabilité 𝛽 de contenir la vraie valeur de 𝜃. Autrement dit, [T1 ; T2 ] est intervalle de confiance pour un niveau 𝛽 du paramètre 𝜃 si: P(T1 ≤ 𝜃 ≤ T2 ) = 𝛽 = 1 − 𝛼 Sara GOTTI SEG S3, 2021-2022 104 Chapitre 4: Estimation Estimation par intervalle de confiance 𝛽(= 1 − 𝛼) est appelé le niveau de confiance, et 𝛼 est le seuil ou le risque. Plus le niveau de confiance est élevé, plus la certitude est grande que la méthode d'estimation produira une estimation contenant la vraie valeur de 𝜃. Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%. Une estimation par intervalle est souvent réalisée en ajoutant une marge d’erreur à l’estimation ponctuelle. Sara GOTTI SEG S3, 2021-2022 105 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne Soit X une variable aléatoire et (X1 ; X2 ; …; Xn ) un échantillon de X. On a vu que la moyenne X ഥ d'un échantillon aléatoire permet d'estimer la vraie moyenne de la population. On voudrait estimer également la précision de cette moyenne, c'est-à- dire donner une marge d'erreur ou un intervalle de confiance. On peut distinguer deux cas : 1. La taille de l'échantillon est petite (n < 30) et X ↝ 𝑁(𝜇; 𝜎): a. L’écart-type 𝜎 de la population est connu b. L’écart-type 𝜎 de la population est inconnu 2. La taille de l’échantillon est grande (n≥30) et X de loi quelconque. Sara GOTTI SEG S3, 2021-2022 106 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) 𝝈 de la population est connu : On se fixe le niveau de confiance 𝛽 (ou le risque 𝜑). On peut écrire donc que: 𝜎 ത Si X suit une loi normale 𝑁(𝜇; 𝜎), alors 𝑋↝𝑁(𝜇; ) √𝑛 𝑋ത −𝜇 On pose Z = 𝜎 suit 𝑁(0, 1) √𝑛 β+1 P(−𝑡β ≤ 𝑍 ≤ 𝑡β ) = β ⇒ 2×P(Z≤ 𝑡β )−1= β ⇒ P(Z≤ 𝑡β ) = 2 ⇒ on cherche dans la table de la loi normale centrée et réduite la valeur β+1 de 𝑡β par lecture inverse de. 2 Sara GOTTI SEG S3, 2021-2022 107 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) 𝝈 de la population est connu : P(−𝑡β ≤ 𝑍 ≤ 𝑡β )= β 𝑋ത −𝜇 =P(−𝑡β ≤ 𝜎 ≤ 𝑡β )= β √𝑛 𝜎 𝜎 =P(−𝑡β ≤ 𝑋ത −𝜇 ≤ 𝑡β )= β √𝑛 √𝑛 𝜎 𝜎 =P(−𝑡β − 𝑋ത ≤ −𝜇 ≤ 𝑡β − 𝑋)= ത β 𝑛 √𝑛 𝜎 𝜎 =P(𝑋ത − 𝑡β ≤𝜇 ≤ ത 𝑋 + 𝑡β )= β 𝑛 √𝑛 Sara GOTTI SEG S3, 2021-2022 108 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) 𝝈 de la population est connu : Conclusion : Si x est une réalisation de X, l'intervalle de confiance de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) est: 𝜎 𝜎 𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ] 𝑛 𝑛 En remplaçant 𝑋ത par sa valeur calculée sur l'échantillon, on obtient l'intervalle de confiance sur la moyenne 𝜇. 𝜎 La grandeur 𝑡β ajoutée à l’estimation ponctuelle 𝑋ത est appelée 𝑛 𝜎 la marge d’erreur notée 𝜀. On écrit: 𝜀 = 𝑡β 𝑛 Sara GOTTI SEG S3, 2021-2022 109 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) Exemple 1: Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en dhs) 9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7 8,7 9,8 10,2 9,3 10,4 9,5 10,9 On suppose que la loi suivie par le salaire horaire est normale de moyenne 𝜇 et d’écart-type 𝜎 = 1. 1. Estimer le salaire horaire moyen dans la population par un intervalle de confiance de niveau 95%. Sara GOTTI SEG S3, 2021-2022 110 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) Exemple 1: (suite) la moyenne de l’échantillon:𝑋ത = 9,71 L’écart-type 𝜎 = 1 l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est: 𝜎 𝜎 1 1 𝐼0,95 = [𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 ] = [9,71 − 𝑡0,95 ; 9,71 + 𝑡0,95 ] 𝑛 𝑛 15 15 Calculer 𝑡0,95 : β+1 0,95+1 On a P(Z≤ 𝑡β ) = alors P(Z≤ 𝑡0,95 ) = = 0,975 ⇒ 𝑡0,95 =1,96 2 2 1 1 𝐼0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ] 15 15 𝐼0,95 = [9,20; 10,22] Sara GOTTI SEG S3, 2021-2022 111 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) 𝝈 de la population est inconnu : 𝒏 L'écart type 𝜎 étant inconnu, on l'estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 𝒏−𝟏 L'intervalle de confiance de la moyenne 𝜇 de seuil ou de niveau 𝛽(= 1 − 𝛼) devient: 𝒏 𝒏 𝑺× 𝒏−𝟏 𝑺× 𝒏−𝟏 𝑆𝑐 𝑆𝑐 𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ]= [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ] 𝑛 𝑛 𝑛 𝑛 𝑺 𝑺 𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ] 𝑛−1 𝑛−1 𝑆𝑐 Avec la marge d’erreur 𝜀 = 𝑡β 𝑛 En remplaçant 𝑋ത et S par leurs valeurs calculées sur l'échantillon, on obtient l'intervalle de confiance sur la moyenne 𝜇. Sara GOTTI SEG S3, 2021-2022 112 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) Exemple 2: Afin d'étudier le salaire horaire des ouvriers d'un secteur d'activité, on prélève un échantillon aléatoire (X1 ; X2 ; …; X15 ) de réalisation (en dhs) 9,8 8,6 9,7 10,2 8,9 10,1 9,9 9,7 8,7 9,8 10,2 9,3 10,4 9,5 10,9 On suppose que la loi suivie par le salaire horaire est normale de moyenne 𝜇 et d’écart-type 𝜎. 1. Estimer le salaire horaire moyen dans la population par un intervalle de confiance de niveau 95%. Sara GOTTI SEG S3, 2021-2022 113 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 1. (n < 30) et X ↝𝑁(𝜇; 𝜎) Exemple 2: (suite) la moyenne de l’échantillon:𝑋ത = 9,71 𝒏 𝜎 est inconnu. On l’estime par son estimateur ponctuel 𝑆𝑐 = 𝑺 𝒏−𝟏 1 15 1 𝑆= σ𝑖=1 𝑋𝑖 2 − 𝑋ത 2 = × 1420,93 − (9,71)2 =0,67 15 15 l'intervalle de confiance de la moyenne 𝜇 de niveau 95% est: 𝑺 𝑺 0,67 0,67 𝐼0,95 = 𝑋ത − 𝑡0,95 ; 𝑋ത + 𝑡0,95 = [9,71 − 1,96 × ; 9,71 + 1,96 × ] 𝑛−1 𝑛−1 14 14 𝐼0,95 = [9,36; 10,06] Sara GOTTI SEG S3, 2021-2022 114 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 2. (n≥30) et X de loi quelconque Lorsque la taille n de l'échantillon est grande (pratiquement dès que n > 30), on appliquera les formules de l'intervalle de confiance sur 𝜇, même si l'échantillon n'est pas issu d'une population normale. En effet, le théorème central limite nous permet de dire que 𝑋ത 𝜎 est approximativement de loi 𝑁(𝜇; ) lorsque n est grand. 𝑛 Sara GOTTI SEG S3, 2021-2022 115 Chapitre 4: Estimation Estimation par intervalle de confiance Estimation par intervalle de confiance d’une moyenne 2. (n≥30) et X de loi quelconque l'intervalle de confiance de la moyenne 𝜇 de niveau 𝛽: Si 𝜎 est connue : 𝜎 𝜎 𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ] 𝑛 𝑛 Si 𝜎 est connue : 𝑺 𝑺 𝐼𝛽 = [𝑋ത − 𝑡β ; 𝑋ത + 𝑡β ] 𝑛−1 𝑛−1