LECGE1316 Econométrie - Synthèse complète 2023 - PDF

Summary

This document is a synthesis of econometrics concepts and models for the year 2023. It covers topics such as regression models, including simple and multiple linear regression.

Full Transcript

Économétrie 1. CHAPITRE 1 : NATURE DE L’ÉCONOMÉTRIE ET DONNÉES ÉCONOMIQUES.............................................1 1.1. INTRODUCTION.....................................................................................................................................1 1.2. LE PROCES...

Économétrie 1. CHAPITRE 1 : NATURE DE L’ÉCONOMÉTRIE ET DONNÉES ÉCONOMIQUES.............................................1 1.1. INTRODUCTION.....................................................................................................................................1 1.2. LE PROCESSUS.......................................................................................................................................1 1.3. LES DONNÉES........................................................................................................................................2 1.4. CETERIS PARIBUS...................................................................................................................................3 2. CHAPITRE 2 : MODÈLE DE RÉGRESSION SIMPLE....................................................................................4 2.1. INTRODUCTION.....................................................................................................................................4 2.2. VOCABULAIRE.......................................................................................................................................4 2.3. LE MODÈLE DE RÉGRESSION LINÉAIRE – PRÉLIMINAIRES..................................................................................5 2.3.1. OBJECTIF.................................................................................................................................................. 5 2.3.2. CETERIS PARIBUS........................................................................................................................................ 5 2.3.3. RAPPELS................................................................................................................................................... 6 2.4. CALCUL DES PARAMÈTRES D’UNE RÉGRESSION LINÉAIRE.................................................................................6 2.4.1. MÉTHODE DES MOMENTS............................................................................................................................ 6 2.4.2. MÉTHODE DES MCO.................................................................................................................................. 7 2.4.3. CAS EXTRÊME............................................................................................................................................ 7 2.5. VARIANCE............................................................................................................................................9 2.5.1. DÉCOMPOSITION........................................................................................................................................ 9 2.5.2. GOODNESS-OF-FIT...................................................................................................................................... 9 2.6. IMPORTANCE DE L’UNITÉ DE MESURE.........................................................................................................9 2.7. FORME FONCTIONNELLE........................................................................................................................ 10 2.7.1. DÉFINITION............................................................................................................................................. 10 2.7.2. LOG-NIVEAU............................................................................................................................................ 10 2.7.3. MODÈLE À ÉLASTICITÉ CONSTANTE.............................................................................................................. 11 2.7.4. CHANGEMENT D’UNITÉ ET LOG................................................................................................................... 11 2.8. RETOUR SUR L’IMPORTANCE DE L’ESTIMATEUR DES MCO............................................................................ 11 2.8.1. POPULARITÉ............................................................................................................................................ 11 2.8.2. SIMULATION DE MONTE-CARLO................................................................................................................. 12 2.8.3. HYPOTHÈSES POUR LE CARACTÈRE NON-BIAISÉ DES MCO................................................................................ 12 2.8.4. HYPOTHÈSE D’HOMOSCÉDASTICITÉ.............................................................................................................. 13 2.8.5. VARIANCE DE 𝜷𝟏..................................................................................................................................... 13 3. CHAPITRE 3 : MODÈLE DE RÉGRESSION MULTIPLE.............................................................................. 15 3.1. RETOUR SUR L’IMPORTANCE DE L’ESTIMATEUR DES MCO............................................................................ 15 3.1.1. UTILITÉ................................................................................................................................................... 15 3.1.2. DÉFINITION............................................................................................................................................. 15 3.1.3. REMARQUE SUR L’ÉCRITURE MATRICIELLE..................................................................................................... 15 3.2. CARACTÉRISTIQUES DE LA RÉGRESSION MULTIPLE........................................................................................ 16 3.2.1. INTERPRÉTATION DES COEFFICIENTS............................................................................................................. 16 3.2.2. PROPRIÉTÉS DES MCO.............................................................................................................................. 16 3.2.3. GOODNESS-OF-FIT.................................................................................................................................... 16 3.2.4. HYPOTHÈSES........................................................................................................................................... 17 LECGE1316 – économétrie 1 Laetitia Parion M. Beine 2023 3.3. MAUVAISE ESTIMATION DE MODÈLE........................................................................................................ 18 3.3.1. INTRODUCTION........................................................................................................................................ 18 3.3.2. LES VARIABLES REDONDANTES.................................................................................................................... 18 3.3.3. OMISSION DE VARIABLES........................................................................................................................... 19 3.3.4. MODÈLE PARCIMONIEUX........................................................................................................................... 21 3.3.5. RÉSUMÉ – 𝑉𝑎𝑟𝛽1 DANS UN MODÈLE MAL SPÉCIFIÉ....................................................................................... 21 3.4. FORME MATRICIELLE............................................................................................................................ 22 3.5. ESTIMATION DE 𝝈𝟐............................................................................................................................. 22 3.6. BLUE............................................................................................................................................... 22 4. CHAPITRE 4 : MODÈLE DE RÉGRESSION MULTIPLE – INFÉRENCE......................................................... 23 4.1. INTRODUCTION................................................................................................................................... 23 4.2. HYPOTHÈSE DE NORMALITÉ................................................................................................................... 23 4.2.1. DÉFINITION............................................................................................................................................. 23 4.2.2. APPORT DE L’HYPOTHÈSE DE NORMALITÉ POUR LA FIABILITÉ DES MCO.............................................................. 23 4.2.3. JUSTIFICATION......................................................................................................................................... 24 4.2.4. FAIBLESSE DU TCL ET DE L’HYPOTHÈSE DE NORMALITÉ.................................................................................... 24 4.3. IMPLICATIONS DE L’HYPOTHÈSE DE NORMALITÉ.......................................................................................... 24 4.3.1. THÉORÈME 4.1........................................................................................................................................ 24 4.3.2. RÉSOUDRE LE PROBLÈME DE 𝝈𝟐................................................................................................................. 25 4.3.3. LA LOI DE STUDENT................................................................................................................................... 25 4.4. TEST D’HYPOTHÈSE PAR LA T-STAT........................................................................................................... 25 4.4.1. INTRODUCTION........................................................................................................................................ 25 4.4.2. UTILISATION............................................................................................................................................ 26 4.4.3. RÈGLE DE DÉCISION DE REJET...................................................................................................................... 26 4.4.4. NIVEAU DE SIGNIFICATIVITÉ........................................................................................................................ 27 4.4.5. TEST UNILATÉRAL..................................................................................................................................... 27 4.4.6. TEST BILATÉRAL........................................................................................................................................ 27 4.5. LA P-VALEUR...................................................................................................................................... 28 4.5.1. QU’EST-CE QUE LA P-VALEUR ?................................................................................................................... 28 4.5.2. UTILITÉ................................................................................................................................................... 28 4.5.3. REMARQUE DE TERMINOLOGIE................................................................................................................... 28 4.6. L’INTERVALLE DE CONFIANCE.................................................................................................................. 29 4.6.1. DÉFINITION............................................................................................................................................. 29 4.6.2. CALCUL................................................................................................................................................... 29 4.6.3. REMARQUE SUR L’INTERVALLE DE CONFIANCE............................................................................................... 29 4.7. TEST D’ÉGALITÉ DE COEFFICIENTS............................................................................................................ 30 4.7.1. DÉFINITION............................................................................................................................................. 30 4.7.2. PREMIÈRE MÉTHODE : EXPRIMER DIFFÉREMMENT.......................................................................................... 30 4.7.3. DEUXIÈME MÉTHODE : CHANGER PAR UNE AUTRE VARIABLE............................................................................. 30 4.8. TESTS MULTIPLES DE RESTRICTIONS LINÉAIRES............................................................................................ 31 4.8.1. DÉFINITION............................................................................................................................................. 31 4.8.2. TEST DE STATISTIQUE EN F......................................................................................................................... 31 4.8.3. REMARQUE SUR LES ZONES DE REJET............................................................................................................ 31 4.8.4. TEST ALTERNATIF : LE MULTIPLICATEUR DE LAGRANGE.................................................................................... 32 4.8.5. REMARQUE SUR LES LOGICIELS.................................................................................................................... 32 LECGE1316 – économétrie 2 Laetitia Parion M. Beine 2023 5. CHAPITRE 5 : PROPRIÉTÉS ASYMPTOTIQUES DES MCO....................................................................... 33 5.1. INTRODUCTION................................................................................................................................... 33 5.2. RETOUR SUR LES HYPOTHÈSES EXACTES..................................................................................................... 33 5.2.1. DÉFINITION............................................................................................................................................. 33 5.2.2. PROBLÈME.............................................................................................................................................. 33 5.2.3. AVANTAGE DES PROPRIÉTÉS ASYMPTOTIQUES................................................................................................ 33 5.3. TEST DE NORMALITÉ............................................................................................................................. 34 5.3.1. HYPOTHÈSE DE NORMALITÉ........................................................................................................................ 34 5.3.2. CONTENU DU TEST DE NORMALITÉ............................................................................................................... 34 5.3.3. TEST DE JARQUE-BERA.............................................................................................................................. 34 5.3.4. NORMALITÉ ASYMPTOTIQUE...................................................................................................................... 35 6. CHAPITRE 6 : PROBLÈMES ADDITIONNELS DANS LA RÉGRESSION MULTIPLE....................................... 36 6.1. IMPACT DES UNITÉS DE MESURE.............................................................................................................. 36 6.1.1. INTRODUCTION........................................................................................................................................ 36 6.1.2. IMPACT SUR LA QUALITÉ DU MODÈLE........................................................................................................... 36 6.1.3. IMPACT SUR LES COEFFICIENTS.................................................................................................................... 36 6.1.4. IMPACT SUR LA SIGNIFICATIVITÉ.................................................................................................................. 36 6.1.5. TRANSFORMATION LOGARITHMIQUE........................................................................................................... 37 6.1.6. COEFFICIENTS BETAS................................................................................................................................. 37 6.2. FORMES FONCTIONNELLES..................................................................................................................... 37 6.2.1. FORMES DU MODÈLE DE RÉGRESSION........................................................................................................... 37 6.2.2. TRANSFORMATION LOGARITHMIQUE........................................................................................................... 38 6.3. FONCTIONS QUADRATIQUES.................................................................................................................. 39 6.4. TERMES D’INTERACTION........................................................................................................................ 39 6.5. QUALITÉ D’AJUSTEMENT ET SÉLECTION DE RÉGRESSEURS.............................................................................. 40 6.5.1. PROBLÈME DU R2..................................................................................................................................... 40 6.5.2. DÉFINITION DU R2 AJUSTÉ.......................................................................................................................... 40 6.5.3. UTILITÉ DU R2 AJUSTÉ............................................................................................................................... 41 6.6. PRÉVISIONS ET ANALYSE DES RÉSIDUS....................................................................................................... 41 6.6.1. FAIRE DES PRÉVISIONS EN ÉCONOMÉTRIE...................................................................................................... 41 6.6.2. PRÉVISIONS PONCTUELLES.......................................................................................................................... 41 6.6.3. INTERVALLE DE CONFIANCE........................................................................................................................ 42 7. CHAPITRE 7 : RÉGRESSION MULTIPLE AVEC VARIABLES BINAIRES OU DUMMY................................... 43 7.1. INTRODUCTION : LES VARIABLES DUMMY.................................................................................................. 43 7.1.1. DÉFINITION............................................................................................................................................. 43 7.1.2. INFORMATIONS QUALITATIVES ET QUANTITATIVES.......................................................................................... 43 7.1.3. BUT DU CHAPITRE..................................................................................................................................... 43 7.2. COMMENT TRANSCRIRE UNE INFORMATION QUALITATIVE ?.......................................................................... 43 7.2.1. INFORMATION BINAIRE.............................................................................................................................. 43 7.2.2. INTERPRÉTATION...................................................................................................................................... 44 7.2.3. POINT D’ATTENTION (G-1 VARIABLE)........................................................................................................... 44 7.2.4. TYPES DE VARIABLE DUMMY....................................................................................................................... 45 7.3. MODÈLES LOG-NIVEAU......................................................................................................................... 45 7.4. PLUSIEURS VARIABLES BINAIRES.............................................................................................................. 45 LECGE1316 – économétrie 3 Laetitia Parion M. Beine 2023 7.5. INFORMATION ORDINALE...................................................................................................................... 46 7.5.1. DÉFINITION............................................................................................................................................. 46 7.5.2. INTERPRÉTATION...................................................................................................................................... 46 7.6. TEST DE DIFFÉRENCE ENTRE GROUPES....................................................................................................... 46 7.6.1. PENTES ET INTERCEPTS DIFFÉRENTS.............................................................................................................. 46 7.6.2. VARIABLES CONJOINTES............................................................................................................................. 47 7.6.3. TEST DE CHOW - DÉFINITION...................................................................................................................... 47 7.6.4. TEST DE CHOW - DÉROULEMENT................................................................................................................. 47 8. CHAPITRE 8 : HÉTÉROSCÉDASTICITÉ................................................................................................... 48 8.1. INTRODUCTION................................................................................................................................... 48 8.1.1. RAPPEL SUR L’HOMOSCÉDASTICITÉ.............................................................................................................. 48 8.1.2. PLAN DU CHAPITRE................................................................................................................................... 48 8.2. CONSÉQUENCES DE L’HÉTÉROSCÉDASTICITÉ POUR LES MCO.......................................................................... 49 8.3. INFLUENCE ROBUSTE À L’HÉTÉROSCÉDASTICITÉ........................................................................................... 49 8.3.1. INTRODUCTION – FORME INCONNUE D’HÉTÉROSCÉDASTICITÉ........................................................................... 49 8.3.2. FORMULES DES ÉCART-TYPES ROBUSTES....................................................................................................... 49 8.3.3. INFLUENCE DES ÉCART-TYPES ROBUSTES....................................................................................................... 50 8.4. TESTS D’HÉTÉROSCÉDASTICITÉ................................................................................................................ 50 8.4.1. F-TEST D’HÉTÉROSCÉDASTICITÉ................................................................................................................... 51 8.4.2. LM-TEST D’HÉTÉROSCÉDASTICITÉ................................................................................................................ 52 8.4.3. LIEN AVEC LA FORME FONCTIONNELLE.......................................................................................................... 52 8.4.4. TEST DE WHITE........................................................................................................................................ 52 8.5. MOINDRES CARRÉS PONDÉRÉS (MCP)..................................................................................................... 52 8.5.1. INTUITIONS............................................................................................................................................. 52 8.5.2. FONCTIONNEMENT................................................................................................................................... 53 8.5.3. REMARQUES............................................................................................................................................ 53 8.5.4. ESTIMATION DE H..................................................................................................................................... 54 8.5.5. HI PRÉDIT................................................................................................................................................ 54 8.5.6. LES MCG................................................................................................................................................ 54 LECGE1316 – économétrie 4 Laetitia Parion M. Beine 2023 1. Chapitre 1 : nature de l’économétrie et données économiques 1.1. Introduction Question Données A quoi sert l’économétrie ? L’économétrie sert à répondre à des questions économiques (généralement, mais pas toujours) autour de : Réponse 1. Validation des hypothèses économiques théoriques 1. Validation des hypothèses 2. Faire des prévisions économiques théoriques 3. Évaluation des politiques économiques 2. Faire des prévisions Elle répond de manière empirique, en se basant sur des données 3. Évaluation des politiques non-expérimentales. économiques Question Données Qu’est-ce que l’économétrie ? Intersection entre plusieurs disciplines : - Économie Réponse - Maths (se base sur des modèles à équation et formalisation) C’est une intersection entre - Statistique mathématique (mettre en évidence qu’il y a un côté l’économie, les mathématiques et aléatoire (composante stochastique et pas déterministe) sur la la statistique mathématique. réalisation des événements sur lesquels on travaille) Caractéristique essentielle : on travaille avec des données non- expérimentales ! (d’où l’utilisation des stats). On ne peut rien contrôler. On n’a que la donnée générée par la réalité. L’économétrie n’est pas trop utilisée dans les sciences exactes où on peut expérimenter et avoir des nouvelles données. 1.2. Le processus Question Données Quel est le processus pour tester 1. Formuler une question de manière précise. une théorie/hypothèse relative à 2. Formuler cette question sous forme d’un modèle mathématique une relation économique ? (équation) 3. Identifier les variables (bénéfice, coût, autres…) afin d’arriver à la Réponse formalisation économique 1. Question Si la théorie économique n’est pas suffisante, on utilise son intuition 2. Modèle mathématique pour trouver les variables. 3. Formulation économique 4. Spécifier un modèle économétrique 4. Modèle économétrique - Quelle fonction c’est ? 5. Calcul des paramètres et - Pour tenir compte des facteurs non-observés/non-observables, inférence on utilise u (facteurs non-observables + possibles erreurs) 5. Calcul (estimation) des paramètres et inférence + tests d’hypothèses à inférence pour voir si nos estimations supportent ou pas des hypothèses qu’on s’est posées. LECGE1316 – économétrie 1 Laetitia Parion M. Beine 2023 1.3. Les données Question Données Quelles sont les trois catégories de 1. Données « cross-section » ou données transversales données ? 2. Séries temporelles 3. Données de panel ou longitudinales (combinaison des deux Réponse premiers types) 1. Cross-section 2. Séries temporelles 3. Données de panel Question Données En quoi consistent les données Les données « cross-section » sont les données relatives à un « cross-section » ou transversales ? échantillon d’individus observées à un moment donné. Ensemble des données dont on dispose pour l’analyse Réponse économétriques (on ne va pas refaire l’enquête l’année d’après, on Photo à un moment donné de se contente de ça). différents individus pour lesquels La donnée fondamentale c’est la variation entre les individus. j’ai des observations. Avantage : on va pouvoir supposer que les observations sont issues d’un échantillon aléatoire. à hypothèse importante : il n’y a pas de relation entre les différentes observations (simplifie l’analyse). Où sont-elles utilisées : micro-économie appliquée : analyse marché du travail, finances publiques (problèmes de taxes), organisation industrielle (analyse de concurrence), économie spatiale (localisation des firmes), démographie, économie de la santé… Nombre d’observations = nombre d’individus Question Données En quoi consistent les séries Les séries temporelles ne sont pas cross-sectionnelles, c’est même temporelles ? un peu l’inverse : ce sont des données relatives à un individu (ex. la Belgique), avec une évolution macroéconomique dans le temps (PIB, Réponse inflation, taux chômage, population active, structure démographique Données relatives à un individu sur etc.). une période. - Notion de fréquence Ces données sont utilisées en macroéconomie et en finance. Nombre d’observations = nombre d’années (ou autre mesure) Dépendance dans le temps à analyse économique plus complexe. + Plein de problèmes spécifiques à ce type de données. LECGE1316 – économétrie 2 Laetitia Parion M. Beine 2023 Question Données En quoi consistent les données de Les données de panel sont des données où on observe différents panel ? individus de manière répétée dans le temps. Difficultés : Réponse - Les données ne sont pas forcément indépendantes les unes des Observations de plusieurs unités au autres. Par exemple, certaines données sont issues du même cours du temps. individu. Avantage : - On peut utiliser le fait qu’elles sont issues d’un même individu. - Meilleures prévisions. 1.4. Ceteris paribus Question Données Qu’est-ce que la notion de ceteris Pour pouvoir faire une interprétation d’un lien causal entre plusieurs paribus ? variables, il faut valider la notion de ceteris paribus (toutes choses étant égales par ailleurs), afin d’isoler un effet. Réponse Il s’agit de réfléchir à un lien causal sans se préoccuper de l’état du Ça veut dire qu’on regarde l’effet monde. d’une variable sur la variable L’hypothèse de ceteris paribus n’est pas toujours crédible et cela aura dépendante, en considérant que les un impact sur l’interprétation finale (savoir si on peut déterminer un autres ne changent pas. lien de causalité ou non). Il faut poser certaines contraintes pour permettre ce type interprétation. LECGE1316 – économétrie 3 Laetitia Parion M. Beine 2023 2. Chapitre 2 : modèle de régression simple 2.1. Introduction Question Données Qu’est-ce que le modèle linéaire de Le modèle de régression simple permet d’établir le lien entre la régression simple ? À quoi sert-il ? variable dépendante y et une variable indépendante x. Le but est d’expliquer comment y varie lorsque x varie. On veut Réponse estimer un modèle de type 𝒚 = 𝜷𝟎 + 𝜷𝟏 𝒙 + 𝒖 Le but est d’expliquer comment y Remarque : on établit une relation d’économétrie valable pour une varie lorsque x varie. population, même si les calculs portent sur un échantillon aléatoire de cette population. Question Données Quels sont les problèmes d’un - Comme il n’existe pas de relation exacte entre deux variables, modèle de régression simple ? comment tenir compte que d’autres facteurs (non-observés) peuvent expliquer y ? Réponse - Quelle va être la relation fonctionnelle entre y et x ? Quelle est la - Quid des facteurs non- bonne relation à estimer ? observables ? - Comment s’assurer qu’on a bien la notion de ceteris paribus qui - Quelle est la nature de la nous permet d’avoir l’interprétation de la causalité ? Est-ce relation entre x et y ? qu’elle va être respectée ? - Comment assurer l’hypothèse de ceteris paribus ? Question Données Quels sont les autres noms pour x et y x y? Variable dépendante Variable indépendante Réponse Variable à expliquer Variable explicative Principalement variables dépendante et indépendante. Variable de réaction Variable de contrôle Régressant Régresseur 2.2. Vocabulaire Question Données « u », c’est quoi ? « u » est le terme d’erreur qui capture l’influence de tous les facteurs non-observés – autres que x. Réponse C’est également le terme d’erreur dans x. C’est une variable aléatoire qui C’est une variable aléatoire (comme x). capture l’influence de tous les facteurs non-observés. LECGE1316 – économétrie 4 Laetitia Parion M. Beine 2023 Question Données Qu’est-ce qu’une variable C’est une variable dont la valeur est liée à un élément lié au hasard. aléatoire ? u et x sont des variables aléatoires par exemple. Réponse C’est une variable dont la valeur est liée à un élément lié au hasard. 2.3. Le modèle de régression linéaire – préliminaires 2.3.1. Objectif Question Données Comment interpréter le modèle de On va calculer β0 et β1. Si tous les autres facteurs non-observés régression y = β0 + β1x + u ? restent inchangés (ceteris paribus) donc si Δu = 0, lorsqu’on va calculer le modèle, β1 va capturer un effet linéaire de la variable x sur Réponse la variable y. Si Δu = 0, x a un effet linéaire sur y. à L’effet de x est le même pour chaque valeur de y 2.3.2. Ceteris paribus Question Données Comment garantir le ceteris On fait des hypothèses relatives à la distribution du terme u. paribus ? Distribution à analyse des moments de cette distribution, des valeurs (2 importantes : la moyenne et la variance) spécifiques de Réponse cette distribution On fait deux hypothèses sur les La moyenne fait référence à la notion d’espérance. moments : 2 hypothèses sur u pour garantir ceteris paribus. L’hypothèse de - Hypothèse de normalisation ceteris paribus implique deux hypothèses cruciales. - Hypothèse d’indépendance Hypothèses en termes de notions d’espérance 1) 𝐸(𝑢) = 0 à normalisation 2) 𝐸(𝑢|𝑥) = 𝐸(𝑢) = 0 à implique que u et x sont indépendants. Ex : le niveau d’habileté n’est pas influencé par le niveau d’éducation. Remarque : la deuxième hypothèse n’est peut-être pas vraie, mais on en a besoin pour faire les calculs. Et si elle ne l’est pas, bah mystère parce qu’on n’étudiera pas ça. Nous on assume juste que les hypothèses sont valides. Ce sont des hypothèses sur les moments. Combinaison de ces deux hypothèses : hypothèse de moyenne conditionnelle nulle à E(u/x) = E(u) = 0 LECGE1316 – économétrie 5 Laetitia Parion M. Beine 2023 2.3.3. Rappels Question Données Qu’est-ce que l’espérance ? Espérance de X = moyenne pondérée de toutes les valeurs possibles de X. C’est une mesure de la tendance centrale. Réponse - Cas discret : somme C’est la moyenne pondérée de - Cas continu : intégrale toutes les valeurs possibles de X. Propriétés : - Espérance d’une constante = constante - Espérance d’un truc linéaire E(aX + b) = aE(X) + b - Si X et Y indépendants, E(Y/X) = E(Y) - E(E(Y/X)) = E(Y) Moyenne à échantillon Espérance à population 2.4. Calcul des paramètres d’une régression linéaire 2.4.1. Méthode des moments Question Données Comment calculer les paramètres On prend un échantillon tiré aléatoirement de la population, de taille (β0 et β1) d’une régression linéaire n, qui représente bien la population. par la méthode des moments ? Méthode des moments : on va utiliser les deux hypothèses formulées. Réponse 1) 𝐸(𝑦 − 𝛽# − 𝛽$ 𝑥) = 𝐸(𝑢) = 0 vu que 𝑦 = 𝛽# + 𝛽$ 𝑥 + 𝑢 En partant de 2) 𝐸((𝑦 − 𝛽# − 𝛽$ 𝑥)𝑥) =0 (covariance nulle entre u et x) - 𝐸(𝑦 − 𝛽# − 𝛽$ 𝑥) = 0 Ces restrictions sont appliquées sur la population donc on prend la - 𝐸((𝑦 − 𝛽# − 𝛽$ 𝑥)𝑥) =0 contrepartie empirique avec la moyenne. On arrive à En résolvant les deux équations et en isolant les coefficients, on 𝛽9# = 𝑦: − 𝛽9$ 𝑥̅ arrive à ∑&%'$(𝑥% − 𝑥̅ )(𝑦% − 𝑦:) 𝛽9# = 𝑦: − 𝛽9$ 𝑥̅ 𝛽9$ = ∑&%'$(𝑥% − 𝑥̅ )( ∑&%'$(𝑥% − 𝑥̅ )(𝑦% − 𝑦:) 𝛽9$ = ∑&%'$(𝑥% − 𝑥̅ )( Question Données Qu’est-ce que la covariance ? C’est un mesure d’association linéaire entre deux variables aléatoires. Réponse La covariance devient plus positive pour chaque couple de valeurs Mesure d’association linéaire entre qui diffèrent de leur moyenne dans le même sens, et plus négative deux variables aléatoires. pour chaque couple de valeurs qui diffèrent de leur moyenne dans le sens opposé. Le signe de 𝛽9$ sera toujours du signe de la covariance entre x et y. LECGE1316 – économétrie 6 Laetitia Parion M. Beine 2023 Question Données Qu’est-ce que la variance empirique La variance empirique donne l’étendue de la différence des x, dans de x ? quelle mesure les x peuvent être très différents les uns des autres. Au plus la variance est grande, au plus les gens sont différents. Réponse La variance est une aide pour la précision d’estimation. Mesure de dispersion des x. 2.4.2. Méthode des MCO Question Données Comment calculer les paramètres Point de départ : on cherche à minimiser la déviation (l’erreur) entre d’une régression linéaire (β0 et β1) la prédiction du modèle et ce qui est observé. par la méthode des moindres carrés 𝑢=% est le résidu ordinaires (MCO) ? On cherche les valeurs de β0 et β1 qui minimiseront la somme des Réponse carrés des erreurs. & 𝒏 En minimisant la somme des carrés des erreurs : min A 𝑢B%( (𝑏# , 𝑏$ ) ⟺ 𝐦𝐢𝐧 A (𝒚𝒊 − 𝒃𝟎 − 𝒃𝟏 𝒙𝒊 )𝟐 )! ,)" 𝒃𝟎 ,𝒃𝟏 & %'$ 𝒊'𝟏 min A (𝑦% − 𝑏# − 𝑏$ 𝑥% )( Pour minimiser, on fait la dérivée partielle par β0 et β1. Ces dérivées )! ,)" partielles sont les deux conditions de premier ordre. %'$ Par les dérivées partielles. 𝜕𝑢B%( (𝑏# , 𝑏$ ) =0 On arrive aux mêmes estimateurs 𝜕𝑏# que par la méthode des moments. 𝜕𝑢B%( (𝑏# , 𝑏$ ) =0 𝜕𝑏$ Conclusion du calcul : on arrive exactement aux mêmes expressions que pour la méthode des moments. à On a le même estimateur, et donc on peut conclure que les estimateurs de la méthode 2 dépendent aussi des deux hypothèses de la méthode des moments (normalisation et indépendance). 2.4.3. Cas extrême Question Données Cas extrême pour la variance de x ? Si toutes les données ont la même valeur de x (même niveau d’éducation par exemple), alors tous les points sont sur la même ligne Réponse verticale. Si toutes les données ont la même β1 n’existe pas puisque la variance est égale à 0. Dans ce cas, on ne valeur de x, le modèle n’est pas peut pas estimer le modèle et trouver la droite de régression. estimable puisque la variance est & nulle. A(𝑥 − 𝑥̅ )( = 0 % %'$ Remarque : dans un cas intermédiaire, où les différences ne sont pas très marquées, la qualité du modèle ne sera pas très bonne. à Un économètre cherche la variation. LECGE1316 – économétrie 7 Laetitia Parion M. Beine 2023 Question Données Quels seraient les critères n Pourquoi mettre au carré ? alternatifs pour la méthode des Si on a des sommes qui s’annulent (négatif compense positif), c’est moindres carrés ordinaires ? mauvais pour le modèle. Le carré rend les négatifs positifs. Réponse n Pourquoi ne pas utiliser la valeur absolue ? On met au carré pour ne pas avoir C’est compliqué les valeurs absolues. On ne peut pas obtenir une des compensations, et parce que résolution numérique, et on n’a aucune garantie qu’il existe une c’est plus facile que les valeurs valeur qui minimise. absolues. Question Données Quelles sont les propriétés liées à la Après estimation MCO, on se penche sur ses propriétés, qui seront méthode MCO ? toujours vraies, peu importe le contexte ou l’échantillon a) La somme des résidus dans l’échantillon est égale à 0. Réponse C’est la contrepartie empirique de l’hypothèse de normalisation. a) Somme des résidus dans l’échantillon = 0 b) Si je prends chaque niveau de x et le résidu pour cet individu, et b) Somme de chaque niveau de x que je fais la somme de tous les individus, la somme est toujours et son résidu = 0 égale à 0. c) Les valeurs moyennes dans C’est la contrepartie empirique de l’hypothèse d’indépendance. l’échantillon sont toujours sur la droite de régression c) (𝑥̅ , 𝑦:) (valeurs moyennes dans l’échantillon), est toujours sur la d) Propriété de droite de régression. décomposition (valeur prédite Quand on utilise les estimateurs, on va toujours prédire que la valeur + résidu) prédite correspondante à 𝑥̅ est 𝑦:. d) Propriété de décomposition : la valeur observée est décomposable en une valeur prédite et un résidu (valeur non- prédite). Cela permet de dériver un critère de qualité d’ajustement du modèle : dans quel mesure le modèle fait un bon travail d’estimation. LECGE1316 – économétrie 8 Laetitia Parion M. Beine 2023 2.5. Variance 2.5.1. Décomposition Question Données Comment peut-on décomposer la Puisque 𝑦% = 𝑦=% + 𝑢=% , on peut définir la variabilité à expliquer en 3 variance ? concepts : SST (somme totale des carrés) : ∑&%'$(𝑦% − 𝑦:)( Réponse à Prend toutes les déviations des y par rapport à la moyenne, au 𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅 carré - SST = somme totale des carrés ∑& ( - SSE = somme des carrés SSE (somme des carrés expliquée par le modèle) : %'$(𝑦=% − 𝑦:) expliqués SSR (somme des résidus) : ∑&%'$ 𝑢%( - SSR = somme des résidus Somme de ce qu’on n’a pas su expliquer avec le modèle. On ne prend pas en déviation parce que la moyenne des résidus est nulle. 𝑆𝑆𝑇 = 𝑆𝑆𝐸 + 𝑆𝑆𝑅 Ceci va nous permettre de calculer un rapport. 2.5.2. Goodness-of-fit Question Données Goodness-of-fit (GoF) 𝑅( est aussi appelé coefficient de détermination. C’est la part de la variabilité à expliquer qui est observée par le modèle. Réponse 𝑆𝑆𝐸 𝑆𝑆𝑅 𝑅( ≡ =1− C’est la part de la variabilité à 𝑆𝑆𝑇 𝑆𝑆𝑇 expliquer qui est observée par le Il est compris entre 0 et 1. modèle. Si 𝑅( = 1, ça veut dire qu’on a une droite qui passe par toutes les à Le modèle explique …% de la observations (c’est impossible car la réalité ne peut pas totalement variation. correspondre à la théorie). 𝑅(. 100 est le pourcentage de la variance de y expliqué par x. 𝑅( = 𝜌0(% ,01% (corrélation entre ce qui est observé et ce qui est prédit). 𝑅( permet d’aider à juger la qualité d’une régression. Mais il peut y avoir des 𝑅( assez faibles mais qui proviennent d’un modèle assez performant. Le modèle explique …% de la variation. 2.6. Importance de l’unité de mesure Question Données Importance de l’unité de mesure L’unité de mesure est très importante. Si on change les unités des variables, cela change de manière égale la solution. Réponse Si on passe du salaire horaire au salaire journalier en multipliant par Change la solution. 8, le coefficient est multiplié par 8. Remarque : 𝑅( n’est pas affecté par ces changements d’unité. LECGE1316 – économétrie 9 Laetitia Parion M. Beine 2023 2.7. Forme fonctionnelle 2.7.1. Définition Question Données Qu’est-ce qu’une forme Une forme fonctionnelle permet de coller au mieux à la réalité. fonctionnelle ? Avec les mêmes variables et données, on peut formuler un modèle plus pertinent qui est plus exacte dans son estimation. Réponse Une forme fonctionnelle permet de coller au mieux à la réalité. Question Données Quelles sont les différents modèles Il y a quatre modèles de base, qui sont liés ou non au log. de base des formes fonctionnelles ? 1. Niveau-niveau : y et x 2. Niveau-log : y et log(x) Réponse 3. Log-niveau : log(y) et x 1. Niveau-niveau 4. Log-log (modèle à élasticité constante) : log(y) et log(x) 2. Niveau-log 3. Log-niveau 4. Log-log 2.7.2. Log-niveau Question Données Qu’est-ce que la forme La forme fonctionnelle log, c’est quand on prend log(y) avec x. Elle fonctionnelle log-niveau ? permet d’exprimer qu’au plus x est grand, au plus la variation est grande. Réponse La valeur des β est différente qu’avec une forme niveau-niveau. C’est quand on prend le log de y Interprétation : +1x à +…% de y avec x. On obtient la variation en pourcentage causée par +1x. Interprétation : +1x à +…% de y On ne peut pas toujours forcer le modèle linéaire à être au plus juste, il y a des risques qu’on ait un intercept négatif (pas logique d’avoir un salaire négatif) ! Il ne faut pas comparer les 𝑅( des deux formes, puisque les y sont différents. Exemple : cela permet d’exprimer que le salaire augmente d’un certain pourcentage en fonction du nombre d’années d’études, et pas d’une valeur identique à chaque année en plus. Ainsi, l’évolution est plus rapide et plus cohérente (avoir un master octroie un salaire bien plus élevé qu’avoir son CESS). Remarque : log(x) est utilisé à la place de ln(x) ! LECGE1316 – économétrie 10 Laetitia Parion M. Beine 2023 2.7.3. Modèle à élasticité constante Question Données Qu’est-ce que le modèle à élasticité C’est une autre forme fonctionnelle, aussi appelée « double log ». constante ? Elle permet notamment de linéariser un modèle de type Cobb- Douglas : 𝑦 = 𝛾# 𝑥 2". Réponse Le double log estime l’élasticité (constante et ne dépendant pas du C’est la forme log-log. niveau de x) : interprétation : +1% x à +…% y Interprétation : +1% x à +…% y Rappel : log d’un produit = somme des log. 2.7.4. Changement d’unité et log Question Données Quelle est l’influence d’un Changer l’unité de y en multipliant par c dans un log(y) donne le changement d’unité et log sur les même coefficient 𝛽9$ mais la constante (l’intercept) change parce que estimateurs ? β0 devient β0 + log(c). Réponse Change l’intercept mais pas 𝛽9$. 2.8. Retour sur l’importance de l’estimateur des MCO 2.8.1. Popularité Question Données Pourquoi est-ce que cet estimateur Pas parce qu’il est facile à calculer, mais parce qu’il a des bonnes des MCO est si populaire dans les propriétés. modèles linéaires ? (propriétés des Supposons que je sois Dieu et que je connaisse la vraie valeur de bêta. estimateurs MCO) Supposons que la distribution de mon estimateur des MCO se présente en cloche. Réponse Cette infinité de valeurs (1 par échantillon) se distribue dans la Parce qu’il respecte deux population à distribution de bêta (les probabilités que bêta a de propriétés : prendre chaque valeur). - Il est non biaisé On veut qu’en moyenne, notre estimateur donne la vraie valeur. Ce - Son estimateur a la variance la n’est pas le cas pour tous les estimateurs. On peut en avoir qui sont plus faible possible décalés (fusil qui dévie systématiquement dans son tir) L’estimateur des MCO est un bon fusil (et donc est populaire) car il respecte deux propriétés. 1. En moyenne, il est non biaisé à en moyenne, il tirera au centre de la cible 2. L’estimateur a la variance la plus faible possible Cette propriété est importante parce qu’on veut que les estimateurs soient le plus concentrés possibles. Si la probabilité d’obtenir la bonne valeur est trop élevée, c’est moins bon. LECGE1316 – économétrie 11 Laetitia Parion M. Beine 2023 2.8.2. Simulation de Monte-Carlo Question Données Que nous montre une simulation de Les simulations Monte-Carlo supposent qu’on connaît la vraie valeur Monte-Carlo à propos des de β0 et β1. propriétés des estimateurs ? On va simuler un grand nombre d’échantillons différents avec chacun leur estimation par la méthode des MCO et puis on regarde Réponse si ça confirme les propriétés. Quand on respecte les hypothèses, R R on obtient une distribution bien Pour chaque simulation, j’obtiens une valeur de 𝛽# et 𝛽$. On obtient centrée sur la vraie valeur. La disons 500 estimations, ce qui nous permet de calculer la moyenne moyenne des valeurs estimées est de ces 500 estimations et de voir si elle est proche des vraies valeurs R R très proche de la vraie valeur. La de 𝛽# et 𝛽$ (qu’on connaît puisqu’on est Dieu). différence entre la valeur estimée à Quand on respecte les hypothèses, on obtient une distribution (la moyenne) et la vraie valeur centrée sur la vraie valeur, et la moyenne en est très proche. s’appelle le biais. La différence entre la valeur estimée et la vraie valeur s’appelle le biais (= 𝛽$ − 𝛽9$ ), et ici il est vraiment petit (c’est du « bruit »). 2.8.3. Hypothèses pour le caractère non-biaisé des MCO Question Données Quelles sont les hypothèses qui La méthode des MCO remplit 4 critères essentiels qui font que la prouvent le caractère non-biaisé valeur estimée des estimateurs est égale à la vraie valeur. des MCO ? n SLR.1 : linéaire en les paramètres n SLR.2 : échantillon aléatoire de taille n tiré de la population Réponse n SLR.3 : moyenne conditionnelle nulle (indépendance u et x) n Linéaire en les paramètres n SLR.4 : variation dans les x (les données reçues sont différentes) n Échantillon aléatoire L’hypothèse la plus importante est la SLR3. Quand elle n’est plus n Moyenne conditionnelle nulle respectée, la propriété d’absence de biais n’est plus rencontrée ! n Variation dans les x Remarque : SLR.4 est garantie pour la population, mais pas pour 1 échantillon. Question Données Démonstration analytique que la Pour prouver l’absence de biais (donc que le modèle est centré), on distribution par MCO est centrée va remplacer yi par le modèle qu’on suppose. sur β. Partant de l’espérance du modèle, on va voir si elle nous donne une valeur de β qui est la même que la vraie valeur. Réponse ∑& %'"(5% 65̅ )0% Départ de SLR.4 puis après En partant de SLR.4 vérifié, on a 𝛽9$ = 99:(. On remplace yi par simplification, on obtient 𝛽9$ = ∑ & ;% _$) Sous H0, 𝐹 = 99B" _99B). >_$ ~ℑ(𝑘 + 1, 𝑛 − 2(𝑘 + 1)) Le coefficient dépend du nombre d’observations (n) et du nombre de paramètres (k+1). Le 2 devant (k+1) vient du fait qu’il y a deux groupes. 4. Comparer F à la valeur critique tirée de la loi de Fisher Plus la distance est grande, plus c’est le signe qu’il est faux d’imposer un même modèle aux deux groupes. LECGE1316 – économétrie 47 Laetitia Parion M. Beine 2023 8. Chapitre 8 : hétéroscédasticité 8.1. Introduction 8.1.1. Rappel sur l’homoscédasticité Question Données Qu’est-ce que l’homoscédasticité ? C’est une hypothèse introduite dans le chapitre 5 qui dit que le terme d’erreur u est distribué avec la même dispersion entre toutes les Réponse classes d’observations x. L’hypothèse que u est distribué Cette hypothèse permet de calculer facilement les écarts-types des pareillement peu importe x. paramètres estimés. Cependant, puisque l’homoscédasticité n’est qu’une hypothèse, il se peut qu’elle ne soit pas vérifiée, auquel cas on parle alors d’hétéroscédasticité. Question Données Quelle est la différence entre L’hypothèse d’homoscédasticité (MLR.5) et l’hypothèse de l’homoscédasticité et la normalité distribution normale des erreurs (normalité) (MLR.6) n’est pas la des erreurs ? même chose. On peut avoir 4 cas Réponse - Homoscédasticité & normalité - La normalité est liée à - Homoscédasticité & non-normalité l’inférence (t-stat et autres). - Hétéroscédasticité & normalité - L’homoscédasticité est liée à - Hétéroscédasticité & non-normalité l’écart-type. Ces deux hypothèses s’adressent à deux choses complémentaires n La normalité est liée à l’inférence (t-stat et autres). n L’homoscédasticité est liée à l’écart-type. 8.1.2. Plan du chapitre Question Données Que va aborder ce chapitre ? L’hypothèse d’homoscédasticité peut s’avérer vraie ou fausse. On se penche alors sur 3 questions : Réponse 1. Que se passe-t-il si l’hypothèse est violée, est-ce que c’est grave, 1. Conséquences quelles sont les conséquences ? 2. Rectification 2. Que faut-il modifier pour empêcher qu’il y ait des 3. Détection conséquences ? 3. Comment détecter la présence d’hétéroscédasticité dans les données (hors théorie) ? LECGE1316 – économétrie 48 Laetitia Parion M. Beine 2023 8.2. Conséquences de l’hétéroscédasticité pour les MCO Question Données Quelles sont les conséquences de La présence d’hétéroscédasticité n’entraîne pas de biais sur les MCO l’hétéroscédasticité ? – contrairement aux variables omises. Les indicateurs de qualité du modèle ne seront pas biaisés non plus. Réponse Par contre les estimateurs de la variance de β ne seront plus L’inférence ne fonctionne plus corrects. Variance et écart-types seront donc biaisés. (biais dans la variance de β). Þ L’inférence ne fonctionne plus. 8.3. Influence robuste à l’hétéroscédasticité 8.3.1. Introduction – forme inconnue d’hétéroscédasticité Question Données Quelles sont les deux méthodes Il existe 2 méthodes pour « corriger » le biais créé par pour corriger les effets de l’hétéroscédasticité : l’hétéroscédasticité ? n Les moindres carrés pondérés (MCP) supposent que la forme d’hétéroscédasticité est connue. C’est une méthode Réponse d’estimation différente qui permet d’avoir des écart-types n Les moindres carrés pondérés corrects en présence d’hétéroscédasticité. n Les écart-types robustes n Les écart-types robustes (ECH) ne changent pas la méthode d’estimation (on reste sur les MCO) mais ajuste la formule des écart-types. Cette méthode est surtout valable avec de grands échantillons, c’est pour ça que les MCP en valent la peine aussi. 8.3.2. Formules des écart-types robustes Question Données ) Quelle est la formule ajustée pour Soit la formule 𝑉𝑎𝑟 R Z𝛽9$ [ = A=. Cette formule est possible parce que R Z𝛽9$ [ ? 𝑉𝑎𝑟 99:( tous les 𝜎=%( sont les mêmes et peuvent donc être sortis de la somme. Réponse Ce n’est pas valable en hétéroscédasticité. ∑&@'$ 𝑟̂%@( 𝑢=%( Pour régler ce problème, White (1980) propose d’estimer 𝜎=%( par 𝑢=%( R Z𝛽9$ [ = 𝑉𝑎𝑟 (possible puisque espérance du carré = 0). Prend en compte la Z1 − 𝑅@( [𝑆𝑆𝑅@( corrélation entre les variables. ∑&@'$ 𝑟̂%@( 𝑢=%( R Z𝛽9$ [ = 𝑉𝑎𝑟 Z1 − 𝑅@( [𝑆𝑆𝑅@( - Numérateur : 𝑟̂%@( est le ieme résidu de la régression de xj sur toutes les autres variables explicatives (la partie non-expliquée par les autres variables de la jème variable) - Dénominateur : corrélation globale de la jème variable avec les autres variables explicatives. LECGE1316 – économétrie 49 Laetitia Parion M. Beine 2023 Question Données Qu’est-ce que HCSE ? HCSE ou 𝑟𝑜𝑏‹𝑠𝑑(𝛽9@ ) est l’écart-type de 𝛽9@ robuste à la présence d’hétéroscédastique. Réponse L’écart-type de 𝛽9@ robuste. Question Données Qu’est-ce que JHCSE (ou Jack- C’est un ajustement supplémentaire de leur formule : knife) ? ∑&@'$ 𝑟̂%@( 𝑢=%( 𝑛 R Z𝛽9$ [ = 𝑉𝑎𝑟 Réponse Z1 − 𝑅@( [𝑆𝑆𝑅@( 𝑛 −𝑘−1 R Z𝛽9$ [ 𝑉𝑎𝑟 Il tient compte du nombre de degrés de liberté. ∑&@'$ 𝑟̂%@( 𝑢=%( 𝑛 Quand on a un n très grand, le ratio est presqu’égal à 1. = Z1 − 𝑅@( [𝑆𝑆𝑅@( 𝑛 − 𝑘 − 1 8.3.3. Influence des écart-types robustes Question Données Que changent les écart-types - Les bêtas restent strictement identiques robustes ? - Les écart-types sont ajustés à le t-stat est modifié aussi (écart- type + faible, augmentation du t-stat), la p-valeur et l’intervalle Réponse de confiance aussi - Écart-types Si on voit que la différence entre les variances est faible, c’est que - T-stat l’hétéroscédasticité n’est pas un problème. Utiliser cette formule - P-valeur fonction aussi pour les cas d’homoscédasticité ; on peut donc - Intervalle de confiance prendre l’habitude d’utiliser cette formule dans tous les cas. Question Données Quel est le sens du biais de Il n’y a pas de biais systématique (vers le haut ou le bas), on peut l’estimation de la variance ? surestimer ou sous-estimer. Cependant, en moyenne, souvent quand il y a hétéroscédasticité, on a tendance à sous-estimer les écart- Réponse types. Pas systématique, mais en Interprétation : on aura tendance à rejeter les hypothèses nulles plus moyenne on sous-estime. souvent que ce qu’on devrait. 8.4. Tests d’hétéroscédasticité Question Données Remarque La théorie ne va jamais nous donner d’informations sur l’hétéroscédasticité. Elle informe sur les hypothèses à tester, Réponse éventuellement la forme fonctionnelle à utiliser, mais pas sur La théorie ne dit rien sur l’hétéroscédasticité. l’hétéroscédasticité LECGE1316 – économétrie 50 Laetitia Parion M. Beine 2023 8.4.1. F-Test d’hétéroscédasticité Question Données Quel est le test ? H0 : homoscédasticité Comme u a une espérance conditionnelle nulle (MLR.2), on a Réponse 𝑉𝑎𝑟(𝑢|𝑥) = 𝐸(𝑢( |𝑥) devient 𝐸(𝑢( ) = 𝜎 ( Il s’agit de prendre les résidus et de Si l’hypothèse est violée (hétéroscédasticité), alors 𝑢( est lié à une voir s’ils dépendent des x ou pas. des variables explicatives x. On va prendre 𝑢( et voir s’il dépend des x. Mais comme 𝑢( n’est pas observable, il faut prendre ses résidus et les mettre au carré (à𝑢=( ). Après ça, on pourra faire la régression. Cas où l’hypothèse nulle de coefficients delta conjoints sont égaux à 0 à test en F à partir de cette régression. Question Données Comment faire le f-test ? 1. Régression du modèle de base Remarque : il n’est pas nécessaire d’avoir des écart-types robustes Réponse puisqu’on ne s’intéresse pas à l’inférence de cette régression. On 1. Régression veut les résidus, qui dépendent des bêtas (qui ne changent pas avec 2. Résidus les écart-types robustes). 3. Résidus au carré 2. Predict resid, res 4. Régression auxiliaire 5. F-stat On sort de cette régression les résidus. 6. Comparaison 3. Gen resid2=resid*resid 𝑅

Use Quizgecko on...
Browser
Browser