Économétrie des variables qualitatives PDF

Summary

Ce document présente un cours sur l'économétrie des variables qualitatives. Il aborde les modèles de probabilité linéaire, les modèles logit et probit pour les réponses binaires, et les modèles polytomiques. Les concepts fondamentaux des variables qualitatives et des modèles économétriques sont expliqués.

Full Transcript

Économétrie des variables qualitatives Master 1, FASEST, UdL prof. Ukrayinchuk N....

Économétrie des variables qualitatives Master 1, FASEST, UdL prof. Ukrayinchuk N. 1 Modalité de contrôle des connaissances 16 h CM + 8 h TD Evaluation: Type d’évaluation Pondération Projet de groupe (travail en binôme) : Analyse économétrique 50% des données qualitatives Examen final : Test théorique et pratique couvrant l'ensemble du 50% cours (CM + TD) (1 heure) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 2 intellectuelle. N.Ukrayinchuk 1 Support de cours https://moodle.univ-lille.fr/ Nom du cours: Econométrie des Variables Qualitatives Introduction Nom du cours abregé: EVQ_INTRO Mot de passe: ordinal Inscription obligatoire Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 3 intellectuelle. N.Ukrayinchuk Plan du cours Introduction S1. Modèle de probabilité linéaire S2. Modèles logit et probit pour les réponses binaires S3. Modèles polytomiques Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 4 intellectuelle. N.Ukrayinchuk 2 S1. Qu’est-ce qu’une variable qualitative (VQ) ? Définition : VQ = variable qui :  représente des catégories ou des qualités plutôt que des valeurs numériques.  souvent utilisées pour décrire des attributs ou des caractéristiques  peuvent être divisées:  selon l’ordre des catégories : nominales (ou non-ordonnées) ou ordinales (ou ordonnée)  selon le nombre de modalités disponibles : dichotomiques (binaires) ou polytomiques Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 5 intellectuelle. N.Ukrayinchuk S1. Qu’est-ce qu’une variable qualitative (VQ) ? Variable dichotomique (binaire) : = n'a que deux modalités ou catégories. * "oui/non", "vrai/faux", "présent/absent" Variable politomique : = a plus de deux modalités. Elle peut être soit non-ordonnée, soit ordonnée. * "type de fruits préférés" (pomme, banane, orange, etc.) = politomique non-ordonnée * "niveau de satisfaction" (très insatisfait, insatisfait, neutre, satisfait, très satisfait) = politomique ordonée Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 6 intellectuelle. N.Ukrayinchuk 3 S1. Qu’est-ce qu’une variable qualitative (VQ) ? Variables nominales (non-ordonnéee) catégorisent des données sans ordre spécifique entre les catégories. *la couleur des yeux (bleu, vert, marron) ou le type de fruit (pomme, orange, banane) Variables ordinales (ordonnée) catégorisent des données avec un ordre ou un classement entre les catégories. * les niveaux d'éducation (baccalauréat, maîtrise, doctorat) ou les classements de satisfaction (insatisfait, neutre, satisfait) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 7 intellectuelle. N.Ukrayinchuk S1. Qu’est-ce qu’une variable qualitative (VQ) ? Modèle dichotomique Il est possible que le phénomène que l’on souhaite expliquer soit représenté par une variable dichotomique (ou binaire) Yi qui prend uniquement deux valeurs : 0 ou 1. * si l’on cherche à expliquer les déterminants de la participation au marché du travail, la variable dépendante vaut 1 si l’individu i travaille et 0 sinon. * On peut penser à d’autres exemples comme le fait de s’assurer, le fait d’obtenir un diplôme, d’être marié, etc,... ▶ Dans ce cas Y est une variable qualitative et non quantitative que l’on peut recoder 0 ou 1. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 8 intellectuelle. N.Ukrayinchuk 4 S1. Qu’est-ce qu’une variable qualitative (VQ) ? Modèles polytomiques Situation où la variable dépendante prend non pas deux modalités mais trois ou plus. Ordonnés : diverses modalités peuvent aussi avoir un ordre naturel. * modéliser la santé auto-déclarée d’un individu où la variable dépendante peut prendre cinq modalités (en très mauvaise santé, en mauvaise santé, en moyenne santé, en bonne santé et en très bonne santé). Non-ordonnés : * analyser le choix entre divers modes de transport (avion, voiture, train) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 9 intellectuelle. N.Ukrayinchuk S1. Modèle économique vs économétrique Qu'est-ce que l'économétrie ?  L'économétrie = utiliser des méthodes statistiques pour analyser des données économiques.  Les économétriciens travaillent généralement avec des données non expérimentales. Objectifs de l'analyse économétrique :  Estimer les relations entre les variables économiques (les effets causals)  Tester les théories et hypothèses économiques  Évaluer les politiques gouvernementales et commerciales Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 10 intellectuelle. N.Ukrayinchuk 5 S1. Modèle économique vs économétrique Étapes de l'analyse économétrique :  Modèle économique (cette étape est souvent omise, mais la théorie est importante)  Modèle économétrique Modèles économiques La modélisation économique formelle est parfois le point de départ de l'analyse empirique, mais il est plus courant d'utiliser la théorie économique de manière moins formelle, voire de se fier à l'intuition — raisonnable basée sur le bon sens. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 11 intellectuelle. N.Ukrayinchuk S1. Modèle économique vs économétrique Modèle économique du crime (Becker, 1968) Equation de l'activité criminelle basée sur la maximisation de l'utilité La forme fonctionnelle de la relation n'est pas spécifiquement précisée. L'équation aurait pu être proposée sans recours à la modélisation économique Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 12 intellectuelle. N.Ukrayinchuk 6 S1. Modèle économique vs économétrique Après avoir spécifié un modèle économique, il faut le transformer en ce que l'on appelle un modèle économétrique. Comment un modèle économétrique se rapporte-t-il à un modèle économique ?  La forme de la fonction f(.) doit être spécifiée au préalable.  Les variables peuvent devoir être approximées par d'autres quantités mesurables Comment traiter les variables qui ne peuvent pas être observées?: * le salaire qu'une personne pourrait gagner par une activité criminelle * la probabilité d'être arrêté. * il y a de nombreux autres facteurs que nous ne pouvons même pas identifier, encore moins observer, mais que nous devons tout de même prendre en compte d'une manière ou d'une autre Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 13 intellectuelle. N.Ukrayinchuk S1. Modèle économique vs économétrique Modèle économique du crime The choice of these variables is determined by the economic theory as well as data considerations Nous ne pouvons jamais éliminer complètement le terme "u" ! Gérer ce terme d'erreur ou de perturbation est sans doute l'aspect le plus crucial de toute analyse économétrique. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 14 intellectuelle. N.Ukrayinchuk 7 S1. Le Modèle de Probabilité Linéaire Que se passe-t-il si la variable dépendante est une variable binaire Nous cherchons à expliquer l'issue d'un événement oui/non ou zéro/un. * la participation des femmes mariées au marché du travail * nous voulions savoir si une personne est arrêtée pour un crime au cours d'une période donnée Dans ces situations, la variable y que nous cherchons à expliquer est une variable binaire. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 15 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Comment interpréter le modèle suivant lorsque y est binaire ? y peut uniquement être 0 ou 1. * Supposons que β1=0,35 et que x1 = éducation. Que signifie une augmentation d'une année d'éducation associée à une augmentation de y de 0,35 ? Le même problème se pose avec d'autres variables discrètes non binaires * y= le nombre d'arrestations ou y= le nombre d'enfants. On ne peut pas avoir une fraction d'un enfant. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 16 intellectuelle. N.Ukrayinchuk 8 S1. Le Modèle de Probabilité Linéaire Puisque y ne peut prendre que deux valeurs, βj ne peut pas être interprété comme le changement de y en raison d'une augmentation d'une unité de xj, en maintenant tous les autres facteurs constants. y change : soit de zéro à un, soit d'un à zéro, soit ne change pas du tout Néanmoins, les βj ont toujours des interprétations utiles. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 17 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Si nous supposons que l'hypothèse de la moyenne conditionnelle nulle est vérifiée: alors, l'espérance de y est donné par : où x = le vecteur (x1, x2, …, xk). βj peut être interprété comme , en maintenant les autres variables explicatives constantes. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 18 intellectuelle. N.Ukrayinchuk 9 S1. Le Modèle de Probabilité Linéaire Le point clé : lorsque y = une variable binaire ( = 0 ou =1), il est toujours vrai que la probabilité de « succès » - càd la probabilité que y=1 - est égale à la valeur espérée de y. Le modèle de probabilité linéaire (MPL) La probabilité de succès (appelée la probabilité de réponse), p(x)=P(y=1∣x), = une fonction linéaire des variables xj !!! Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 19 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire AINSI: Dans un modèle où Y est quantitatif, l’objectif = estimer sa valeur espérée ou moyenne en fonction des x → (E(y|x). (x peuvent être à la fois quantitatifs et qualitatifs) Dans les modèles où Y est qualitatif, l’objectif = estimer la probabilité d’un événement spécifique *posséder une maison, appartenir à un syndicat, participer à un sport, etc. Ainsi, les modèles à réponse qualitative sont souvent appelés modèles de probabilité. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 20 intellectuelle. N.Ukrayinchuk 10 S1. Le Modèle de Probabilité Linéaire Le point important : tous les effets partiels portent sur la probabilité que y = 1 c'est la seule probabilité que nous avons besoin puisque comme la somme des probabilités = 1, P(y=0∣x)=1−P(y=1∣x) qui est aussi une fonction linéaire des variables xj Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 21 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Dans le MPL, βj = le changement de la probabilité de succès lorsque xj change, en maintenant les autres facteurs constants : Le modèle de régression multiple nous permet d'estimer l'effet de différentes variables explicatives sur des événements qualitatifs. La mécanique des moindres carrés ordinaires (MCO) reste la même que dans le cas classique des variables continues Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 22 intellectuelle. N.Ukrayinchuk 11 S1. Le Modèle de Probabilité Linéaire Si nous écrivons l'équation estimée ( = la droite de régression des MCO) comme = la probabilité de succès estimée = la probabilité de succès estimée lorsque toutes les valeurs xj = zéro = la variation de la probabilité de succès estimée lorsque , tous les autres facteurs constants. !! Comme dans toute application de régression, nous pouvons inclure des variables explicatives sous forme de logarithmes, de termes quadratiques, d'interactions et de régresseurs binaires (variables indicatrices, dummy) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 23 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Exemple : Participation des femmes mariées au marché du travail en 1975 La variable inlf est  = 1 si une femme a travaillé pour un salaire au cours d'une année donnée,  = 0 sinon. Un MPL pour analyser l'impact des différents facteurs sur la probabilité d'être active sur le marché du travail. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 24 intellectuelle. N.Ukrayinchuk 12 S1. Le Modèle de Probabilité Linéaire Exemple : Participation des femmes mariées au marché du travail en 1975 Autres Revenus du ménage (mesurés en milliers de dollars) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 25 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Exemple : Participation des femmes mariées au marché du travail en 1975 Toutes les variables, à l'exception de kidsge6, sont statistiquement significatives Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 26 intellectuelle. N.Ukrayinchuk 13 S1. Le Modèle de Probabilité Linéaire Exemple : Participation L'équation estimée : des femmes mariées au marché du travail en 1975 Remarque : Ce sont les statistiques t habituelles de la MCO, bien que nous montrerons qu'elles ne sont pas tout à fait valides. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 27 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Exemple : Participation L'équation estimée : des femmes mariées au marché du travail en 1975 Toutes les variables significatives montrent des effets (signes) conformes à ce que l'on pourrait attendre selon la théorie économique (ou le bon sens) Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 28 intellectuelle. N.Ukrayinchuk 14 S1. Le Modèle de Probabilité Linéaire Exemple : Participation L'équation estimée : des femmes mariées au marché du travail en 1975 Interprétation de coefficients : se rappeler qu'un changement dans la variable indép. modifie P(inlf=1) Le coefficient de educ → toutes choses égales par ailleurs, une année supplémentaire d’éducation augmente la probabilité de participation au marché du travail de 0,038. 10 années supplémentaires d’éducation augmenteraient cette probabilité de 0,038 × 10 = 0,38 = une augmentation assez importante. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 29 intellectuelle. N.Ukrayinchuk S1. Le Modèle de Probabilité Linéaire Exemple : Participation Figure 1: Probabilité de des femmes mariées au participation au marché marché du travail en 1975 du travail des femmes et l'éducation Autres var. indép. fixées à des valeurs spécifiques (plus réalistes que =0) : nwifeinc = 50, exper = 5, age = 30, kidslt6 = 1, kidsge6 = 0 Ordonnée = -0,146 ≠ Const = 0,585 P(inlf=1)16 1 des 𝑤𝑖 sont négatifs. Impossible d’utiliser ces observations dans le cadre des MCP Le nombre d'observations, passe de 40 à 28. Après avoir omis ces Pour éviter la perte de degrés de liberté, il est possible de fixer 𝑌𝑖=0,01 observations, la régression lorsque les 𝑌𝑖 ≤ 0, et 𝑌𝑖=0,99 lorsque 𝑌𝑖 ≥ 1 (car division par 0 impossible) MCP peut être réalisée. Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 63 intellectuelle. N.Ukrayinchuk S1. Limites du MPL Exemple : Accès à la propriété (avec MPL) Comparé aux MCO, les écarts types estimés sont plus faibles et, en conséquence, les MCP pour 28 observations statistiques t estimées (en valeur absolue) sont plus grandes. Cependant, prudence! : 12 observations ont dû être supprimées ! + Les wi sont estimés = les procédures usuelles de tests d'hypothèses statistiques ne sont, à strictement parler, valides que pour les grands échantillons Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 64 intellectuelle. N.Ukrayinchuk 32 S1. Limites du MPL Pour conclure: Avant la disponibilité de logiciels accessibles pour estimer les modèles logit et probit, le modèle de probabilité linéaire était largement utilisé en raison de sa simplicité. Cependant, certains l'utilisent encore, donc prudence est de mise ! Toute reproduction ou diffusion, partielle ou totale, sont interdites et constituent une contrefaçon sanctionnée par les articles L.335-2 et suivants du code de la propriété 65 intellectuelle. N.Ukrayinchuk 33

Use Quizgecko on...
Browser
Browser