Module 3 Analyse causale - Printemps 2024 HEC Lausanne PDF
Document Details
Uploaded by BuoyantComputerArt
HEC Lausanne, UNIL
2024
Marius Brülhart, Jan-Erik Meidell
Tags
Summary
This document is a module on causal analysis from HEC Lausanne, UNIL for Spring 2024. It covers topics like correlation and causality, potential outcomes, and quasi-experimental methods. The module is part of a regression and causal analysis course.
Full Transcript
HEC Lausanne Module 3 Analyse causale Cours : Régression et analyse causale (“Statistique II”)...
HEC Lausanne Module 3 Analyse causale Cours : Régression et analyse causale (“Statistique II”) Printemps 2024 Bachelor 1ère année, HEC Lausanne, UNIL Marius Brülhart, Jan-Erik Meidell Régression et analyse causale Module 3 1 / 41 HEC Lausanne 1 Corrélation et causalité 2 Résultats potentiels et effets de traitement 3 Méthodes quasi-expérimentales 4 L’étude d’évènement Régression et analyse causale Module 3 2 / 41 Corrélation et causalité Corrélation ou relation causale ? HEC Lausanne Est-ce que manger du chocolat rend Est-ce que le vaccin Covid-19 intelligent ? diminue la transmission du virus ? Source : Messerli, F.H. (2008) Chocolate Consumption, Source : Polack, F.P., et al. (2020) Safety and Efficacy of the Cognitive Function and Nobel Laureates. New England Journal BNT162b2 mRNA Covid-19 Vaccine. New England Journal of of Medicine, 367(16): 1562-1564. Medicine, 383(27): 2603-2615. Régression et analyse causale Module 3 3 / 41 Corrélation et causalité Quelle est la différence? HEC Lausanne Corrélation / fouille de données (data mining) : I But: Ajuster une fonction liant ≤ 2 variables à des données. I Exemples: Est-ce que cette personne souffre d’une maladie cardiaque ? Quelle sera le taux de croissance économique de l’année prochaine ? Quelle est la traduction chinoise de cette page ? I Principe: Détecter des régularités dans les données. I Approche qui sous-tend l’apprentissage automatique (machine learning) et l’intelligence artificielle Inférence causale : I But: Identifier comment un choix effectué a affecté le résultat. Utiliser ce constat pour prédire les conséquences d’un choix semblable futur. I Exemples: Que se passera-t-il si je prends ce médicament ? Comment évoluera le PIB si la BNS augmente son taux d’intérêt ? Comment les contribuables réagissent-ils à une baisse de l’impôt sur la fortune ? I Principe: Estimer des scénarios contrefactuels (les choix non effectués). I Approche qui sous-tend l’évaluation de politiques publiques et de stratégies managériales Régression et analyse causale Module 3 4 / 41 Corrélation et causalité Exemple : offre et demande HEC Lausanne Le modèle de base d’une économie de marché : offre et demande. Modèle utile pour analyser les effets d’une intervention sur le marché (p.ex. conséquences sur les prix d’un droit de douane). Une telle analyse nécessite qu’on connaı̂t la forme des courbes d’offre et de demande, exprimée typiquement par des élasticités. Si nous traçons dans les données la relation entre prix et quantités, p.ex. via une régression MCO, nous estimons une relation d’équilibre et non une relation causale. Il serait faux de dire que les prix et les quantités se “causent” mutuellement. Afin d’estimer séparemment les élasticités d’offre et de demande, il faut trouver une astuce permettant de varier une des deux courbes ent maintenant inchangée l’autre. Il faut trouver une “expérience naturelle” dont il est plausible qu’elle n’affecte qu’une des deux courbes. Régression et analyse causale Module 3 5 / 41 Résultats potentiels et effets de traitement Situation effective et situation contrefactuelle HEC Lausanne Un effet causal peut être défini comme la comparaison de deux situations : I la situation effective, et I la situation contrefactuelle. Exemples : I Situations effectives : F L’évolution de mon mal de tête après avoir pris un médicaement. F L’évolution de la quantité vendue suite à une baisse du prix. F L’évolution de l’économie britannique depuis le “Brexit”. I Situations contrefactuelles : F L’évolution de mon mal de tête si je n’avais pas pris le médicaement. F L’évolution de la quantité vendue en l’absence d’une baisse du prix. F L’évolution de l’économie britannique s’il n’y avait pas eu le “Brexit”. Effet causal = différence entre les deux situations Les situations contrefactuelles sont hypothétiques et ne peuvent donc pas être connues avec certitude. Régression et analyse causale Module 3 6 / 41 Résultats potentiels et effets de traitement Traitements HEC Lausanne L’analyse causale s’intéresse typiquement à des variables indépendantes résultant d’un choix (“traitements”). Ces choix peuvent être effectués par des individus ou par des groupes d’individus (p.ex. ménages, firmes, gouvernements). Les traitements peuvent être binaires ou continus. I Exemples de traitements binaires : F Prendre ou ne pas prendre un médicament (individu). F Reprendre ou ne pas reprendre une autre entreprise (direction d’une firme). F Augmenter ou non le taux d’intérêt (directoire de la banque centrale). I Exemples de traitements continus : F Dosage d’un médicament sur une année (individu). F Part du bénéfice à distribuer sous forme de dividende (direction d’une firme). F Niveau du salaire minimum (gouvernement). Régression et analyse causale Module 3 7 / 41 Résultats potentiels et effets de traitement Notation pour l’analyse de “résultats potentiels” HEC Lausanne Par souci de simplicité, considérons des traitements binaires. Deux résultats potentiels (du point de vue ex ante) : I Yi0 si l’unité i ne reçoit pas le traitement I Yi1 si l’unité i reçoit le traitement Seul un des deux résultats est observé, Yi. L’autre est le résultat contrefactuel. Lequel des résultats potentiels est observé dépend de si i reçoit le traitement ou non. Cela est déterminé par la variable binaire Di : I Di = 0 si l’unité i ne reçoit pas le traitement I Di = 1 si l’unité i reçoit le traitement Equation d’attribution : Yi = Di Yi1 + (1 − Di )Yi0 Effet de traitement: δi = Yi1 − Yi0 → paramètre d’intérêt ! Difficulté : Seul un des deux résultats est observable ⇒ δ ne peut être calculé et doit donc être estimé. Régression et analyse causale Module 3 8 / 41 Résultats potentiels et effets de traitement Trois effets de traitement différents HEC Lausanne Effet de traitement moyen (Average Treatment Effect) : I ATE = E [δi ] = E [Yi1 ] − E [Yi0 ] Effet de traitement moyen pour le groupe traité : I ATT = E [δi | Di = 1] = E [Yi1 | Di = 1] − E [Yi0 | Di = 1] Effet de traitement moyen pour le groupe non traité : I ATU = E [δi | Di = 0] = E [Yi1 | Di = 0] − E [Yi0 | Di = 0] Di distribué parfaitement aléatoirement ⇔ ATE = ATT = ATU. Si les agents qui font l’objet de l’étude ont une quelconque influence sur Di , on dit que le traitement est endogène, et ATE 6= ATT 6= ATU. Régression et analyse causale Module 3 9 / 41 Résultats potentiels et effets de traitement Traitement endogène HEC Lausanne Comment est-ce que les agents peuvent-ils avoir un choix par rapport à Di , même dans des contextes expérimentaux ? Exemples : I Nécessité de participation active/régulière pour expériences médicales. I Dans des exépriences économiques, p.ex. pour évaluer l’effet d’une formation professionnelle, certaines personnes seront plus assidues que d’autres. Dans des contextes non expérimentaux, donc avec des données observationnelles, l’endogénéité de Di est encore plus prévalente. Exemples : Les firmes ne décident pas de façon aléatoire de la reprise d’autres I entreprises. I Les banques centrales ne décident pas de façon aléatoire d’augmenter ou non le taux d’intérêt. ⇒ L’attribution du traitement Di n’est pas aléatoire à travers les firmes/banques i. Régression et analyse causale Module 3 10 / 41 Résultats potentiels et effets de traitement Exemple Statville (1) HEC Lausanne Supposons que la syndique Supposons que nous sommes cherche à savoir comment omniscients (6= syndique) et évoluent les effectifs de firmes connaissons donc les résultats familiales après que leurs potentiels pour les 10 firmes : propriétaires suivent un programme MBA de HEC Lausanne. Elle a les moyens d’observer 10 firmes, sélectionnées au hasard. Certaines firmes pourraient être amenées à rationnaliser leur personnel, tandis que d’autres découvriront des stratégies ATE (inconnu) de l’échantillon : d’expansion. Avec ces “effets ATE = Ȳ 1 − Ȳ 0 = 0.6 hétérogènes”, quel sera l’effet moyen d’un MBA? Régression et analyse causale Module 3 11 / 41 Résultats potentiels et effets de traitement Exemple Statville (1, suite) HEC Lausanne Supposons que les propriétaires Attribution du traitement : des firmes ont une idée intuitive mais correcte de s’ils sont en sur-effectif ou en sous-effectif, même avant de s’inscrire au MBA. Supposons aussi que ceux qui se sentent en sous-effectif choisissent de suivre le MBA, p.ex. parce qu’ils cherchent à se former en management RH. Dans ce scénario, l’attribution Estimateur naı̈f (“simple du traitement Di est différence”) : parfaitement endogène, car [Ȳi | Di = 1] − [Ȳi | Di = 0] entièrement déterminée par le résultat potentiel. = -0.4 Régression et analyse causale Module 3 12 / 41 Résultats potentiels et effets de traitement Simple différence : estimateur biaisé HEC Lausanne Une comparaison naı̈ve des moyennes des groupes traité/non traité ferait croire que le MBA induirait les firmes à réduire leurs effectifs de 0.4 postes en moyenne. Pourtant, selon le vrai ATE de cet échantillon, faire un MBA amènerait les firmes à augmenter leur effectifs par 0.6 postes en moyenne. L’estimateur basé sur la simple différence des deux moyennes est biaisé dans cet exemple, parce que l’attribution du traitement est endogène (dépend des résultats potentiels). Précisément, le biais a deux composantes : I Biais de sélection : existe lorsqu’il y a des différences systématiques des résultats potentiels en l’absence de traitement (Yi0 ) entre les unités traitées (Di = 1) et les unités non traitées (Di = 0). I Bias dû à un effet de traitement hétérogène : existe lorsqu’il y a des différences systématiques des effets de traitement potentiels entre les unités traitées (ATT ) et les unités non traitées (ATU). Régression et analyse causale Module 3 13 / 41 Résultats potentiels et effets de traitement Simple différence : estimateur biaisé (suite) HEC Lausanne Décomposition formelle : non observé z }| { E [Y 1 | D = 1] − E [Y 0 | D = 0] = E [Y 1 ] − E [Y 0 ] | {z } | {z } simple différence des moyennes ATE non observé z }| { + (E [Y | D = 1] − E [Y 0 | D = 0]) 0 | {z } biais de séléction non observé z }| { + (1 − π)(ATT − ATU) , | {z } bias dû à un effet de traitement hétérogène P i Di où π =. n Régression et analyse causale Module 3 14 / 41 Résultats potentiels et effets de traitement Exemple Statville (2) HEC Lausanne Si on connaissait les résultats potentiels (p. 11), alors on pourrait chiffrer la décomposision pour cet échantillon : 7.0 − 7.4 | {z } − 5.0} = |5.6 {z simple différence des moyennes = −0.4 ATE = 0.6 + (2.6 − 7.4) | {z } biais de séléction = −4.8 + (1 − 0.5)(4.4 − (−3.2)) | {z } bias dû à l’effet de traitement hétérogène = 3.8 En réalité, on connaı̂t les résultats observés mais pas les résultats contrefactuels. On ne peut donc pas chiffrer la décomposition. Si les effets étaient homogènes, δi = δ∀i, alors ATT = ATU, et le 2e biais n’existerait pas. Que faire pour obtenir une estimation non biaisée de ATE ? Régression et analyse causale Module 3 15 / 41 Résultats potentiels et effets de traitement L’hypothèse d’indépendance HEC Lausanne Supposons que le traitement soit attribué de manière indépendante ⊥ (Y 1 , Y 0 ) des résultats potentiels : D ⊥ L’indépendance implique qu’en moyenne les deux groupes, traité et non traité, ont les mêmes résultats potentiels. Dans l’exemple Statville, cela signifie que la décision par les propriétaires de s’inscrire ou non au MBA est complètement indépendante des effectifs de leurs entreprises ainsi que de leur anticipation quant au changement de ces effectifs. I Si les propriétaires et/ou la directrice du MBA décident de qui participe au programme MBA, alors cette hypothèse sera très pobablement violée. Solution : “randomiser” Régression et analyse causale Module 3 16 / 41 Résultats potentiels et effets de traitement La randomisation HEC Lausanne Une attribution aléatoire du traitement permet d’éliminer les deux sources de biais de l’estimateur des simples différences (p. 14): I Biais de séléction : E [Y 0 | D = 1] − E [Y 0 | D = 0] = 0 I Bias dû à un effet de traitement hétérogène : ATT − ATU = E [Y 1 | D = 1] − E [Y 0 | D = 1] − E [Y 1 | D = 0] − E [Y 0 | D = 0] =0 Solution : la randomisation I Par exemple, on pourrait attribuer les places dans le MBA par une lotterie (si on suppose que tous les propriétaires sont intéressés à suivre le programme). Régression et analyse causale Module 3 17 / 41 Résultats potentiels et effets de traitement Inférence par rapport à la randomisation HEC Lausanne Statville: Histogramme de 10 000 simples différences entre firmes avec MBA et firmes sans MBA, [Ȳ | D = 1] − [Ȳ | D = 0], où Di | π = 0.5 est réattribué de façon aléatorie à chaque itération : La distribution est centrée autour du vrai ATE pour cet échantillon. Il reste la variation dûe à l’aléa de l’attribution du traitement (en plus de l’aléa dû à l’aléa d’échantillonnage). ⇒ Les méthodes inférentielles doivent tenir compte des deux sources de variabilité aléatoire. Régression et analyse causale Module 3 18 / 41 Résultats potentiels et effets de traitement SUTVA HEC Lausanne Pour que la simple différence entre moyennes soit un estimateur non biaisé du ATE , la andomisation n’est pas une conditions suffisante. Condition supplémentaire : “Stable Unit Treatment Value Assumption” Trois composantes : 1 La “dose du traitement” est identique pour toutes les unités traitées 2 Absence d’externalitiés dûes au traitement entre les unités 3 Absence d’effets d’équilibre général Ces conditions se traduisent de façon suivante dans le contexte de notre exemple Statville : 1 Faire un MBA est une expérience identique pour tous les participants en termes de durée, de contenu, etc. 2 Le fait qu’un propriétaire d’entreprise particulier fasse le MBA n’affecte pas les décision d’autres propriétaires (absence d’effets de réseau). 3 Si le MBA amène certaines firmes à changer leurs effectifs, cela n’affectera pas l’équilibre du marché de travail de Statville (salaire moyen). Régression et analyse causale Module 3 19 / 41 Méthodes quasi-expérimentales Données observationnelles HEC Lausanne Des expériences parfaitement randomsiées restent rares en économie en management. La plupart des études empiriques sont de nature “observationnelle”. Exemples : I Estimer l’effet de programmes de formation sur la réinsertion professionnelle des chômeurs. I Estimer l’effet de l’aide au développment sur le taux de pauvreté. I Estimer l’effet de la maternité sur la progression salariale des femmes. L’attribution du traitement ne pourra être purement aléatoire. Mais elle pourrait être “quasi aléatoire”, étant donnée les valeurs de certaines varaibles observables. Exemples : I Programmes de formation attribués de manière quasi-aléatoire (en fonction de la disponibilité de places) par région. I Au niveau des pays destinataires, les paiements d’aide au développement pourraient être quasi-aléatoires entre les pays avec un revenu par tête similaire. I Le fait de devenir mère pourrait être quasi-aléatoire pour des femmes d’une certaine classe d’age et de revenu. Régression et analyse causale Module 3 20 / 41 Méthodes quasi-expérimentales L’hypothèse d’indépendance conditionnelle HEC Lausanne Indépendance conditionnelle : D ⊥⊥ (Y 1 , Y 0 ) | X , où X représente une ou plusieurs variables observées On peut estimer un modèle de régression linéaire multiple de Y par rapport à D et X1 , X2 ,..., XK : Yi = β0 + β1 Di + β2 X1,i +... + βXK ,i + i. La variable de traitement, D, n’est donc qu’une parmi plusieurs vairables indépendantes. On appelle les autres variables indépendantes, X , les “variables de contrôle”. b1 : effet de traitement estimé; effet d’un changement de Di de 0 à 1 La variable de traitement peut aussi être continue. Dans ce cas, Di représente l’intensité du traitement, ou la “dose du traitement”. Régression et analyse causale Module 3 21 / 41 Méthodes quasi-expérimentales L’hypothèse d’indépendance conditionnelle (2) HEC Lausanne Problème fréquent : Toute variable Xk peut elle-aussi être endogène, et corrélée avec D (violation de la 2e des 5 hypothèses qui sous-tendent l’estimation des modèles de régression par les MCO, voir Module 2). I Exemple : Le revenu par tête dans une régression du taux de pauvreté par rapport au montant d’aide au développement risque d’être endogène, pusique les taux de pauvreté et le revenu par tête s’influencent mutuellement. Solution possible : utiliser des variables instrumentales (méthode qui sera présentée ultérieurement, dans les cours d’économétrie). Régression et analyse causale Module 3 22 / 41 Méthodes quasi-expérimentales John Snow et la double différence HEC Lausanne Une façon d’obtenir des estimation causale peut être en appliquant l’estimateur de la double différence (difference-in-differences). La plus célèbre application de cet estimateur, et peut-être la plus importante, remonte à John Snow (1813-1858), médecin à Londres. Snow doutait la théorie dominante de son époque, selon laquelle le choléra était transmis par la voie respiratoire. Régression et analyse causale Module 3 23 / 41 Méthodes quasi-expérimentales John Snow et la double différence (suite) HEC Lausanne En pratiquant la médecine, Afin de tester son hypothèse, Snow developpa l’hypothèse que Snow collectionna des données le cholera était transmis par la sur les décès dûs au choléra dans matière fécale transporté par le différents quartiers de Londres. réseau d’eau. En 1854, il compta 147 décès par 10 000 ménages dans les quartiers desservis par la “Southwark and Vauxhall water company” (SV, en bleu), mais seulement 19 décès par 10 000 ménages dans les quartiers desservis par la “Lambeth water company” (L, en rouge). Comment expliquer cette différence considérable ? Régression et analyse causale Module 3 24 / 41 Méthodes quasi-expérimentales John Snow et la double différence (suite) HEC Lausanne Snow formula l’hypothèse selon laquelle la différence était dûe à la propreté/saleté de l’eau distribée par les deux fournisseurs. Toute l’eau distribuée à Londres provenait de la Tamise. Mais les condiutes desservant les ménages des quartiers L collectionnèrent l’eau en amont de la ville, où elle était encore relativement propre, tandis que les conduites desservant les ménages des quartiers SV l’eau en aval de la ville, où elle était polluée par les effluents. Snow disposait donc d’une estimation en simple différence : Les quartiers avec l’eau polluée (SV) avaient souffert presque 8 (≈ 147/19) plus de décès liés au choléra que les quartiers avec l’eau propre (L). Q.E.D. ? Non ! Régression et analyse causale Module 3 25 / 41 Méthodes quasi-expérimentales John Snow et la double différence (suite) HEC Lausanne Limitation de l’estimation en simple différence : le traitement (eau propre) n’était pas attribué aux ménages de façon aléatoire ; donc l’hypothèse d’indépendance fut très probablement violée. Par exemple, la densité urbaine était inférieure dans les quartiers L comparée aux quartiers SV : la propreté de l’eau corrélait avec la faible densité des habitations. Donc, un taux de mortalité inférieur en L pouvait être expliqué par l’hypothèse de Snow liée à la propreté de l’eau (H1 ) tout comme par l’hypothèse dominante de l’époque selon laquelle les pathogènes étaient transmis dans l’air (H0 ). La solution géniale de Snow : Il avait déjà collectionné des données comparables en 1849, quand les deux fournisseurs d’eau avaient encore obtenu leur eau du même endroit en aval de la ville. Il lui était dès lors possible de comparer les variations des taux de mortalité, c.à d. il pouvait effectuer une estimation en double différence. Régression et analyse causale Module 3 26 / 41 Méthodes quasi-expérimentales John Snow et la double différence (suite) HEC Lausanne Les taux de mortalité liés au choléra en 1849 avaient été de 135 par 10 000 ménages à SV, et de 85 par 10 000 ménages à L. L avait donc connu un taux de moralité inférieur à SV même lorsque leur eau était provenue du même endroit (pollué par les effluents). Cette différence pourrait avoir été dûe à des différences structurelles entre les quartiers (pyramide des âges, offre médicale, etc.). Mais il n’y avait qu’une explication plausible pour les différences dans la variation de la mortalité entre 1849 et 1854 : le déplacement de la source d’approvisionnement d’eau de L vers une point en amont de la ville. Régression et analyse causale Module 3 27 / 41 Méthodes quasi-expérimentales John Snow et la double différence (suite) HEC Lausanne Estimation en double différence de l’effet du changement d’approvisionnement à L : ATTDiD = ∆YL − ∆YSV = (YL,1854 − YL,1849 ) − (YSV,1854 − YSV,1849 ) = (19 − 87) − (147 − 135) = −80 Q.E.D. Source: Caniglia E., Murray, E. (2021) Difference-in-Differences in the Time of Cholera: A Gentle Introduction for Epidemiologists. Current Epidemiology Reports, 7(4):203-211. Régression et analyse causale Module 3 28 / 41 Méthodes quasi-expérimentales L’estimateur de la double différence HEC Lausanne L’étude de John Snow est un exemple d’une analyse en double différence 2 × 2 : I groupe traité : T I groupe non traité : U I période pré- et post-traitement pour le groupe traité : pre(T ), post(T ) I période pré- et post-traitement pour le groupe non traité : pre(U), post(U) Estimateur: ATTDiD = δ̂DiD = ȳTpost − ȳTpre − ȳUpost − ȳUpre Régression et analyse causale Module 3 29 / 41 Méthodes quasi-expérimentales L’estimateur de la double différence (suite) HEC Lausanne On peut écrire cela sous forme d’espérances conditionnelles des résultats potentiels : ATTDiD = (E [YT | Post] − E [YT | Pre]) − (E [YU | Post] − E [YU | Pre]) = E [YT1 | Post] − E [YT0 | Pre] − E [YU0 | Post] − E [YU0 | Pre] | {z } équation d’attribution + E [YT0 | Post] − E [YT0 | Post] | {z } additionner zéro = E [YT1 | Post] − E [YT0 | Post] | {z } ATT + E [YT0 | Post] − E [YT0 | Pre] − E [YU0 | Post] − E [YU0 | Pre] | {z } biais dû aux tendances non parallèles Régression et analyse causale Module 3 30 / 41 Méthodes quasi-expérimentales La condition des tendances parallèles HEC Lausanne La dérivation à la page précédente démontre que l’estimateur de la double différence n’est sans bias que si la condition des tendances parallèles est satisfaite. Selon cette condition, la variation du résultat moyen du groupe traité en absence du traitement aurait changé de la même manière que celui du groupe non traité : E [∆YT0 ] = E [∆YU0 ]. La condition des tendances parallèles est illustrée par la ligne bleue en tirets du graphique à la page 28. Hélas, le résultat moyen du groupe traité en absence du traitement, E [∆YT0 ], est un résultat contrefactuel est donc non observé. Que faire ? Régression et analyse causale Module 3 31 / 41 L’étude d’évènement La condition des tendances parallèles (suite) HEC Lausanne Rappelons la décomposition de l’estimateur de la double différence : ATTDiD = E [YT1 | Post] − E [YT0 | Post] | {z } ATT + E [YT0 | Post] − E [YT0 | Pre] − E [YU0 | Post] − E [YU0 | Pre] | {z } bias dû aux tendances non parallèles Nous aimerions estimer l’ATT , mais l’estimateur est biaisé quand le deuxième terme n’est pas égal à zéro. Régression et analyse causale Module 3 32 / 41 L’étude d’évènement La condition des tendances parallèles (suite) HEC Lausanne La condition des tendances parallèles peut être décomposée en deux parties. (A) Tendances parallèles contrefactuelles : E [YT0 | Post] − E [YT0 | Pre] = E [YU0 | Post] − E [YU0 | Pre] I On peut aussi écrire cette condition sous forme d’indépendance conditionnelle : [Y 0 | Post] − [Y 0 | Pre] | X ⊥⊥D I Condition moins contraignante que celle nécessaire pour la validité de l’estimateur de la simple différence : (Y 1 , Y 0 ) | X ⊥ ⊥D (B) Absence d’effets pré-traitement : E [YT1 | Pre] − E [YT0 | Pre] = 0 I Cette condition peut être violée p.ex. si les agents traités réagiessent au traitement de façon anticipée. Régression et analyse causale Module 3 33 / 41 L’étude d’évènement L’étude d’évènement HEC Lausanne La condition des tendances parallèles ne peut être vérifiée empiriquement, puisqu’elle dépend d’un résultat potentiel non observable (comment YT aurait évolué en l’absence du traitement). Une solution répandue est de considérer des données pour plusieurs périodes pré-traitement, et de vérifier si les moyennes des groupes traité et non traité, ȲT et ȲU , avait évolué en parallèle durant ce temps précédant le traitement. D’habitude on considère aussi des données pour plusieurs périodes post-traitement. En traçant l’évolution de YT − YU avant et après l’activation du traitement, on obtient une “étude d’évènement”. Régression et analyse causale Module 3 34 / 41 L’étude d’évènement L’étude d’évènement (suite) HEC Lausanne Des études d’évènement avec des tendances pré-traitement parallèles peuvent fournir des estimations causales persuasives, entre autres parce qu’elles se prêtent à une simple représentation graphique. Du point de vue formel, cependant, des tendances pré-traitement parallèles ne sont ni une condition nécessaire ni une condition suffisante pour une estimation non biaisée de l’effet de traitement, puisqu’elle n’exluent pas une attribution endogène du traitement. ⇒ Interprétation critique avisée : les circonstances institutionnelles/historiques/pratiques qui sous-tendend les données analysées sont cruciales, et leur compréhension ne peut pas être remplacée par une analyse purement statistique. I Est-il plausible de supposer que le traitement fut attribué de façon quasi-aléatoire ? I Est-il plausible de supposer que la SUTVA est respectée ? Régression et analyse causale Module 3 35 / 41 L’étude d’évènement Étude d’évènement : l’impôt sur la fortune HEC Lausanne Observation 1: Les gens cherchent à minimiser leur facture d’impôt. Observation 2: Afin d’estimer les conséquences de réformes fiscales, il est important de connaı̂tre l’ampleur de tels comportements. Question de recherche globale : En quelle mesure est-ce que l’assiette fiscale réagit à des variations du taux d’impôt (p.ex. via des déménagements des contribuables ou via l’évasion fiscale) ? Question de recherche spécifique : En quelle mesure est-ce que la fortune déclarée réagit à des variations du taux d’impôt sur la fortune ? Il est quasimment impossible d’étudier ces questions via une expérience randomisée. Régression et analyse causale Module 3 36 / 41 L’étude d’évènement Étude d’évènement : l’impôt sur la fortune (suite) HEC Lausanne Expérience naturelle : réformes fiscales simultanées mais très différentes en 2009 à Lucerne et à Berne in 2009, pour une raison “quasi-aléatoire” (vote très serré en défaveur d’une baisse d’impôt plus forte à Berne). Source: Brülhart M., Gruber J., Krapf M., Schmidheiny K. (2021) Behavioral Responses to Wealth Taxes: Evidence from Switzerland. American Economic Journal: Economic Policy, 14(4):111-150. Régression et analyse causale Module 3 37 / 41 L’étude d’évènement Étude d’évènement : l’impôt sur la fortune (suite) HEC Lausanne Effet de traitement estimé au bout de 7 ans : 33.7 points de pourcentage Cette estimation implique une grande sensibilité des contribuables à l’impôt : un baise du taux de 1 point de pourmille augmente la fortune déclarée de 19 pourcent (semi-élasticité). Source: Brülhart et al. (2021) Régression et analyse causale Module 3 38 / 41 L’étude d’évènement Étude d’évènement : l’impôt sur la fortune (suite) HEC Lausanne La réactivité des contribuables est forte, mais pas aussi forte que de résulter en un effet “pervers”, selon lequel une baisse du taux d’impôt entraı̂nterait une hausse des recettes. Source: Brülhart et al. (2021). Ce graphique représente des résultats d’une analyse qui tient compte de variations dans les taux d’impôt et fortunes déclarées dans tous les 26 cantons, non seulement Lucerne et Berne. Régression et analyse causale Module 3 39 / 41 L’étude d’évènement Étude d’évènement : héritiers paresseux ? HEC Lausanne Question de recherche : Est-ce que les gens travaillent moins après avoir reçu un héritage ou une donation? Nous étudions l’évolution des revenus du travail avant et après réception d’un héritage ou d’une donation (données individuelles, Berne 2002-2019). Le timing des héritages est quasi-aléatoire Tendandes parallèles : absence d’effet d’anticipation Recevoir un héritage semble induire les gens à travailler moins, en Source: Brülhart M., Eyquem A., Martinez I., moyenne. Rubolino E. (2024) Earnings Responses to Sudden Wealth: Inheritance, Inter-Vivos Gifts, and Lotteries. Working Paper. Régression et analyse causale Module 3 40 / 41 L’étude d’évènement Étude d’évènement : héritiers paresseux (suite) HEC Lausanne Le timing des donations n’est pas aléatoire : tendances non parallèles Même si on voyait des tendances parellèles avant la réception d’une donation, nous savons que ces dernières sonte endogènes de toute façon. Il faut toujour garder un esprit critique et penser au contexte qui a donné lieu aux données que nous analysons ! Source: Brülhart et al. (2024) Régression et analyse causale Module 3 41 / 41