Angewandte Ökonometrie - Vorlesungsunterlagen PDF
Document Details
Uploaded by Deleted User
Technische Universität Dortmund
2024
Prof. Dr. Ludger Linnemann
Tags
Summary
Diese Unterlagen sind ein Inhaltsverzeichnis und eine kurze Zusammenfassung eines Kurses zur Angewandten Ökonometrie an der Technischen Universität Dortmund. Der Kurs findet im Wintersemester 2024/25 statt und umfasst verschiedene Themen wie die Einführung in Regressionsmodelle, Zeitreihen und Querschnittsmodelle.
Full Transcript
Angewandte Ökonometrie Technische Universität Dortmund Winter 2024/25 Prof. Dr. Ludger Linnemann ([email protected]) AÖ, Winter 2024/25 1 Inhaltsübersicht: 1. Einführung und Rückblick auf das klassische lineare Regressio...
Angewandte Ökonometrie Technische Universität Dortmund Winter 2024/25 Prof. Dr. Ludger Linnemann ([email protected]) AÖ, Winter 2024/25 1 Inhaltsübersicht: 1. Einführung und Rückblick auf das klassische lineare Regressionsmodell 2. Querschnittsmodelle: Solow-Wachstumsmodell 3. Einführung in Regressionsmodelle mit Zeitreihendaten: Monetäre und …skalische Transmission 4. Zeitreihenmodelle I: Stationäre univariate Prozesse 5. Zeitreihenmodelle II: Dynamische Regressionsmodelle 6. Simultanität, endogene Regressoren und Mehrgleichungsmodelle 7. Zeitreihenmodelle III: Vektorautoregressive Modelle AÖ, Winter 2024/25 2 Literatur: Grundlegend: – Verbeek, M. (2017), A Guide to Modern Econometrics, 5. Au‡age, Wiley. – Stock, J.H., und M.W. Watson (2015), Introduction to Econometrics, 3. Au‡age, Pearson. – Wooldridge, J.M. (2016), Introductory Econometrics. A Modern Approach, 6. Au‡age, Cengage Learning. Weiterführend: – C.A. Favero (2001), Applied Macroeconometrics, Oxford University Press. – W. Enders (2004), Applied Econometric Time Series, 2nd ed., Wiley. – Greene, W.H. (2017), Econometric Analysis, 8. Au‡age, Pearson AÖ, Winter 2024/25 3 1 Einführung und Rückblick auf das klassische lineare Regressionsmodell Ökonometrie ist bekanntlich die Gesamtheit der statistischen Methoden, die an- gewandt auf wirtschaftsstatistische Daten zur Beantwortung ökonomischer Fra- gestellungen geeignet sind. Angewandte Ökonometrie oder empirische Wirtschaftsforschung ist die Verwen- dung dieser Methoden und der daraus gewonnenen Ergebnisse. Es geht also um das Zusammenspiel von ökonomisch-theoretischen Fragestellun- gen mit der Auswahl geeigneter Daten und adäquater Methoden, um empirische Erkenntnisse zu gewinnen: 9 Theorien > = Daten =) empirische Resultate > ökonometrische Methoden ; AÖ, Winter 2024/25 4 Zielsetzungen: – Test von Theorien (existieren theoretisch postulierte Zusammenhänge wirklich?) – Diskriminierung zwischen konkurrierenden Theorien (welche Theorie steht besser mit der empirischen Evidenz in Einklang?) – Quanti…zierung von Theorien (theoretisch: wenn x, dann y empirisch-quantitativ: aber um wieviel ändert sich y , wenn x sich um eine Einheit ändert?) – Prognose – Politikanalyse (dynamische Analyse von Politikwirkungen: wie verläuft der monetäre Trans- missionsprozess nach einer Leitzinsänderung? wie wirken Steuern und Staats- ausgaben auf den Konjunkturverlauf?) AÖ, Winter 2024/25 5 Lernziele dieses Kurses: – Anwenderkenntnisse grundlegender ökonometrischer Methoden erwerben und/oder vertiefen – Fähigkeit, empirische Studien zu interpretieren und ihren Aussagewert zu beurteilen – Kritische Evaluation empirischer Argumente in der wirtschaftspolitischen Dis- kussion – Erfahrung im Umgang mit makroökonomischen Daten – Übung in der Erstellung von Computerprogrammen zur Lösung ökonometri- scher Probleme – Fähigkeit zur Durchführung eigener empirischer Forschungsprojekte AÖ, Winter 2024/25 6 Inhaltlich: Empirische Makroökonomik – lange Frist: Querschnittszusammenhänge (Solow - Wachstumsmodell) – kurze Frist: Zeitreihenzusammenhänge (monetäre Konjunkturmodelle) Wichtige Datenquellen: – USA: Federal Reserve Bank of St. Louis database ("Fred") (http://research.stlouisfed.org/fred2/) – Eurozone: Europäische Zentralbank (https://data.ecb.europa.eu/) – Deutschland: Deutsche Bundesbank, Statistisches Bundesamt Andere Datenquellen werden bei Bedarf zitiert. AÖ, Winter 2024/25 7 1.1 Das lineare Regressionsmodell Wir haben eine abhängige Variable (Regressand yi) und eine oder mehrere unabhängige Variable (Regressor/en x1i, x2i,...). Ein Regressand, ein Regressor: Einfachregression. Ein Regressand, mehrere Regressoren: multiples Regressonsmodell. Mehrere Regressanden: Mehrgleichungsmodelle. Notation im Folgenden: yi oder yt ist eine skalare Zufallsvariable bzw. deren Rea- lisation, y ohne Index ist ein Vektor von Zufallsvariablen (oder je nach Kontext eine skalare Konstante), Y ist eine Matrix. Zu schätzende Parameter(-vektoren) sind durch griechische Buchstaben gekennzeichnet. AÖ, Winter 2024/25 8 Es liegen Stichproben vor mit Beobachtungen (Daten) von Realisationen der Variablen. – Querschnittsdaten: Daten beziehen sich auf unterschiedliche Beobachtungs- einheiten zum selben Zeitpunkt. y = fyigi=1;::;n ist ein n - dimensio- naler Spaltenvektor (d.h. n ist der Stichprobenumfang), wobei der Index i die Beobachtungseinheit bezeichnet (z.B. OECD-Länder im Jahr 2008, i 2 fD; F; U K; N L; :::g). – Zeitreihendaten: für dieselbe Beobachtungseinheit liegen Realisationen zu verschiedenen Zeitpunkten vor. Der Index t bezeichnet den Zeitpunkt der Beobachtung; y = fytgt=1;::;T ist ein T - dimensionaler Spaltenvektor (z.B. Beobachtungen von t 2 f1970; 1971; :::; 2019g). AÖ, Winter 2024/25 9 Wir analysieren lineare Zusammenhänge. Das Modell lautet für einen Querschnitt yi = 0 + 1x1i + ::: + k xki + "i, i = 1; :::; n worin 0; 1,... unbekannte Parameter sind, und "i der statistische Fehler (auch Störterm) ist, bzw. für Zeitreihen yt = 0 + 1x1t + ::: + k xkt + "t, t = 1; :::; T Idee: yi wird erklärt als Summe – aus einem systematischen Teil 0 + 1x1i + ::: + k xki – und einem zufälligen, nicht weiter erklärbaren Ein‡uss "i (dem Fehlerterm oder Störterm). Aufgabe der Ökonometrie: …nde Schätzungen für 0 ; 1 ::: (und dadurch für die unbeobachtbaren "i). AÖ, Winter 2024/25 10 Die Fehlerterme "i sind Zufallsvariablen. Dadurch ist auch yi eine Zufallsvariable, bzw. y ist ein Vektor von Zufallsvariablen. Ob die Regressoren xij Zufallsvariablen sind oder als …xe Konstanten angese- hen werden können, hängt vom Zusammenhang ab. Wir nehmen zunächst zur Vereinfachung den letzteren Fall an, später verallgemeinern wir. Die Schätzungen für die 0; 1; ::: und für die "i sind selber Zufallsvariablen. Schätzungen für die Fehlerterme heiß en auch Residuen. Wir kennzeichnen Schätzungen immer mit einem Dach: wahre Parameter: 0 ; 1 ; ::: Fehlerterme: "i geschätzte Parameter: b ; b ; ::: Residuen: "bi 0 1 AÖ, Winter 2024/25 11 Wenn wir Schätzungen b 0; b 1; ::: haben, können wir die prognostizierten Werte ybi (‘…tted values’, also die Punkte auf der Regressionslinie) für die abhängige Variable yi = 0 + 1xi + ::: + "i ermitteln: ybi = c0 + c1xi + ::: Hieraus können wir die Residuen "bi als Schätzung für den unbeobachteten Stör- term "i ermitteln: "bi = yi ybi AÖ, Winter 2024/25 12 5 5 4 4 3 3 2 x 2 y 1 1 0 0 y -1 -1 fitted values Residuen -2 -2 0 5 10 15 20 25 30 0 5 10 15 20 25 30 Index (i oder t) Index (i oder t) 5 5 4.5 4.5 Beobachtungen 4 4 Regressionslinie 3.5 3.5 y y 3 3 2.5 2.5 2 2 1.5 1.5 -2 -1 0 1 2 -2 -1 0 1 2 x x AÖ, Winter 2024/25 13 Unterscheidung zwischen Fehlertermen und Residuen: AÖ, Winter 2024/25 14 1.2 Beispiel für ein bivariates Modell: Konvergenz Das neoklassische Wachstumsmodell sagt voraus, dass Volkswirtschaften im Stea- dy State mit der Rate des technischen Fortschritts wachsen, auf dem Weg zum Steady State (von unterhalb dessen) aber mit einer höheren Rate. Wenn alle Volkswirtschaften denselben Steady State haben, wächst also diejenige am schnellsten, die am weitesten vom Steady State entfernt ist. Mit anderen Wor- ten: arme Volkswirtschaften wachsen schneller. Dadurch holen sie im Zeitverlauf zu den anfänglich reicheren Ländern auf: die Niveaus der Pro-Kopf-Einkommen konvergieren. Wir können diese (unbedingte) Konvergenz-Hypothese empirisch mit einer linea- ren Regression überprüfen. AÖ, Winter 2024/25 15 Abhängige Variable yi: durchschnittliche Wachstumsrate eines Landes über einen Beobachtungszeitraum. Unabhängige Variable xi: Pro-Kopf-Einkommen am Anfang des Beobachtungs- zeitraums. Modell: yi = 0 + 1xi + "i, i = 1; :::; n worin "i alle sonstigen Ein‡üsse auf die durchschnittliche Wachstumsrate auf- fängt. Hypothese: 1< 0 AÖ, Winter 2024/25 16 Daten: – Quelle: The Conference Board, Total Economy Database (https://www.conference- board.org/data/economydatabase) – Reales BIP/pro Kopf (in Dollars von 2017 zu Kaufkraftparitäten) für zahlrei- che Länder, jährliche Daten 1950 bis 2017. Variablen: – yi: durchschnittliche jährliche Wachstumsrate des realen BIP/pro Kopf zwi- schen 1950 und 2017, OECD und China (soweit Daten vorhanden), in Prozent pro Jahr. – xi: reales BIP/pro Kopf in diesen Ländern im Jahr 1950, in international vergleichbaren tsd. Dollars (Kaufkraftparitäten) von 2017. AÖ, Winter 2024/25 17 KOR 5 CHN av. % growth rate, 1950-2017 JPN 4 IRL ESP 3 TURPRTISR AUT POL FINDEUISL ITA NOR FRA BEL NLD LUX CHL HUN SWE USA 2 MEX DNK GBR CAN AUS NZL CHE 1 0 0 5 10 15 20 25 GDP/p.c. 1950 AÖ, Winter 2024/25 18 1.3 Bivariate Regression: OLS - Schätzung Unser Modell lautet hier yi = 0 + 1xi + "i, i = 1; :::; n bzw. in vektorieller Schreibweise: y = 0 + 1x + " Idee: …nde Schätzungen c0; c1 für die unbekannten Parameter 0; 1 so, dass der erklärte Teil (systematische Variation in dem Vektor y als Folge von Variation in dem Vektor x) maximal wird, der nichterklärte Teil (unsystematische Variation als Folge der zufälligen Ein‡üsse, die in " zusammengefasst sind) folglich minimal. Kleinste-Quadrate Kriterium (OLS = ordinary least squares): minimiere die Sum- me der quadrierten Residuen. AÖ, Winter 2024/25 19 Die Residuen (den unerklärten Rest) hatten wir de…niert als "bi = yi c cx , 0 1 i wir suchen also die Minimierung ihrer Quadratsumme: n X n X min ("bi)2 = min ( yi c 0 c x )2 1 i c0; c1 i=1 c0; c1 i=1 P Unter Verwendung der Stichprobenmittelwerte y = n1 n i=1 yi (für x entspre- chend) lautet die Lösung (Herleitung in jedem Lehrbuch) Pn c = i=1 (yi y ) ( xi x ) 1 Pn 2 i=1 ( x i x ) sowie c0 = y cx. 1 AÖ, Winter 2024/25 20 Dies kann vereinfacht geschrieben werden: wenn wir die Stichprobenkovarianz zwischen y und x de…nieren als n X d 1 Cov xy = (yi y ) ( xi x) n 1 i=1 und die Stichprobenvarianz von x als n X 1 Vd ar x = ( xi x) 2 n 1 i=1 so ergibt sich für die Schätzfunktion des Steigungsparameters: Pn d c = i=1 (yi y ) ( xi x ) = Cov xy 1 P n (x 2 d i=1 i x ) V ar x AÖ, Winter 2024/25 21 Eine Frage, die uns (manchmal) interessiert, ist die der Anpassungsgüte (good- ness of …t): Wie gut charakterisiert die Regressionslinie die gemeinsame Variation der Daten? y y x x AÖ, Winter 2024/25 22 Wir können die Anpassungsgüte quanti…zieren mit dem Determinationskoe¢ zi- enten R2. Es gilt yi = ybi + "bi Die totale Quadratsumme der Variation des Regressanden um seinen Mittelwert (total sum of squares, TSS) ist proportional zur Varianz des Regressanden: n X T SS = ( yi y )2 i=1 Die nicht von der Schätzung erklärte Quadratsumme (sum of squared errors, SSE, auch residual sum of squares genannt) ist de…niert als n X n X SSE = ("bi)2 = (yi ybi)2 i=1 i=1 AÖ, Winter 2024/25 23 Ein Standardmaßfür die Güte (…t) der Regression ist dann R2, de…niert als SSE R2 = 1 T SS R2 liegt zwischen null (kein …t) und 1 (perfekter …t). Interpretation: R2 ist der Anteil der Varianz in der abhängigen Variablen yi, der durch die Regression erklärt werden kann (bzw. eins minus der unerklärte Anteil). AÖ, Winter 2024/25 24 1.4 Schätzung des Beispielmodells Für das Konvergenz-Modell ergeben sich folgende Schätzer (hier y : durch- schnittliche Wachstumsrate 1950-2017, x : BIP/pc 1950): ybi = 3:6889 0:1162xi T SS = 21:82, SSE = 10:72 R2 = 1 SSE=T SS = 0:5087, SER = 0:6189 AÖ, Winter 2024/25 25 5.5 KOR 5 CHN 4.5 JPN av. % growth rate, 1950-2017 4 3.5 IRL ESP ISR 3 TUR PRT AUT POL FIN DEU ISL 2.5 ITA NOR FRA BEL LUX CHL NLD HUN SWE USA 2 MEX GBR DNK CAN AUS CHE 1.5 NZL 1 0.5 0 0 5 10 15 20 25 GDP/p.c. 1950 Interpretation? AÖ, Winter 2024/25 26 1.5 Multiple Regression Bevor wir uns den stochastischen Eigenschaften des OLS - Schätzers zuwenden, verallgemeinern wir auf den Fall mehrerer Regressoren. Das Modell lautet jetzt yi = 0 + 1x1i + 2x2i + ::: + k xki + "i, i = 1; ::; n Wir haben also n Beobachtungen für den Regressanden y und je n Beobachtun- gen für jeden der k Regressoren. Sei y der Spaltenvektor mit yi als dem i-ten Element, und x1 der Spaltenvek- tor mit x1i als i-tem Element (x2; x3; ::: analog). Dann lässt sich das Modell schreiben als y = 0 1 + 1 x1 + 2 x2 + ::: k xk + " AÖ, Winter 2024/25 27 Fassen wir alle Regressoren (inklusive der Konstanten) zu der Matrix X= 1 x1 x2 ::: xk zusammen (mit 1 einem Vektor aus Einsen der Länge n, und x1 einem n 1 Datenvektor, x2 etc. analog) ergibt sich y =X +" mit dem Parametervektor 0 1 0 B C B 1 C = B.. C @. A k Dimensionen: y und " haben die Dimension (n 1 ), X ist (n k + 1 ), und ist (k + 1 1 ). Gesucht wird der Vektor der geschätzten Modellparameter b : AÖ, Winter 2024/25 28 Die …tted values sind yb = X b Die Residuen "b sind de…niert als "b = y yb = y Xb Die Quadratsumme der Residuen (SSE) soll minimiert werden. In Vektorschreib- weise ist SSE gegeben durch n X SSE = ("bi)2 = "b0"b = (y X b )0 (y X b) i=1 AÖ, Winter 2024/25 29 Die Minimierung von SSE wird durch den OLS - Schätzer erreicht: min SSE = min "b0"b b b was als Lösung liefert: 1 b = X 0X X 0y sofern X 0X invertierbar ist, was der Fall ist, wenn die Spalten von X (also die Regressorvariablen) nicht linear abhängig sind, was wir im Folgenden regelmäß ig unterstellen. AÖ, Winter 2024/25 30 Der Determinationskoe¢ zient R2 (mit R2 = 1 SSE=T SS ) steigt notwendi- gerweise, wenn weitere Variablen hinzugefügt werden. 2 Korrektur: bereinigter Determinationskoe¢ zient R mit 2 n 1 SSE R =1 n k 1 T SS wobei der Term n n k 1 1 eine sogenannte Freiheitsgrad-Korrektur ist. 2 Idee: Hinzufügen eines Regressors vergrößert deren Anzahl k, so dass der R steigen oder sinken kann, je nachdem, wie großdie Erklärungskraft des neuen Regressors ist. 2 Hinweis: R steigt durch Hinzufügung eines Regressors nur, wenn der quadrierte t-Wert der hinzukommenden Variablen größ er als 1 ist (siehe unten zur De…nition des t-Werts). AÖ, Winter 2024/25 31 1.6 Statistische Eigenschaften des OLS-Schätzers Die Störgröße "i ist eine Zufallsvariable. Damit sind auch die durch OLS ge- schätzten Parameter, also die Elemente des Vektors b , Zufallsvariablen. Was sind ihre statistischen Eigenschaften? Anders gefragt, wenn die Schätzwerte b zufällig sind, wie können wir die Ergebnisse überhaupt interpretieren, bzw. was sagen sie über die Gesamtheit aus? Um dies zu ermitteln, müssen wir dem Modell einen statistischen Gehalt geben, indem wir einige Annahmen tre¤en. AÖ, Winter 2024/25 32 1.6.1 Annahmen des klassischen Regressionsmodells 1. Korrekte Spezi…kation: der wahre Zusammenhang ist linear und wir haben alle relevanten Variablen auf der rechten Seite berücksichtigt. 2. Für die Störterme "i wird angenommen: (a) ihr Erwartungswert ist null: E ("i) = 0 i = 1; :::; n (b) ihre Varianz ist eine Konstante 2: V ar ("i) = 2 i = 1; :::; n (c) sie sind untereinander unkorreliert, haben also eine Kovarianz von null: Cov ("i; "j ) = 0 für alle i 6= j Dies nennt man die Annahme serieller Unkorreliertheit oder die Freiheit von Autokorrelation. AÖ, Winter 2024/25 33 Nimmt man die vorigen drei Annahmen zusammen, so besagen sie, dass die Fehlerterme separate unkorrelierte Ziehungen aus derselben Verteilung mit Erwartungswert und konstanter Varianz sind. Dies drückt man manchmal (etwas stärker) auch so aus, dass die Fehlerterme i:i:d (independently iden- tically distributed) mit Erwartungswert null und Varianz 2 sind, "i i:i:d(0; 2) für alle i Ein äquivalenter Ausdruck hierfür ist, dass die Fehlerterme ‘weiß es Rauschen’ (white noise) sind. Für manche Zwecke werden wir zusätzlich die Normalverteilung der Fehler- terme unterstellen: "i N (0; 2) Jeder Fehlerterm ist dann eine Zufallsvariable, die unabhängig von allen an- deren aus einer Normalverteilung mit Mittelwert null und konstanter Varianz 2 gezogen wird. Die wird auch als Gauß ’sches weißes Rauschen bezeichnet (Gaussian white noise). AÖ, Winter 2024/25 34 3. (Strikte) Exogenität der Regressorvariablen: wir unterstellen, dass die Regres- sorvariablen (in einem bestimmten Sinn) unabhängig von den Fehlertermen sind. Formal gesehen benötigen wir E ("jX ) = 0 also der bedingte Erwartungswert der Fehlerterme ist null. Das bedeutet: die Regressoren sind exogen in dem Sinn, dass sie keine Infor- mation über die Fehlerterme enthalten (so dass letztere nicht prognostizierbar sind). Eine Folgerung aus strikter Exogenität der Regressoren ist, dass sie mit den Fehlertermen unkorreliert sein müssen. Die Exogenitätsannahme ist zentral wichtig und häu…g problematisch! Wir werden sie ab Kapitel 3 und dann vertieft in Kapitel 5 genauer untersuchen. AÖ, Winter 2024/25 35 1.6.2 Erwartungswert und Varianz des Schätzvektors Nehmen wir an, wir hätten den OLS-Schätzer für den Koe¢ zientenvektor ermittelt. Zur Erinnerung: dies geschah durch Berechnung von 1 b = X 0X X 0y In welcher Beziehung steht die Schätzung b zu dem wahren Parametervektor ? Da b eine Zufallsvariable ist, wird die Schätzung ja nur ausnahmsweise mit dem wahren übereinstimmen. AÖ, Winter 2024/25 36 Wir halten hier (ohne Herleitung, siehe jedes Lehrbuch) einige wichtige Resultate fest. 1. Aus strikter Exogenität der Regressoren folgt Unverzerrtheit / Erwartungstreue: E ("jX ) = 0 =) E ( b ) = 2. Für die Varianz von b gilt: wenn die Fehlerterme i:i:d: sind, gilt 2 X 0X 1 V ar ( b ) = AÖ, Winter 2024/25 37 3. Gauß -Markov-Theorem: Unter den getro¤enen Annahmen gibt es keinen anderen linearen erwartungs- treuen Schätzer mit geringerer Varianz als OLS. Man nennt OLS in diesem Fall auch ‘best linear unbiased estimator’(BLUE). Dieses Resultat rechtfertigt, dass wir standardmäß ig OLS verwenden, wann im- mer möglich. AÖ, Winter 2024/25 38 Betrachten wir nun Erwartungswert und Varianz für einen einzelnen beispielhaf- ten geschätzten Parameter cj. Jedes einzelne cj hat (unter den getro¤enen Annahmen) den Erwartungswert E cj = j 1 und eine Varianz, die dem j; j - Element von 2 X 0X entspricht, also 2 X 0X 1 V ar cj = j;j - Element Um die Schreibung zu vereinfachen, bezeichnen wir das j; j - Element von X 0X 1 mit cjj. Wir haben also V ar cj = 2c jj AÖ, Winter 2024/25 39 Hier müssen wir noch die konstante Fehlervarianz 2 schätzen. Dies geschieht mittels des Schätzers s2 gemäß Xn 1 1 s2 = "b2i = "b0"b n (k + 1) i=1 n (k + 1) Die positive Wurzel daraus, s, bezeichnet man auch als SER (s = standard error of the regression). Wenn wir nun in der Varianzformel 2 durch s2 ersetzen, …nden wir die geschätz- te Varianz von cj mit ar cj Vd = s2cjj AÖ, Winter 2024/25 40 Die positive Wurzel daraus ist eine wichtige Größ e, sie heiß t Standardfehler (se = standard error) von cj : r p sej = ar cj = s cjj Vd Intuition: der Standardfehler ist die Schätzung der Standardabweichung der Schätz- werte cj in wiederholten Stichprobenziehungen. Je größ er der Standardfehler, desto weniger präzise ist die Schätzung! AÖ, Winter 2024/25 41 1.7 Hypothesentests 1.7.1 Test einer Nullrestriktion Wenden wir uns nun Hypothesentests zu. Diese spielen für die Beurteilung em- pirischer Resultate eine zentrale Rolle. Oft interessiert uns z.B. die Frage: – Spielt die j - te Regressorvariable wirklich eine Rolle für die Erklärung von y? – Mit anderen Worten: würde die Restriktion von j auf null (also das Hinaus- werfen des j - ten Regressors) die Anpassungsgüte der Schätzung wesentlich verschlechtern? AÖ, Winter 2024/25 42 Selbst wenn der wahre Parameter j = 0 ist, wird wegen der stochastischen Na- tur des Problems der Schätzer b j fast niemals exakt null sein. Allein die zufällige Variation im Fehlerterm wird dazu führen, dass wir ein von null verschiedenes Schätzergebnis haben. Wir können aber ermitteln, ob die Schätzung signi…kant von null verschieden ist. Dies ist dann der Fall, wenn eine Schätzung b j 6= 0 unter der Nullhypothese, dass in Wahrheit j = 0 ist, sehr unwahrscheinlich ist. Hierzu muss das Signi…kanzniveau des Tests festgelegt werden (was genau heiß t ‘sehr unwahrscheinlich’?). Praktisch wird als Signi…kanzniveau meistens 5% ver- wendet (seltener auch 1% oder 10%). Wenn also ein Schätzergebnis b j 6= 0 unter Geltung von H0 : j = 0 eine Wahrscheinlichkeit von weniger als z.B. 5% hat, sagen wir, dass der geschätzte Parameter signi…kant von null verschieden ist. AÖ, Winter 2024/25 43 Ein fundamentales Resultat der Statistik besagt, dass wenn die Fehlerterme nor- malverteilt sind die Größ e b j j t = sej einer t - Verteilung mit n k 1 Freiheitsgraden folgt. Wenn der Stichprobenumfang einigermaß en großist, kann man statt der t - Ver- teilung auch die Standardnormalverteilung verwenden, gegen die sie konvergiert. Für groß e Stichproben ist die Verteilung der Fehlerterme auch egal, Normalver- teilung muss dann nicht angenommen werden. Wir unterstellen den Fall einer genügend groß en Stichprobe im Folgenden und gehen der Einfachheit halber daher davon aus, dass t standardnormalverteilt ist. AÖ, Winter 2024/25 44 Damit kann man folgenden Test durchführen: 1. Nullhypothese: H0 : j = 0 2. Wenn die Nullhypothese zutri¤t, muss b 0 j t = sej approximativ standardnormalverteilt sein. 3. Bestimmung des kritischen Wertes. Die Wahrscheinlichkeit, dass eine stan- dardnormalverteilte Variable betragsmäß ig größ er als 1:96 ist, beträgt 5%. Werte von jtj > 1:96 sind also kritisch für die Nullhypothese (beim gewählten Signi…kanzniveau 5%). AÖ, Winter 2024/25 45 4. Wenn die Teststatistik im kritischen Bereich liegt, d.h. wenn jtj > 1:96 ermittelt wird, wird die Nullhypothese abgelehnt. Standardsoftware für Regressionen liefert routinemäß ig sogenannte t-Werte, also bj die Statistik t = se (der Quotient aus Parameterschätzung und deren Standard- j fehler). Ein t - Wert von betragsmäß ig mehr als 1:96 würde also dazu führen, dass die Nullhypothese, der betre¤ende Parameter sei in Wirklichkeit null, abgelehnt wird. Interpretation: ein hoher t - Wert führt zu der Schlussfolgerung, dass die be- tre¤ende Variable einen signi…kanten Beitrag zur Erklärung der Variation in der abhängigen Variablen y leistet. AÖ, Winter 2024/25 46 Entsprechend kann man auch Kon…denzintervalle für geschätzte Parameter ab- leiten. Das Intervall h i b 1:96 sej , b + 1:96 se j j j überdeckt bei wiederholter Stichprobenziehung den wahren Parameter j mit einer Wahrscheinlichkeit von 95%. Hinweis: es wäre falsch zu sagen, dass der wahre Parameter ‘mit 95% Wahr- scheinlichkeit im Kon…denzintervall liegt’, weil der wahre Parameter eine Kon- stante ist, das Intervall aber stochastisch (nicht umgekehrt). AÖ, Winter 2024/25 47 Der Test lässt sich leicht abwandeln für andere Hypothesenwerte als die null. Nehmen wir z.B. an, die Nullypothese laute H0 : j = a mit a einer beliebigen Zahl. Dann ist die t - Statistik b a j t = sej Wenn jtj > 1:96 ist, würde man auf dem 5% - Signi…kanzniveau ablehnen und folgern, dass starke Evidenz gegen j = a vorliegt. AÖ, Winter 2024/25 48 1.7.2 p-Werte Standard-Software gibt regelmäß ig auch den sogenannten p-Wert aus. Dies ist das kleinste Signi…kanzniveau, bei dessen Zugrundelegung die Nullhypo- these H0 : j = 0 abgelehnt werden könnte. Ein kleiner p-Wert heißt also, dass der geschätzte Parameter bei einer geringen Irrtumswahrscheinlichkeit signi…kant von null verschieden ist. Beispiel: Will man das konventionelle Signi…kanzniveau von 5% zugrundelegen, würde ein p-Wert von p 0:05 zur Verwerfung der Nullhypothese H0 : j = 0 führen. AÖ, Winter 2024/25 49 1.7.3 Test mehrerer linearer Parameterrestriktionen Wir hatten bisher nur den Test einer einzelnen Restriktion besprochen. Wir kön- nen aber auch gemeinsame Tests mehrerer Hypothesen untersuchen. Wenn mehrere lineare Restriktionen getestet werden sollen, kann man einen F - Test verwenden. Wenn wir d verschiedene Hypothese gleichzeitig testen wollen, formulieren wir die Nullhypothese als H0 : R = q worin jetzt R eine d (k + 1) Matrix mit Restriktionen ist, und q ein d 1 Vektor mit Konstanten. Es handelt sich also um den Test von d verschiedenen Restriktionen auf den Parametervektor. AÖ, Winter 2024/25 50 Beispiel: Ihr Modell lautet y = 0 + 1 x1 + 2 x 2 + 3 x 3 + " und Sie wollen d = 2 Restriktionen testen: H0 : 1 =1 2 = 3 In der oben genannten Notation R = q wäre das 0 1 ! 0 ! 0 1 0 0 B C 1 B 1 C B C = 0 0 1 1 @ 2 A 0 3 AÖ, Winter 2024/25 51 Die Teststatistik für diese Hypothese lautet h i 1 1 (R b q ) R X 0X 0 R0 (R b q) F = ds2 Sie ist F - verteilt mit d und n k 1 Freiheitsgraden. Ein Wert F größer als der kritische Wert zum gewählten Signi…kanzniveau führt zur Ablehnung der Nullhypothese. Kritische Werte …ndet man in den Tabellen der Lehrbücher der Statistik, bzw. sie werden von Standardsoftware direkt mit angegeben. Äquivalent dazu betrachtet man den p - Wert des Tests und entscheidet auf dieser Basis (Ablehnung wenn p < Signi…kanzniveau). AÖ, Winter 2024/25 52 Ein spezieller F - Test wird routinemäß ig von jedem Regressionsprogramm mit ausgegeben, nämlich der Test von H0 : 1 = 2 = ::: = k = 0 Dieser Test überprüft also, ob die Regressoren (auß er der Konstanten) insgesamt überhaupt irgend etwas erklären. Er heiß t deshalb auch Test auf ‘Signi…kanz der Regression’. AÖ, Winter 2024/25 53 1.8 Zusammenfassung der Vorgehensweise bei einer OLS-Schätzung 1. Spezi…ziere das Modell für die Grundgesamtheit: y =X +" worin X und y beobachtete Daten enthalten. 2. Schätze den Parametervektor durch b = X 0X 1 X 0y 3. Ermittle daraus den Residuenvektor (die Schätzung des Vektors der Fehlerterme) als "b = y Xb 4. Schätze die Fehlervarianz durch 1 s2 = "b0"b n k 1 AÖ, Winter 2024/25 54 5. Ermittle die geschätzte Varianz der geschätzten Parameter mittels V\ ar ( b ) = s2(X 0X ) 1 Die Wurzeln der Hauptdiagonalelemente sind die Standardfehler. 6. Interpretiere die Ergebnisse. 7. Teste die Annahmen des der Schätzung zugrundeliegenden theoretischen Modells (Hypothesentests bzgl. der Parameter). 8. Inhaltliche Beurteilung auf Basis der Testergebnisse.