5EN306 - Aplikovane kvantitativnč metody Shrněč PDF
Document Details
Uploaded by Deleted User
T
Tags
Summary
This document provides a summary of applied quantitative methods, enriched with relevant information from introductory econometrics. It covers topics such as data types, regression models, and time series analysis, for use in empirical analysis and econometric modeling. Furthermore, it describes the challenges of working with different types of data in econometrics, such as handling panel data, and different approaches for analysis.
Full Transcript
5EN306 - Aplikované kvantitativnı́ metody shrnutı́ předmětu obohacené o relevantnı́ informace z 4EK214 - Úvodu do ekonometrie Úvodnı́ komentář Zdarec! Tento soubor vznikl při přı́pravě na ZT z AKM v ZS 24/25 - netušı́m a nezodpovı́dám za změny v kurzu po tomto semestru, nicméně mysl...
5EN306 - Aplikované kvantitativnı́ metody shrnutı́ předmětu obohacené o relevantnı́ informace z 4EK214 - Úvodu do ekonometrie Úvodnı́ komentář Zdarec! Tento soubor vznikl při přı́pravě na ZT z AKM v ZS 24/25 - netušı́m a nezodpovı́dám za změny v kurzu po tomto semestru, nicméně myslı́m si, že materiál je dostatečně nabitej na to, abyste se z něj naučili. Původně to měly být pouze krátké výpisky pro mé učenı́, nicméně když už člověk něco dělá, tak pořádně, že? za chyby v textu zodpovı́dám já a nikdo jiný, snažil jsem se to udělat co nejkratšı́, ale zároveň dostatečně nabité - tak, aby to šlo pochopit. Rozhodně je to výrazně kratšı́ než prezentace z přednášek, z nichž to vytahuje jen ty klı́čové poznatky a vzorečky (občas něco navı́c). Pokud chcete vědět vı́c, nenı́ nic lepšı́ho než projı́t celý prezentace, ale ještě spı́š přečı́st Wooldridge a Kovářovu učebnici na časové řady. Přı́padně existuje milion videı́ na Youtube a dalšı́ch platformách, existujı́ alternativnı́ učebnice, existuje umělá inteligence, která to umı́ vysvětlit velmi jednoduše, klidně i v analogiı́ch jako pro 7leté dı́tě (spousta konceptů pak jde lépe pochopit). At’ se dařı́! T 1 Obsah 1 Nultý blok - úvod 5 1.1 Typy dat........................................... 5 1.2 Terminologie......................................... 6 2 Prvnı́ blok - průřezová data 7 2.1 Jednoduchý regresnı́ model................................. 7 2.2 Odhad modelu a metoda nejmenšı́ch čtverců....................... 7 2.3 Matematika za metodou OLS............................... 8 2.4 Jak dobře model vysvětluje data?............................. 9 2.5 Vı́cenásobná regrese..................................... 10 2.6 Model s k nezávislými proměnnými............................ 11 2.6.1 Interpretace..................................... 12 2.7 Funkčnı́ tvar......................................... 12 2.7.1 Kvadratická funkčnı́ forma............................. 13 2.7.2 Dummy proměnné................................. 14 2.7.3 Interakce....................................... 14 2.7.4 Zpřesňujı́cı́ interpretace logaritmů a jejich predikce............... 15 2.8 Chybná specifikace modelu................................. 15 2.9 OLS estimátor jako náhodná proměnná.......................... 16 2.10 Gauss-Markovovy předpoklady (MLR předpoklady)................... 17 2.10.1 Nevychýlenost = nestrannost (unbiased)..................... 19 2.10.2 Konzistence - na velikosti záležı́.......................... 20 2.10.3 Vydatnost - přesnost (rozptyl) OLS odhadů................... 21 2.10.4 Vı́ce o rozptylu estimátorů............................... 21 2.11 Gauss-Markovova věta................................... 21 2.12 Testovánı́ hypotéz...................................... 22 2.12.1 P-hodnota...................................... 23 2.12.2 Intervaly spolehlivosti (Confidence intervals)................... 24 2.13 Společné testovánı́ parametrů - F-test........................... 24 2.14 Heteroskedasticita a problematika s nı́ spojená...................... 25 2.14.1 Detekce....................................... 25 2.14.2 Řešenı́ heteroskedasticity.............................. 26 2.15 Postup modelovánı́..................................... 27 3 Druhý blok - jednorozměrné časové řady 28 2 3.1 Grafy............................................. 28 3.2 Grafy časové korelace.................................... 29 3.3 Složky časových řad..................................... 30 3.4 TS jako sumy šoků..................................... 31 3.4.1 Vlastnosti šoků................................... 31 3.5 ARMA modely....................................... 32 3.5.1 Modely klouzavých průměrů - Moving Average - MA modely.......... 32 3.5.2 Autoregresivnı́ modely - Autoregression - AR modely.............. 33 3.5.3 Smı́šené modely - ARMA modely......................... 35 3.5.4 Diagnostika modelu................................. 38 3.5.5 Předpovědi..................................... 39 3.6 Nestacionarita........................................ 39 3.6.1 Modely s permanentnı́mi šoky........................... 39 3.6.2 Identifikace nestacionarity............................. 40 3.7 Postup modelovánı́..................................... 41 4 Třetı́ blok - metody řešenı́ endogenity, modely s binárnı́ závislou proměnnou 43 4.1 Instrumentálnı́ proměnné.................................. 43 4.1.1 Identifikačnı́ podmı́nky............................... 43 4.1.2 Dvoustupňová metoda nejmenšı́ch čtverců - 2SLS - 2 Stage Least Squares... 44 4.1.3 Statistické vlastnosti................................ 44 4.1.4 Testy instrumentálnı́ch proměnných........................ 45 4.2 Panelová a Pooled CS data................................. 46 4.2.1 Chow test (Chowův test poolability)....................... 47 4.2.2 Least Squared Dummy Variable - LSDV - estimátor nejmenšı́ch čtverců s dummy proměnnými..................................... 47 4.2.3 First differences estimator - FD - Estimátor prvnı́ch diferencı́.......... 47 4.2.4 Fixed Effects - FE - metoda fixnı́ch efektů.................... 48 4.2.5 Random Effects - RE - metoda náhodných efektů................ 48 4.2.6 Correlated Random Effects - CRE - Estimátor Korelovaných náhodných efektů 48 4.2.7 Postup pro panely................................. 49 4.3 Simultánnı́ rovnice..................................... 49 4.3.1 Problém identifikace................................ 49 4.4 Binárnı́ závislá proměnná................................. 50 4.4.1 Linear Probability Model - LPM - Lineárnı́ pravděpodobnostnı́ model..... 50 4.4.2 Limited Dependent Variable models - LDV - Modely omezenı́ závislé proměnné 50 5 Čtvrtý blok - vı́cerozměrné časové řady 53 3 5.1 Jednorovnicové modely................................... 53 5.1.1 Odezvy na šoky................................... 53 5.1.2 Distributed Lag models - Modely distribuovaných zpožděnı́........... 54 5.1.3 ARMAX modely.................................. 54 5.1.4 Autoregressive Distributed Lags - ADL - Autoregresivnı́ model distribuovaných zpožděnı́....................................... 55 5.2 Mnoharovnicové modely.................................. 55 5.2.1 Vector autoregression - VAR - vektorová autoregrese.............. 55 5.2.2 Odezvy na šoky ve VARech............................ 56 5.3 Nestacionarita........................................ 56 5.3.1 Modely pro nestacionárnı́ vı́cerozměrné časové řady............... 57 5.3.2 Kointegrace (∼ vzájemný rovnovážný vztah................... 57 5.3.3 Postup modelovánı́ 2 řad společně......................... 57 6 Velmi krátký přehled testů (a přı́kazů v R) 59 6.1 Detekce multikolinearity.................................. 59 6.2 Detekce a řešenı́ heteroskedasticity............................ 59 6.3 IVR a panely - testy.................................... 60 4 1 Nultý blok - úvod Empirická analýza použı́vá data k testovánı́ teorie nebo k odhadu vztahu. Kroky: 1. Sestavenı́ ekonomického modelu (podle teorie) 2. Vytvořenı́ ekonometrického modelu 3. Sestavenı́ datové sady a přı́prava dat pro odhad (např. úprava sezonnosti) 4. Odhad modelu pomocı́ vhodného estimátoru 5. Diagnostika reziduı́ 6. Porovnánı́ výsledků s relevantnı́ empirickou literaturou 7. Stanovenı́ ekonomických implikacı́ na základě výsledků 1.1 Typy dat 1. Průřezová data Skládajı́ se z průřezových jednotek - jednotlivci, firmy, města, státy. Vztahujı́ se k danému časovému okamžiku (1 čas - neobsahujı́ časovou jednotku) Užı́vajı́ se zejména v mikroekonomii - makro se obvykle stará o dynamické jevy (HDP, inflace) 2. Časové řady Pozorovánı́ jedné nebo vı́ce proměnných v čase Pozorovánı́ na 1 mı́stě, 1 jednotlivce, 1 firmy apod. Obsahuje informace o dynamice proměnné Náročnějšı́ přı́stup kvůli časové závislosti Frekvence: – ročnı́ (bez sezonnosti) - kojenecká úmrtnost – čtvrtletnı́ - HDP – měsı́čnı́ - mı́ra inflace – vysokofrekvenčnı́ data (dennı́, hodinové, minutové - ceny akciı́) 3. Sloučená průřezová data (pooled) časové i průřezové jednotky různé náhodné vzorky ve vı́ce obdobı́ch (napřı́klad ve 2 letech) obdobná práce jako s průřezovými daty 5 4. Panelová data časové i průřezové jednotky stejný vzorek populace během určitého obdobı́ - oproti pooled datům sledujı́ stejné průřezové jednotky (firmy, státy, domácnosti apod.) v čase Napřı́klad pozorovánı́ ekonomické situace 100 firem v 5 letech – krátké panely - průřezové jednoty >> časové jednotky → modely s fixnı́mi/náhodnými efekty – dlouhé panely - ostatnı́ přı́pad → dynamické panelové modely 1.2 Terminologie Populace Kompletnı́ skupina průřezových jednotek, která nás zajı́má Vzorek Část populace, kterou pozorujeme → máme o nı́ data Statistická inference Dělánı́ závěrů o populaci na základě vzorku - vypovı́dajı́cı́ pouze pokud vzorek dobře reprezentuje populaci Možné problémy se vzorkem – problém ve výběru - výběrové zkreslenı́ = nereprezentativnı́ vzorek ∗ nastává, pokud výběr vzorku systematicky vylučuje nebo nedostatečně reprezentuje určité skupiny - studium vlivu vzdělánı́ na mzdu pouze na vysokopřı́jmových skupinách – chyba měřenı́ - chyby statistických úřadů – odlehlé hodnoty - zkreslenı́ výsledků odhadu 6 2 Prvnı́ blok - průřezová data Pouze 1 časová jednotka = pozorovánı́ v 1 obdobı́, vı́ce pozorovaných jedinců (průřezových jednotek). 2.1 Jednoduchý regresnı́ model Nástroj pro analýzu kauzálnı́ho vztahu mezi 2 proměnnými. Pokud vztah přibližně lineárnı́ - lze užı́t jednoduchý lineárnı́ regresnı́ model Populačnı́ rovnice: y = β0 + β1 x + u (1) y x závislá proměnná nezávislá proměnná vysvětlovaná proměnná vysvětliujı́cı́ proměnná endogennı́ proměnná exogennı́ proměnná Tabulka 1: Různé názvy pro proměnné y & x Zásadnı́ předpoklad: E(u|x) = 0 ”Očekávaná hodnota u (náhodné složky) pro dané x je nulová”→ průměrná odchylka odhadovaného modelu je nulová. Předpoklad platı́, jsou-li u a x nezávislé, neplatı́, pokud jsou korelované (inteligence korelována se vzdělánı́m → problém). V důsledku musı́ i nepodmı́něná střednı́ hodnota u být nulová: E(u) = 0 Pokud tento předpoklad platı́, očekávanou hodnotou y se stává: E(y|x) = β0 + β1 x (2) = populačnı́ regresnı́ funkce Interpretace β1 : zvýšı́-li se x o 1, vzroste y v průměru o β1. Nutno vždy dodat, v jakých jednotkách. pozor na záměnu procent a procentnı́ch bodů. E(y|x) = β0 + β1 x je tzv. systematická část y (vysvětlená pomocı́ x) u je tzv. nesystematická část y (nenı́ vysvětlena pomocı́ x) 2.2 Odhad modelu a metoda nejmenšı́ch čtverců Chceme odhadnout skutečné populačnı́ parametry β0 a β1 - populačnı́ parametry neznáme a nikdy nepoznáme.1 Odhad vždy provádı́me na dostupném vzorku o velikosti n(i = 1,..., n) Proto odhadujeme: yi = β0 + β1 x1 + ui (3) 1 Jak by řekl dr. Frýd: ”Zná je jenom Bůh.” 7 Existujı́ různé metody pro odhad, nejpreferovanějšı́ je metoda nejmenšı́ch čtverců (MNČ).2 ŷi = β̂0 + β̂1 xi (4) β̂0 a β̂1 označujı́ odhady skutečných populačnı́ch parametrů, dávajı́ nám odhadnuté (fitted, estimated) hodnoty y (ŷi ). β̂0 lze interpretovat jako hodnotu, jež by y v průměru dosahovalo bez vlivu x (x = 0), v grafu se jedná o průsečı́k, ne vždy má význam. β̂1 pak určuje sklon regresnı́ funkce - průměrný vliv změny regresoru x1 o 1 jednotku. Reziduum (u) pro pozorovánı́ i je rozdı́l mezi skutečnou a odhadnutou hodnotou - to, co nelze vysvětlit pomocı́ x. Nejedná se o chybu! Chyba je rozdı́l mezi pozorovanou a skutečnou hodnotou, reziduum je rozdı́l mezi odhadnutou a skutečnou hodnotou. ûi = yi − ŷi = yi − β̂0 − β̂1 xi (5) Obrázek 1: Odhadnutá hodnota, skutečná hodnota a reziuum na obrázku. 2.3 Matematika za metodou OLS Doporučuji znát minimálně vzorce pro SSR, SSE a SST. Reziduum pro jednotlivce i je ûi = yi − β̂0 − β̂1 xi (6) Klı́čová pro odhad modelu je suma čtverců reziduı́ - sečtenı́ reziduı́ všech pozorovánı́ a umocněnı́ výsledku na druhou. n X n X û2i = (yi − β̂0 − β̂1 xi )2 = SSR (7) i=1 i=1 2 Ordinary Least Squares (OLS) 8 OLS vypočı́tává takové parametry, které minimalizujı́ SSR (Sum of Squared residuals). Odhadnuté koeficienty jsou řešenı́m následujı́cı́ho minimalizačnı́ho problému: n X min (yi − β̂0 − β̂1 xi )2 = SSR (8) β̂0 ,β̂1 i=1 Výsledkem je regresnı́ přı́mka OLS, která se také nazývá výběrová regresnı́ funkce (SRF - sample regression function) ŷi = β̂0 + β̂1 xi (9) Za daných předpokladů poskytuje OLS nejlepšı́ odhady (v přı́padě outlierů - odlehlých hodnot tomu tak nemusı́ být) 2.4 Jak dobře model vysvětluje data? Pro stanovenı́ toho, jak dobře model vysvětluje data využı́váme koeficient determinace (R2 ). Pro jeho výpočet potřebujeme znát: Sumu celkových čtverců (SST - Sum of Squares Total) n X SST = (yi − ȳ)2 (10) i=1 yi... skutečná hodnota pozorovánı́ i ȳ... průměrná hodnota všech pozorovánı́ Sumu vysvětlených čtverců (SSE - Sum of Squared Estimates) n X SSE = (ŷi − ȳ)2 (11) i=1 ŷi... odhadnutá hodnota pro pozorovánı́ i ȳ... průměrná hodnota všech pozorovánı́ Sumu čtverců reziduı́ (SSR - Sum of Squared Residuals) n X n X n X 2 2 SSR = (yi − ŷi ) = (yi − β̂0 − β̂1 xi ) = û2i (12) i=1 i=1 i=1 yi... skutečná hodnota pozorovánı́ i ŷi... odhadnutá hodnota pro pozorovánı́ i û2i... reziduum pr pozorovánı́ i 9 Obrázek 2: SST, SSE a SSR na obrázku Pro tyto veličiny obecně platı́: SST = SSR + SSE3 Koeficient determinace lze spočı́tat jako: SSE SSR R2 = =1− (13) SST SST Jinými slovy je to poměr vysvětleného (odhadnutého) ku celkovému (lze si zapamatovat podle názvu) Vlastnosti a interpretace R2 R2 je podı́l variability vzorku v proměnné y, která je vysvětlena pomocı́ x → jaká část variability v y je vysvětlena pomocı́ x 0 ≤ R2 ≤ 1 R2 = 1 pouze pokud SSR = 0 → veškerá rezidua nulová a všechna pozorovánı́ přesně na regresnı́ přı́mce R2 = 0 pouze pokud SSE = 0 → β̂1 a β̂0 = ȳ Nı́zké R2 neznamená, že je model k ničemu! Poskytuje informace o vztahu mezi danými proměnnými ceteris paribus4. Pro interpretaci modelu jsou klı́čové jednotky měřenı́. Jejich změna (využitı́ tisı́ců dolarů namı́sto jednotek dolarů) nemá vliv na R2 2.5 Vı́cenásobná regrese Odhad metodou OLS stojı́ na předpokladu E(u|x) = 0. Pokud y závisı́ kromě x1 i na x2 a x2 do regresnı́ rovnice nezahrneme, dopouštı́me se chyby. Vliv proměnné x2 bude zahrnut v náhodné složce, která tak bude interagovat s vysvětlovanou proměnnou y. Pokud x2 ovlivňuje jak y, tak x1 , je odhad β̂1 ovlivněn i účinkem x2 na x1 a je tedy zkreslený. 3 Důkaz viz Wooldridge s. 37 4 all other things being equal 10 Tento problém je velmi snadno řešitelný - zahrneme x2 do regrese jako dalšı́ proměnnou. Nová populačnı́ rovnice: y = β 0 + β 1 x1 + β 2 x2 + u (14) Provádı́me tak vı́cenásobnou regresi = regresi s vı́ce vysvětlujı́cı́mi proměnnými. Běžná terminologie: k... počet vysvětlujı́cı́ch proměnných (x1 , x2 ,..., xk ) n... počet pozorovánı́ y... závislá proměnná i... index označujı́cı́ čı́slo pozorovánı́ j... index označujı́cı́ danou vysvětlujı́cı́ proměnnou xi,j... ité pozorovánı́ xj malá tučná pı́smena označujı́ vektory: β = (β0 , β1 ,..., βk ) velká tučná pı́smena označujı́ matice → X 2.6 Model s k nezávislými proměnnými y = β0 + β1 x1 + · · · + βk xk + u (15) Vzhledem k několikanásobnému vlivu již nelze řı́ci, že koeficienty určujı́ sklon přı́mky. Chybový člen u stále zahrnuje vše, co nenı́ obsažené v regresi a ovlivňuje y. Vysvětlujı́cı́ proměnné x1 , x2 ,... , xk často nazývány kontrolnı́mi proměnnými - kontrolujı́ pro určité vlivy. Klı́čový předpoklad: E(u|x1 , x2 ,... , xk ) = 0 Za daných předpokladů je OLS nejlepšı́ lineárnı́ nevychýlený estimátor parametrů β0 , β1 ,... , βk. (Best Linear Unbiased Estimator = BLUE) Vektorově maticová forma: y = Xβ + u (16) y... n × 1 vektor pozorovánı́ závislé proměnné X... n × k matice n pozorovánı́ k vysvětlujı́cı́ch proměnných β... k vektor neznámých populačnı́ch parametrů, jež chceme odhadnout u... n × 1 vektor chyby (ruchu, šumu) Princip stejný jako v jednoduchém regresnı́m modelu - minimalizace sumy čtverců reziduı́. Regresnı́ funkce: ŷ = X β̂ (17) Rezidua: û = y − ŷ (18) 11 Minimalizace SSR: min SSR = û′ û (19) β̂ Výsledkem je vzorec: β̂ = (X ′ X)−1 X ′ y (20) 2.6.1 Interpretace Neměnı́ se interpretace konstanty (průsečı́ku) βˆ0 - predikovaná hodnota pro y, pokud x1 a x2 = 0 Odhady βˆ1 a βˆ2 určujı́ parciálnı́ (ceteris paribus) efekty přı́slušných proměnných na y. Přı́klad: \ = 0, 284 + 0, 092educ + 0, 0041exper + 0, 022tenure log(wage) (21) Závislá proměnná v logaritmu → interpretace βˆ0 (0,284) nemá smysl. Za každý dalšı́ rok vzdělánı́ vzroste mzda v průměru o 9,2 %, ceteris paribus (βˆ1 ). Interpretace ostatnı́ch koeficientů ve stejném smyslu. Neměnı́ se interpretace přesnosti odhadu (R2 ), nicméně tento ukazatel je zkreslený vlivem vyššı́ho počtu regresorů. Proto nutno využı́t upravený koeficient determinace (adjusted R2 = R̄2 ). n−1 R̄2 = 1 − (1 − R2 ) (22) n−k−1 Modely s odlišnými závislými proměnnými (wage a log(wage)) nelze srovnávat na základě R̄2. 2.7 Funkčnı́ tvar Vztah mezi veličinami nemusı́ být vždy lineárnı́. Pro OLS lze použı́t cokoli, ale nutná linearita v parametrech. V některých přı́padech lze transformovat rovnice tak, abychom dosáhli linearity v parametrech. Lineárnı́ v parametrech Nelineárnı́ v parametrech y = β0 + β1 x + β2 x2 y = β 0 + xβ 1 log(y) = β0 + β1 log(x) y = eβ0 +β1 x Tabulka 2: Linearita a nelinearita v parametrech - ukázky Použitı́m logaritmů zı́skáme tvar, který je lineárnı́ v parametrech → dokážeme odstranit napřı́klad parametry z exponentů (Cobb-Douglasova produkčnı́ funkce) - dı́ky vzorečkům pro logaritmy. Logaritmy však přinášı́ jinou interpretaci koeficientů - dostáváme se k relativnı́m (procentuálnı́m) změnám. Model Regresnı́ funkce Interpretace β1 lev-lev y = β0 + β1 x ∆y = β1 ∆x log-lev log(y) = β0 + β1 x %∆y = (100β1 )∆x β1 lev-log y = β0 + β1 log(x) ∆y = 100 %∆x log-log β0 + β1 log(x) %∆y = β1 %∆x Tabulka 3: Interpretace koeficientu β1 v různých typech modelů Přı́klady interpretace: 12 salary \ = 963, 191 + 18, 501roe Zvýšı́-li se výnosy z kapitálu (roe) o 1 procentnı́ bod, vzroste ročnı́ plat ředitele (salary) v průměru o 18,501 $ log(wage) \ = 0, 584 + 0, 083educ Zvýšı́-li se počet let vzdělánı́ o 1 rok, vzroste ročnı́ mzda v průměru o 8,3 % (100 × 0,083). a tak dále... V log-log modelu je koefificent β1 elasticitou. Kromě logaritmů a druhých mocnin může dojı́t k zahrnutı́ interakcı́ dvou proměnných (x1 × x2 - efekt x1 závisı́ na x2 nebo naopak. Často se užı́vajı́ i tzv. binárnı́ (Dummy) proměnné zychycujı́cı́ efekt charakteristik (pohlavı́) - x pak dosahuje hodnot 1 nebo 0 (ANO nebo NE). Binárnı́ proměnné se mohou objevit i v závislé proměnné (y) → jedná se o lineárnı́ pravděpodobnostnı́ modely, logit a probit modely. Vı́ce o nich ve třetı́m bloku 2.7.1 Kvadratická funkčnı́ forma Umožňuje změnu znaménka vztahu v závislosti na hodnotách x - do určité hodnoty x y roste/klesá, následně naopak. Obrázek 3: Tvary kvadratické funkce y = β0 + β1 x1 + β2 x21 + u (23) Měnı́ se interpretace efektu změny v x - určován i pomocı́ β2. ODvozenı́ vycházı́ z parciálnı́ derivace. ∂y = β1 + 2β2 x (24) ∂x Kauzálnı́ efekt x na y se měnı́ v závislosti na hodnotě x. Rovná-li se derivace nule, dostáváme s k bodu zvratu - určité hodnotě x - nacházı́me maximum/minimum funkce. ∂y = β1 + 2β2 x = 0 (25) ∂x β1 xzvrat = − (26) 2β2 Výběrová regresnı́ funkce pak má kvadratický, parabolický tvar. 13 2.7.2 Dummy proměnné = binárnı́ proměnné x = 1, pokud platı́ daný kvalitativnı́ faktor (osoba je muž) x = 0, pokud daný faktor neplatı́ (osoba nenı́ muž) Užı́váno pro pohlavı́, národnost Interpretace: koeficient u dummy proměnné ”zvyšuje/snižuje průsečı́k”- pokud je jednotlivec muž, má v průměru vyššı́ mzdu o βi jednotek. Obrázek 4: Efekt dummy proměnné Dummy proměnné užı́vány pro definovánı́ vı́ce kategoriı́ (je auto octavia, felicia, nebo fabia). Pokud bychom zahrnuli do regrese všechny 3 (za předpokladu, že jiné kategorie nejsou), dojde k dokonalé multikolinearitě - tyto 3 kategorie jsou vzájemně perfektnı́ lineárnı́ kombinacı́. Samotný průsečı́k by neměl význam. Lze řešit vypuštěnı́m průsečı́ku - koeficienty dummy proměnných by se staly průsečı́ky pro danou kategorii vypuštěnı́m jedné z kategoriı́ (software udělá automaticky - hodnota NA; běžnějšı́ postup) → průsečı́k platı́ pro referenčnı́ kategorii, interpretace ostatnı́ch kategoriı́ platı́ vůči té referenčnı́ (octavia bude v průměru o 100 000 Kč dražšı́ než jinak srovnatelná felicia) 2.7.3 Interakce Někdy je efekt dané proměnné závislý na úrovnı́ jiné proměnné. Pro takový přı́pad využı́váme interakce mezi proměnnými. y = β0 + β1 x1 + β2 x2 + β3 x1 x2 + u (27) Interpretace parciálnı́ho efektu x1 na y: ∂y = β1 + β3 x2 (28) ∂x1 Parciálnı́ efekt x1 je dán β1 a upraven o β3 v závislosti na úrovni x2. Interpretace parciálnı́ho efektu x2 na y: ∂y = β2 + β3 x1 (29) ∂x2 14 Obrázek 5: Vliv vzdělánı́ ma mzdu pro muže a ženy Parciálnı́ efekt x2 je dán β2 a upraven o β3 v závislosti na úrovni x1. Interakce jsou bud’ s čı́selnou proměnnou, nebo i s dummy proměnnou - např. je efekt vzdělánı́ na mzdu ovlivněn i pohlavı́m - viz obrázek 5? 2.7.4 Zpřesňujı́cı́ interpretace logaritmů a jejich predikce Máme-li závislou proměnnou v logaritmu, tak standardně aproximujeme vztah s nezávislou proměnnou (zvedne se o... %) Existuje přesnějšı́ způsob - přesnou relativnı́ hodnotu (vzhledem k referenčnı́ skupině) zı́skáme jako: ∆y = eβj − 1 (30) y tj. %∆y = 100(eβj − 1) (31) tj. vztah ”xj se zvedne o 1 → nové y = eβj × původnı́ y Konfidenčnı́ intervaly pak spočı́táme jako: CI = eβ̂j ±c×SE (32) kde c... kritická hodnota Pokud se chceme z logaritmické formy vrátit do původnı́, s absolutnı́mi čı́sly, potřebujeme regresnı́ rovnici dostat zpět do exponentu musı́me zohlednit umocněnı́ reziduı́ - 2 způsoby: Rezidua majı́ normálnı́ rozdělenı́ 2 /2 E(y | x) = eσ eβ0 +β1 x1 +···+βk xk (33) Rezidua nemajı́ normálnı́ rozdělenı́ - Duanův estimátor 1 X ϵ̂i ŷ = α̂elog(y) , kde α̂ = e (34) c n 2.8 Chybná specifikace modelu Při rozhodovánı́ které proměnné zahrnout a jak je zahrnout se řı́dit předevšı́m ekonomickou teoriı́ a zdravým rozumem. 15 Ideálně zahrnout všechny regresory, které mohou mı́t efekt na závislou proměnnou. Následně omezit model pomocı́ vhodných testů (F-test - pokud nezamı́tneme nulovou hypotézu, model nesmyslný) Pokud by měl být správný dle teorie, zkontrolovat data a vynechánı́ druhých mocnin, interakcı́ apod. Ramsey RESET test pro špatnou specifikaci. – Odhadnout model pomocı́ OLS – Uložit odhadnuté hodnoty ŷ – Odhadnout původnı́ regresnı́ model s přidánı́m umocněných odhadnutých hodnot y = β0 + β1 x1 + · · · + βk xk + δ1 ŷ 2 + δ2 ŷ 3 + u – F-test pro společnou významnost ŷ 2 a ŷ 3 nulová hypotéza H0 : δ1 = δ2 = 0 nezamı́tnutı́ - model specifikován správně - nechybı́ nelinearity Princip úspornosti (parsimony) - nejsme-li si jistı́, vybereme jednoduššı́ model. 2.9 OLS estimátor jako náhodná proměnná Snažı́me se odhadnou populačnı́ regresnı́ funkci na základě náhodného vzorku. Všřı́me, že existujı́ skutečné (populačnı́) hodnoty parametrů, jež zná jen Bůh. At’ se snažı́me sebevı́c, vždy poznáme pouze jejich odhady (nelze sebrat data o kompletnı́ populaci 8 miliard lidı́). Hodnota těchto odhadů tedy závisı́ na konkrétnı́m vzorku, pro který máme data → jiný vzorek povede k jiným odhadům koeficientů. Dı́ky náhodnému výběru vzorku můžeme i koeficienty β̂0 a β̂1 považovat za náhodné proměnné. Hodnoty, jež zı́skáme do modelu jsou jejich realizacemi. Obrázek 7: Odhadnuté regresnı́ funkce pro Obrázek 6: Hodnoty pro simulovanou populaci různé vzorky 16 Obrázek 8: Rozdělenı́ koeficientu β̂1 Naše odhady (estimators) budeme studovat jako náhodné proměnné - potřebujeme znát střednı́ hodnotu a rozptyl. Pro možnost popisu těchto vlastnostı́ musı́me učinit určité předpoklady. 2.10 Gauss-Markovovy předpoklady (MLR předpoklady) MLR.1 Linearita v parametrech MLR.2 Náhodný vzorek (random sampling) MLR.3 Absence perfektnı́ multikolinearity a variabilita vzorku ve vysvětlujı́cı́ch proměnných Žádná z nezávislých proměnných nenı́ konstantnı́ a neexistujı́ mezi nimi žádné přesné lineárnı́ vztahy. Proměnné smı́ být korelované, nesmı́ být dokonale korelované. Kolinearita = korelace mezi nezávislými proměnnmi vyjadřujı́cı́ lineránı́ vztah v regresnı́m modelu Nepřijatelně vysoká kolinearita - měřı́ ji Variance Inflation Factor (VIF): – měřı́, do jaké mı́ry se zvýšı́ rozptyl odhadovaného regresnı́ho koeficientu kvůli multikolinearitě – výpočet: 1 V IFj = (35) 1 − Rj2 – kde: ∗ V IFj... VIF pro j tou nezávislou proměnnou ∗ Rj2... koeficient determinace pro regresi j té nezávislé proměnné na ostatnı́ nezávislé vysvětlujı́cı́ proměnné – Vysoké hodnoty VIF (zpravidla > 5 nebo > 10) ukazujı́ na významnou multikolinearitu 17 – Nizké hodnoty VIF (blı́zko 1) naznačujı́ nı́zkou korelaci prediktoru s ostatnı́mi regresory Typické přı́činy vysoké multikolinearity – současné použitı́ stejného regresoru v různých jednotkách – použitı́ proměnných, které jsou lineárnı́ kombinacı́ rovnajı́cı́ se jedné spolu s užitı́m průsečı́ku β0 např. použitı́ všech kategoriı́ definovaných pomocı́ dummy proměnných (nutno některou vynechat jako referenčnı́ kategorii) – použitı́ proměnné, kterou lze vyjádřit jako přesnou lineárnı́ kombinaci (funkci) dvou nebo vı́ce nezávislých proměnných např. vliv výdajů na kampaň na počet zı́skaných hlasů (zakomponovánı́ výdajů jednotlivých stran i celkových výdajů všech stran) – chceme-li odhadnout k + 1 parametrů, potřebujeme minimálně k + 1 pozorovánı́ Důsledky vysoké multikolinearity – OLS nemá řešenı́ - nelze vypočı́tat inverznı́ matice X ′ X – nejsme schopni interpretovat βj ceteris paribus - menı́ se současně Detekce – Podı́vat se na korelogram a spočı́tat VIF – programy jako R nevypočı́tajı́ hodnotu pro βj - napı́še NA Řešenı́ – odstranit problematickou proměnnou, – nebo odstranit průsečı́k – v přı́padě nedostatku pozorovánı́ přidat pozorovánı́ Co ignorovat – jiný funkčnı́ tvar pro stejnou proměnnou - x a x2 - nezpůsobuje perfektnı́ multikolinearitu pozor u logaritmů! (kvůli vzorcům s logaritmy a mocninami) MLR.4 Exogenita vysvětlujı́cı́ch proměnných E(u|x1 ,... , xk ) = 0 nulová podmı́něná střednı́ hodnota u platı́ pro všechny regresory - žádný nenı́ korelován s u možná porušenı́ – korelace mezi xj a u způsobená nepozorovaným faktorem – vynechánı́ důležité proměnné (omitted variable bias) – použitı́ špatného funkčnı́ho tvaru pokud MLR.4 platı́, máme exogennı́ vysvětlujı́cı́ proměnné 18 MLR.5 Homoskedasticita reziduı́ var(u|x1 ,... , xk ) = σ 2 chyba u má stejný rozptyl pro jakékoli hodnoty vysvětlujı́cı́ch proměnných rozptyl v chybovém členu u je stejný pro všechny kombinace výstupů vysvětlujı́cı́ch proměnných Obrázek 9: Homoskedasticita Obrázek 10: Heteroskedasticita MLR.6 Normalita reziduı́ u ∼ N (0, σ 2 ) populačnı́ chyba u je nezávislá na vysvětlujı́cı́ch proměnných populačnı́ chyba u má normálnı́ rozdělenı́ s nulovou střednı́ hodnotou a konstantnı́m rozptylem σ 2 Za předpokladů MLR.1 - MLR.4 je OLS model nevychýlený a konzistentnı́. Za předpokladů MLR.1-MLR.5 je také vydatný. U malých vzorků je konzistentnı́ pouze, platı́-li i MLR.6 2.10.1 Nevychýlenost = nestrannost (unbiased) Docházı́ k nı́, jsou li dodrženy předpoklady MLR.1 - MLR.4. Estimátory jsou nevychýlené pro jakékoli hodnoty populačnı́ho parametru βj E(β̂j ) = βj , j = 0, 1,... , k (36) Jedná se o vlastnost estimátoru, nikoli hodnoty. Řı́ká, že kdybychom sesbı́rali vı́ce náhodných vzorků, OLS nebude systematicky nadhodnocovat ani podhodnocovat skutečné hodnoty. 19 Obrázek 11: Nevychýlenost (nestrannost) Obrázek 12: Vychýlenost Na obrázku 11 vidı́me nestrannost odhadů koeficientu - střednı́ hodnotou je populačnı́ koeficient. Naopak na obrázku 12 lze spatřit situaci, kdy OLS systematicky nadhodnocuje odhady populačnı́ho koeficientu (jeho skutečná hodnota je ukázána vlevo červenou čarou). 2.10.2 Konzistence - na velikosti záležı́ Konzistentnost je ještě důležitějšı́ vlastnost než nevychýlenost. Odhady na skutečných datech budou často vychýlené (někdy dokonce nestrannosti nejde dosáhnout), takový odhad nemusı́ být špatný - nenı́ to důvod k jeho zavrženı́. Odhady však vždy musı́ být konzistentnı́, tj. s růstem vzorku n se rozdělenı́ β̂j soustřed’uje, koncentruje kolem βj. plim β̂j = βj (37) n→∞ Obrázek 13: Konzistence na obrázku - s vyššı́m počtem n rostě přesnost β̂j 20 2.10.3 Vydatnost - přesnost (rozptyl) OLS odhadů Nevychýlený odhad zajišt’uje, že OLS v průměru nenadhodnocuje ani nepodhodnocuje skutečné parametry, nemluvı́ o přesnosti odhadů. Přesnost se měřı́ pomocı́ rozptylu odhadů. Pokud máme dva nevychýlené odhady (A a B), lepšı́ je ten s nižšı́m rozptylem → pokud var(A) < var(B) je A lepšı́. A je vydatnějšı́ (efficiency) Pro popis rozptylu OLS estimátorů existuje MLR.5 - homoskedasticita. 2.10.4 Vı́ce o rozptylu estimátorů... Za předpokladů MLR.1 - MLR.5 platı́: σ2 var(β̂j |x1 ,... , xk ) = , j = 1,... , k (38) SSTj (1 − Rj2 ) SSTj = Pn i=1 (xi,j − x¯j )2... celková variabilita vzorku v xj Rj2... koeficient determinace z regrese xj podle ostatnı́ch nezávislých proměnných včetně průsečı́ků Čı́m, vyššı́ je SSTj (variabilita v xj ), tı́m přesnějšı́ budou odhady OLS - přidat vı́ce pozorovánı́. Čı́m nižšı́ je σ 2 (rozptyl chybového členu u), tı́m přesnějšı́ budou odhady OLS - přidat vı́ce vysvětlujı́cı́ch proměnných Čı́m vyššı́ je korelace mezi regresory (tı́m vyššı́ je R2 ), tı́m méně přesné budou odhady OLS. Jinými slovy, čı́m vyššı́ je multikolinearita, tı́m méně přesné budou odhady OLS. Rozptyl chybového členu (σ 2 ) je neznámý - jedná se o populačnı́ parametr - zná jej jen Bůh. Pokud platı́ předpoklady MLR.1-MLR:5, lze ho nevychýleně odhadnout: SSR σ̂ 2 = (39) n−k−1 Člen n − k − 1 označuje stupně volnosti (degrees of freedom, df) Odmocninou z odhadnutého rozptylu je směrodatná chyba regrese (standard error - s.e.) - nenı́ to totéž co směrodatná odchylka! Je to jejı́ estimátor. Směrodatná odchylka s σ2 sd(β̂j = (40) SSTj (1 − Rj2 Směrodatná chyba - odhad s.d. z našeho vzorku - výstup v R s σ̂ 2 sd(β̂j = (41) SSTj (1 − Rj2 2.11 Gauss-Markovova věta Za předpokladů MLR.1 - MLR.5 je OLS estimátor nejlepšı́ lineárnı́ nevychýlený estimátor (Best Linear Unbiased Estimator = Blue) regresnı́ch koeficientů. Nejlepšı́... nejnižšı́ rozptyl (vydatnost) 21 Lineárnı́... lineárnı́ v parametrech Nevychýlený... očekávaná hodnota odhadu βˆj je skutečná hodnota βj Estimátor Za těchto přepokladů s rostoucı́ velikostı́ vzorku rozdělenı́ estimátorů konverguje k normálnı́mu rozdělenı́ N(0,1). U malých vzorků nutný předpoklad MLR.6 - normalita. Dı́ky MLR.6 lze odvodit přesné výběrové rozdělenı́ OLS - platı́: β̂1 ∼ N (β1 , var(βˆ1 )). To implikuje: βˆ1 −β1 s.d.(βˆ ) ∼ N (0, 1). 1 βˆ1 −β1 Navı́c platı́: s.e.(βˆ1 ) ∼ tn−k−1 (studentovo t rozdělenı́). Studentovo rozdělenı́ je transformované normálnı́ rozdělenı́ pro přı́pad, kdy máme výběrové soubory a neznáme populačnı́ směrodatnou odchylku - odhadujeme ji. Obrázek 14: Srovnánı́ normálnı́ho a studentova rozdělenı́ 2.12 Testovánı́ hypotéz Porovnánı́ nulové hypotézy H0 vůči alternativnı́ hypotéze Ha (H1 ) Proces: 1. Formulace nulové hypotézy a alternativný hypotézy 2. Sbı́ránı́ a analýza vzorku dat 3. Volba hladiny významnosti α k určenı́ hranice pro statistickou významnost (standardně 5 %) 4. Provedenı́ statistického testu (t-test pro významnost jednotlivých regresorů, F-test pro sdruženou významnost) k výpočtu testové statitstiky 5. Porovnánı́ testové statistiky s kritickou hodnotou (pro 95% hladinu významnosti zpravidla 1,96), přı́padne odvozenou p-hodnotou 6. Rozhodnutı́ a vyvozenı́ závěrů Rozdělenı́ standardizovaného estimátoru: βˆj − βj (42) se(βˆj ) 22 Obrázek 15: T-rozdělenı́ Obrázek 16: Výstup z R Neznáme opulačnı́ koeficient Bj , ale poskytne nám ho nulová hypotéza → zpravidla βj = 0. Nulová hypotéza tak řı́ká, že parciálnı́ kauzálnı́ efekt xj na y je v populaci nulový = nevýznamný, Lišı́-li se β̂j významně od nuly, zamı́táme H0 , data svědčı́ ve prospěch alternativnı́ hypotézy, která řı́ká, že odhadnutý parametr je významný. Typicky: Chceme dokázat, že xj má vliv na y - chceme zamı́tnout hypotézu, že xj nemá žádný efekt na y H0 : βˆj = 0, H1 : βˆj ̸= 0 (43) pro H0 má standardizovaný estimátor tento tvar: β̂j − 0 β̂j koef icient = = (44) se(β̂j ) se(β̂j ) směrodatnáchyba Pokud bychom chtěli např. dokázat, že má většı́/menšı́ vliv než 1, dosadı́me do H0 1 za 0. R toto vše spočı́tá za nás - viz výstup na obrázku 16 2.12.1 P-hodnota Statistika, kterou ekonometrický software (R, Gretl, STATA) sám vypočı́tává. 23 Pravděpodobnost, že napozorujeme testovou statistiku ukazatele (t-hodnoty), tak extrémnı́, jako jsme napozorovali, za předpokladu, že H0 je pravdivá. Nejnižšı́ hladina významnosti, při které stále zamı́táme H0. Čı́m menšı́ p-value, tı́m lepšı́. Čı́m vyššı́ významnost parametru, tı́m nižšı́ p-hodnota. Čı́m nižšı́ je p-hodnota, tı́m jistěji zamı́táme H0. Je-li p-value nižšı́ než předem určená hladina významnosti α, zamı́táme H0. Standardnı́ význam hvězdiček u p-hodnoty (někdy jiný - správně musı́ být uvedeno v komentáři výstupu regrese): ·... p-hodnota < 0,1 → H0 můžeme zamı́tnout při α = 10 % *... p-hodnota < 0,05 → H0 můžeme zamı́tnout při α = 5 % **... p-hodnota < 0,01 → H0 můžeme zamı́tnout při α = 1 % ***... p-hodnota < 0,001 → H0 můžeme zamı́tnout při α = 0,1 % 2.12.2 Intervaly spolehlivosti (Confidence intervals) 95% interval spolehlivosti (CI) = interval pokrývajı́cı́ skutečný populačnı́ parametr v 95% přı́padů β̂j = ±c × se(β̂j ), (45) kde c je kritická hodnota (97,5 percentil tn−k−1 ) 95% CI: S pravděpodobnostı́ 95 % ležı́ neznámá skutečná populačnı́ hodnota parametru v daném intervalu. Čı́m širšı́ CI, tı́m méně přesné výsledky. 2.13 Společné testovánı́ parametrů - F-test Lze testovat i společnou významnost koeficientů pomocı́ lineárnı́ch restrikcı́. H0 : β3 = β4 = 0 (46) Tj. společná nevýznamnost - pokud bychom nezamı́tli H0 , měli bychom x3 a x4 vyloučit, protože se vztah mezi nimi a y jevı́ jako nulové. Jak funguje F-test: odhadujeme 2 modely jeden bez omezenı́ (U - unrestricted) U : y = β0 + β1 x1 + β2 x2 + u (47) druhý s omezenı́mi (R - restricted) R : y = γ0 + γ1 x1 + u (48) zavedeme-li nová omezenı́, SSR se pouze mohou zvýšit → R2 je většı́ v neomezeném modelu, SSRR ≥ SSRU. je-li zvýšenı́ SSR prokazatelně velké (tzn. horšı́ vysvětlenı́ dat), omezený model vysvětuje data mnohem hůře než neomezený. 24 F-test použı́vá tento rozdı́l pro stanovenı́ F-statistiky SSRR −SSRU (SSRR − SSRU )/q q = SSRU (49) SSRU /n − k − 1 n−k−1 q... počet lineárnı́ch omezenı́ Vysoká F-statistika - zamı́tnutı́ H0 - jednoduššı́ mmodel vysvětluje data dostatečně správně. Při dodrženı́ MLR.1-MLR.5 má F-statistika F- rozdělenı́ s q počtem omezenı́ a n - k - 1 stupni volnosti, tj. SSRR −SSRU q SSRU ∼ Fq,n−k−1 (50) n−k−1 Zamı́táme H0 , pokud F-statistiak vyššı́ než 95. percentil F-rozdělenı́, lze najı́t v tabulkách, nicméně software spočı́tá i s p-hodnotou. Přı́klad pro H0 : β1 = β2 = β3 = 0 Obrázek 17: F-statistika v R výstupu 2.14 Heteroskedasticita a problematika s nı́ spojená Předpoklad MLR.5 (var(u|x1 ,... , xk ) = σ 2 ) - komstantnı́ rozptyl reziduı́ - homoskedasticita. Pokud porušeno, docházı́ k heteroskedasticitě - naštěstı́ lze řešit. Heteroskedasticita znamená, že rozptyl chybového členu je různý pro každé jednotlivé pozorován - nenı́ konstantnı́. Proč je to problém? Odhad rozptylu (σ̂ 2 ) využı́váme k výpočtu směrodatné chyby, kterou užı́váme k testovánı́ hypotéz - pokud data obsahujı́ heteroskedasticitu, jsou směrodatné chyby i testové statistiky zkreslené, což může vést k chybným závěrům. 2.14.1 Detekce 1. Vizuálnı́ testy Graf reziduı́ vs. odhadnuté hodnoty - sledujeme rozptyl 2. Breusch-Pagan test odhaduje rezidua ma vysvětlujı́cı́ch proměnných z definovaného modelu, testuje významnost modelu pomocı́ F-testu û2 = β0 + β1 x1 + · · · + βk xk + ϵ (51) 25 H0 : σi2 = σ 2 , homoskedasticita (52) H1 : nonH0 , heteroskedasticita (53) 3. White test stejný postup, ale obsahuje druhé mocniny proměnných a jejich interakce5 û2 = β0 + β1 x1 + β2 x2 + β3 x21 + β4 x22 + β5 x1 x2 + ϵ (54) H0 : σi2 = σ 2 , homoskedasticita (55) H1 : nonH0 , heteroskedasticita (56) 2.14.2 Řešenı́ heteroskedasticity 1. Odhad pomocı́ zobecněné metody nejmenšı́ch čtverců (Generalized Least Squares - GLS) v přı́padě heteroskedasticity existuje funkce h(X) popisujı́cı́ heteroskedasticitu následovně: var(u|X) = σ 2 h(X)6 (57) pro náhodný výběr tj. var(ui |xi ) = σ 2 h(xi ) podmı́něnou varianci můžeme vydělit p p výrazem h(xi ) → dostaneme konstatnı́ rozptyl (varianci vlastně dělı́me ”vahou- h(xi ) → a aplikujeme tak váženou metodu nejmenšı́ch čtverců) stejnou vahou h(xi ) vydělı́me celou rovnici: p y 1 xi,1 xi,k ui p i = β0 p + β1 p + · · · + βk p +p (58) h(xi ) h(xi ) h(xi ) h(xi ) h(xi ) Chybový člen je nynı́ upraven pro heteroskedasticitu → je homoskedstický - odhadujeme rovnici: yi∗ = β0 x∗i,0 + β1 x∗i,1 + · · · + βk x∗i,k + u∗i (59) x platı́: yi∗ = √ yi , x∗i,0 = √ 1 a x∗i,j = √ i,j , kde j = 1,... , k h(xi ) h(xi ) h(xi ) Problém je, že funkce h(X) nenı́ známá - využijeme zobecněnou metodu nejmenšı́ch čtverců (Feasible Generalized Least Squared - FGLS) – Odhadneme model reziduı́: h(X) ≈ û2 = eδ0 +δ1 x1 +···+δk xk +ϵ (60) – tento model reziduı́ lze odhadnout pomocı́ OLS (po transformovánı́, abychom dodrželi MLR.1 - linearita v parametrech) log(û2 ) = δ0 + δ1 x1 + · · · + δk xk + ϵ (61) \ = eδ0 +δ1 x1 +···+δk xk ) – na základě tohoto modelu se spočı́tá odhad váhové funkce (h(X) dále postup jako u GLS - mı́sto váhové funkce použı́váme odhad 5 Rovnice 114 je přı́kladem pro White test modelu s 2 regresory. 6 Standardně rozptyl popisuje pouze funkce σ 2 , nicméně rozptyl nenı́ konstantnı́, proto je tam nějaká dalšı́ funkce → h(X), která popisuje právě tyto změny v rozptylu 26 FGLS – nenı́ nevychýlená (OLS s heteriskedasticitou je nevychýlená) – je konzistentnı́ – je vydatná (OLS s heteroskedasticitou nenı́) 2. Robustnı́ směrodatné chyby směrodatné (standardnı́) chyby při heteroskedasticitě chybné → špatně vypočtené testy při platnosti MLR.1 - MLR.5 je rozptyl: σ̂ 2 var(β̂j ) = (62) SSTxj při porušenı́ MLR.5 (tzn. heteroskedasticita je přı́tomna) máme vychýleny odhad směrodatné chyby σ̂ Rozptyl směrodatné chyby lze nahradit použitı́m reziduı́ (û2i ≈ σ̂i2 ) → stamdardnı́ chyby spočtené tı́mto způsobem jsou robustnı́ vůči heteroskedasticitě û2 var(β̂j ) = (63) SST 2.15 Postup modelovánı́ Předpokládáme, že máme data, hypotézy a jdeme modelovat. 1. Pohled na data - jsou tam outliery? Je tam viditelný kvadratický vztah? 2. Definice modelu - rovnice, kterou budeme odhadovat. 3. Odhadnutı́ v softwaru 4. Kontrola, zda nedocházı́ k nepřı́pustně vysoké multikolinearitě - pohled na korelačnı́ matici a spočı́tánı́ VIF - pokud většı́ než 10 - problém (netýká se interakcı́ a mocnin proměnných) 5. BP a White test - pokud zamı́tneme H0 , docházı́ k heteroskedasticitě a musı́me řešit - robustnı́ standard errors, popř. FGLS (robustnı́ S.E. jednoduššı́) 6. Potenciálně Ramsey RESET test - zda je model správně specifikován 7. Interpretace a závěry 27 3 Druhý blok - jednorozměrné časové řady Jednorozměrné časové řady - pozorovánı́ 1 subjektu v čase = ”Řada pozorovánı́ jedné konkrétnı́ proměnné indexovaných pomocı́ času.” ”Časovou řadu můžeme definovat jako realizaci stochastického (náhodného) procesu, který zachycujeme pomocı́ pozorovánı́ s časovým indexem t.” proměnné sledovány v průběhu času proměnné seřazeny podle času Opět se odhadujı́ regrese, ale trochu jinak - pro časové řady speciálnı́ teorie, protože hodnoty jsou na sobě v čase závislé. Tj. hodnota v čase t je ovlivněna hodnotou v čase t − 1 a klidně i hodnotou t − 2 atd. Jedná se o tzv. sériovou korelaci, která vyžaduje jiné metody než potřebujı́ cross-sectional data - dynamická VS. statická analýza. Pomocı́ časových řad lze dělat předpovědi do budoucna (přı́padně i zpětně do minulosti). V prvnı́m bloku řešı́me jednorozměrné časové řady - časová řada 1 proměnné (univariate time series). Čtvrtý blok řešı́ analýzu několika časových řad souběžně (multivariate time series). Terminologie: t = 1, 2,... , T , t... index času y = y1 , y2 ,... , yT T... celkový počet pozorovánı́ (časových obdobı́, zároveň poslednı́ časové obdobı́/pozorovánı́) pro práci s vı́cerozměrnými TS (time-series = časové řady) přı́dáme xt a popř. zt ut... náhodná složka Jednorozměrné časové řady řešı́me, protože: metody pro jednorozměrné TS vyžadujı́ slabšı́ předpoklady než pro vı́cerozměrné metody pro jednorozměrné TS nám umožnı́ navázat s komplikovanějšı́mi metodami pro vı́cerozměrné TS při předpovědı́ch potřebujeme predikovat 1 proměnnou, ne dalšı́ zahrnuté 3.1 Grafy Pomáhajı́: odhalit regulérnost chovánı́ dat, identifikovat anomálie v datech srovnat různé části dat porozumět většı́m datasetům Pro TS použı́váme spojnicové grafy - čas na horizontálnı́ ose, spojená pozorovánı́, jejich hodnoty na vertikálnı́ ose. Někdy je mı́ra růstu užitečnějšı́ než úroveň proměnné - typicky se užı́vajı́ 4 druhy růstu yt −yt−1 jednoduchý růst - procentuálnı́ nárůst oproti předchozı́mu pozorovánı́: ỹt = yt−1 × 100 anualizovaný růst - procentuálnı́ nárůst, který by proběhl za rok, kdyby proměnná rostla stejným 28 yt −yt−1 n tempem v každém obdobı́: ỹt × n ≈ ((1 + yt−1 ) − 1) × 100, pokud ỹt a n (počet obdobı́ v roce) jsou malé yt −yt−n meziročnı́ růst - procentuálnı́ nárůst oproti stejnému obdobı́ v předchozı́m roce: yt−n × 100 ročnı́ růst - jednoduchý růst proměnné měřené v ročnı́ frekvenci Chceme-li studovat úroveň rostoucı́ proměnné v dlouhém obdobı́, často docházı́ k problémům s měřı́tkem (přı́liš velké - nerozeznáme pohyby na začátku) a navı́c stejně velký relativnı́ nárůst vypadá jiank na začátku a na konci. Řešenı́m je logaritmická transformace - exponenciálně rostoucı́ řady do lineárně rostoucı́ch. Sklon takové řady je přibližně roven mı́ře růstu. Obrázek 18: Logaritmická transformace 3.2 Grafy časové korelace Zcela zásadnı́ pro analýzu časových řad jsou grafy časové korelace. Na jejich základě vybı́ráme vhodné modely pro práci s TS. Studujeme autokorelaci a parciálnı́ autokorelaci TS v různých zpožděnı́ch (autokorelace řı́ká, jak moc na sobě hodnoty v jednotlivých zpožděnı́ch závisı́, parciálnı́ korelace pak odstraňuje vliv předchozı́ch zpožděnı́). Pro vı́cerozměrné TS studujeme korelaci mezi vı́ce proměnnými v různých zpožděnı́ch. Autokorelačnı́ graf Korelace mezi danou proměnnou a jejı́mi zpožděnými hodnotami pro různé hodnoty zpožděnı́ Parciálnı́ autokorelačnı́ graf Korelace mezi danou proměnnou a jejı́mi zpožděnými hodnotami pro různé hodnoty zpožděnı́ očištěné o korelaci způsobenou méně zpožděnými hodnotami 29 Obrázek 19: Graf autokorelace Obrázek 20: Graf parciálnı́ autokorelace 3.3 Složky časových řad Rozdı́lnost časových řad je důsledkem přı́tomnosti či absence různých složek. Trendová složka - dlouhodobá tendence ke zvyšovánı́/snižovánı́ v průběhu času Cyklická složka - střednědobá odchylka od trendu Sezónnı́ složka - periodicky se opakujı́cı́ výkyvy ve známých dobách Nesystémová složka, zbytková - zbytkové fluktuace způsobené náhodnými šoky Cyklickou a nesystémovou složku je obtı́žné oddělit - proto analyzovány společně. Obrázek 21: Rozklad TS na složky v R V analýzách se zaměřujeme zejména na cyklické a nesystémové komponenty - přı́tomny ve všech časových řadách. Struktura trendu zmı́něna krátce - změny v dynamice často nepředvı́dané. Sezónnost nemá významnou ekonomickou hodnotu - lze odstranit - často dělá už poskytovatel dat. 30 3.4 TS jako sumy šoků Nudná časová řada - minulé hodnoty nepomáhajı́ předpovědět aktuálnı́ hodnoty - řada se skládá z nezávislých šoků. y na sobě nejsou závislé, tudı́ž nevyžadujeme speciálnı́ metody ve srovnánı́ s průřezovými daty. Jedná ze o tzv. bı́lý šum - white noise. yt = ut (64) kde ut je nekorelovaná náhodná složka. Aby byla časová řada zajı́mavá, potřebujeme sériovou korelaci (způsobenou účinkem šoků trvajı́cı́ch déle než 1 obdobı́). pozitivnı́ korelace yt je vysoko, tudı́ž yt+1 bude spı́še vysoko negativnı́ korelace yt je vysoko, tudı́ž yt+1 bude spı́še nı́zko 3.4.1 Vlastnosti šoků 1. Woldův reprezentativnı́ teorém ∞ X yt = ut + b1 ut−1 + b2 ut−2 + · · · + bi ut−i (65) i=0 každá TS může být vyjádřena jako nekonečná suma nekorelovaných šoků koeficienty bi měřı́ účinek šoku zpožděného o i obdobı́, jsou stabilnı́ v čase a tvořı́ nekonečnou sekvenci Aktuálnı́ hodnota TS sumou účinků současných a minulých šoků. 2. Propagace šoků šoky ovlivňujı́ řadu po několik obdobı́ stejným způsobe, např. po pozitivnı́m šoku lze očekávat, že TS zůstaně nad průměrem po několik t 3. Amplifikace šoků maximálnı́ účinek šoků je většı́, nže počátečnı́ účinek napr. po pozitivnı́m šoků lze očekávat, že TS dosáhne ještě vyššı́ hodnoty 31 Obrázek 22: Propagace a amplifikace v grafu Propagace a amplifikace se vztahujı́ k chovánı́ TS po zavedenı́ šoku, proto studujeme TS formou zavedenı́ šoku o velikosti 1, nebo 1 standardnı́ odchylky a pozorujeme graf/funkci odezvy na impulz - viz obrázek 22. 3.5 ARMA modely Chceme aproximovat nekonečný počet koeficientů pro jednotlivé šoky (viz Woldův teorém), tak, abychom měli konečný počet parametrů. 3.5.1 Modely klouzavých průměrů - Moving Average - MA modely Účinek šoku na současnou hodnotu je tı́m menšı́, čı́m vı́ce v minulosti k němu došlo. Po určitém bodu (po q koeficientech) se je vliv šoků roven 0 - aproximace, ale může být dostatečná. 1. MA(1) model - Model klouzavých průměrů řádu 1 Předpoklad, že šoky majı́ účinek přesně 1 dalšı́ obdobı́. Jediný parametr - kontroluje hodnota y v 1. obdobı́ po výskytu šoku yt = ut + θut−1 (66) následujı́cı́ profil po jednotkovém šoku: yt se zvýšı́ v t o 1 yt se změnı́ v obdobı́ t + 1 podle toho, zda θ > 0 nebo θ < 0 yt se vrátı́ na 0 v obdobı́ t + 2 a už se nezměnı́ 32 Obrázek 23: Odezva MA(1) na šok s thetou Obrázek 24: Odezva MA(1) na šok s thetou 0,8 1,5 MA(1) je zajı́mavá TS - docházı́ k sériové korelaci. Pokud θ > 0 - pozitivnı́ sériová korelace - po kladné hodnotě bude nejspı́š následovat kladná hodnota Pokud θ < 0 - negativnı́ sériová korelace - po kladné hodnotě bude nejspı́š následovat záporná hodnota 2. MA(q) model - Model klouzavých průměrů řádu q v MA(1) modelu majı́ šoky účinek pouze na 1 dalšı́ obdobı́. v některých TS majı́ šoky efekt déle - MA modely toho dosáhnou zavedenı́m dalšı́ch šoků a odpovı́dajı́cı́ch parametrů. MA(q) model pak vypadá následovně: yt = ut + θ1 ut−1 + θ2 ut−2 + · · · + θq ut−q (67) Po q obdobı́ch se TS vracı́ na původnı́ hodnotu. Reakce modelu se řı́dı́ koeficienty θi → zmena z obdobı́ i na i + 1 závisı́ na rozdı́lu mezi θi a θi+1 3.5.2 Autoregresivnı́ modely - Autoregression - AR modely V MA(q) modelech trval šok (q) obdobı́, nicméně v realitě mohou mı́t šoky dlouhodobé účinky. Pokud bychom takovou situaci modelovali pomocı́ MA(q) modelu, potřebovali bychom velké množstvı́ koeficientů. Dlouhodobé účinky jsou typické, když jsou účinky postupně eliminovány (snižovány) → každé obdobı́ šok ztratı́ daný procentuálnı́ podı́l předchozı́ho účinku. Přı́klad: Každé obdobı́ eliminováno 20 % šoku o velikosti 3 Vznikne řada: 3 ; 3 × (1 − 0, 2); 3 × (1 − 0, 2)(1 − 0, 2); · · · = 3; 3 × 0, 8; 3 × 0, 82 ;... věnujte pozornost umocňovánı́ Postupnou eliminaci lze zachytit ve Wooldově reprezentaci: yt = ut + b1 tt−1 + b2 tt−2 +... 33 = ut + ϕut−1 + ϕ2 ut−2 + ϕ3 ut−3 +... (68) P∞ = i=0 ϕi ut−i Nekonečný počet koeficientu b lze nahradit koeficientem ϕ. 1. AR(1) model - Autoregresivnı́ model řádu 1 Autoregresnı́ koeficient ϕ je v absolutnı́ hodnotě < 1. Propojuje aktuálnı́ hodnotu yt s předchozı́ hodnotou yt−1 - následuje autoregresi yt = ϕyt−1 + ut (69) Následujı́cı́ profil jednotkového šoku: zvýšenı́ ut o 1 zvýšı́ yt o 1 zvýšenı́ yt o 1 zvýšı́ yt+1 o ϕ, protože yt+1 = ϕyt + ut+1 zvýšenı́ yt o 1 zvýšı́ yt+2 o ϕ2 , protože7... Nárůst yt o 1 zvýšı́ yt+n o ϕn Účinek šoku se postupně snižuje - každé obdobı́ eliminován podı́l 1 − ϕ ϕ musı́ v AR(1) modelu vždy být < 1, jinak by model explodoval. AR(1) model tudı́ž nemůže mı́t amplifikaci. Již z principu má AR model vestavěnou propagaci, která se zvyšuje s ϕ. Může docházet k negativnı́ sériové korelaci, pokud ϕ < 0 - v absolutnı́ hodnotě šoky klesajı́, ale znaménko se v každém zpožděnı́ převracı́. Obrázek 26: Reakce na šoky v AR(1) Obrázek 25: Reakce na šoky AR(1) modelu modelu s negativnı́m ϕ 2. AR(p) model - Autoregresivnı́ model řádu p AR(1) neumožňuje amplifikaci šoků. Pokud bude yt záviset nejen na yt1 , aleiyt2 , lze amplifikace dosáhnout → model AR(2) yt obecně může záviset na p zpožděnı́ch - vede k AR(p) modelu s p koeficienty. AR(p) definován jako: yt = ϕ1 yt−1 + ϕ2 yt−2 + · · · + ϕp yt−p + ut (70) 7 protože yt+2 = ϕyt+1 + ut+2 = ϕ(ϕyt + ut+1 ) + ut+2 = ϕ2 yt + ϕut+1 + ut+2 34 Reakce na šoky: Obrázek 27: Reakce AR(p) modelů na šoky 3.5.3 Smı́šené modely - ARMA modely Šoky v AR modelech velmi perzistentnı́. Šoky v MA modelech velmi přechodné. Ekonomické TS často vykazujı́ perzistentnı́ i přechodné šoky - potřebujeme smı́šené modely - část šoku bude považována za perzistentnı́ a část za přechodnou. MA modely byly dobrou aproximacı́ v prvnı́ch q obdobı́ch, AR modely byly leošı́ aproximacı́ ve velkém počtu obdobı́ → smı́šené modely s oběma typy šoků flexibilnějšı́ a s lepšı́ aproximacı́. ARMA(p,q) vypadá následovně: yt = ϕ1 yt−1 + · · · + ϕp yt−p + ut + θ1 ut−1 + · · · + θq ut−q (71) v přı́padě ARMA(1,1) pak: yt = ϕ1 yt−1 + ut + θ1 ut−1 (72) Různým kombinovánı́m typů šoků přicházı́ různé reakce ARMA modelů na šoky. Pro odhad koeficientů se užı́vá metoda maximálnı́ věrohodnosti. Přı́stupy pro odhad vhodného ARMA modelu: Box-Jenkinsonova metoda - identifikace pomocı́ autokorelačnı́ch funkcı́ (ACF a PACF) – Standardně nemůžeme rozpoznat odezvy na šoky, protože neznáme šoky – Modely identifikujeme na základě důsledků pro autokorelaci 35 – ACF (Autocorrecaltion function) je funkce se zpožděnı́mi jako vstupem a autokorelacı́ jako výstupem ACF: ρ(τ ), kde τ = 1, 2,... indikuje zpožděnı́ Graf ACF zobrazı́ hodnoty pro několik prvnı́ch zpožděnı́ – PACF (Partial autocorellation function) je funkce se zpožděnı́mi jako vstupem a parciálnı́ autokorelacı́ jako výstupem PACF: ϱ(τ ), kde τ = 1, 2,... indikuje zpožděnı́ Graf PACF zobrazı́ hodnoty pro několik prvnı́ch zpožděnı́ PACF ϱ(τ ) lze zı́skat regresı́ yt na yt−1 ,... , yt−τ – Pro AR model z definice platı́: ϱ(1) = ϕ, pro AR(1) obecně platı́, že ϱ(τ ) = 0 pro τ > 1 Obrázek 28: ACF a PACF AR(1) modeulu V ACF docházı́ pro AR modely k propagaci, v PACF efekt rychle vymizı́ (AR model → ”A”v názvu → ACF graduálně klesá (”A”v názvu) – ACF a PACF pro MA model se chovajı́ přesně opačně - PACF graduálně klesá, ACF rychle 36 Obrázek 29: ACF a PACF MA(1) modeulu Návod na identifikaci tedy: – ACF graduálně klesá, PACF statisticky nulová se zpožděnı́m τ → AR(τ − 1) model – PACF graduálně klesá, ACF statisticky nulová se zpožděnı́m τ → M A(τ − 1) model – Pokud ani jedna fce. nenı́ brzy nulová - smı́šený model ACF a PACF odhadovány na základě dat - odhady nepřesné - malé nenulové hodnoty lze považovat za nulové. výběr na základě shody modelu s pozorovánı́mi – u Box-Jenkinsonovy metody dospějı́ různı́ lidé k různým výběrům – zde odhadneme všechny potenciálnı́ modely – spočı́táme a srovnáme kritéria výběru ∗ Koeficient determinace(upravený) standardnı́ koeficient determinace roste s přidávánı́m regresorů 2 T −1 Radj =1− (1 − R2 ) (73) T −k ∗ Informačnı́ kritéria jsou založeny na logaritmické věrohodnosti modelu L Akaikovo informačnı́ kritérium (AIC): AIC = 2k − 2ln(L) Schwarzovo (Baxesovské) i. kritérium (BIC): BIC = ln(n)k − 2ln(L) BIC vı́ce penalizuje přidávánı́ dalšı́ch regresorů - nižšı́ u jednoduššı́ch modelů Chceme co nejnižšı́ informačnı́ kritéria General-to-specific method - metoda eliminace regresorů - eliminace regresorů na základě statistických testů 37 3.5.4 Diagnostika modelu Po výběru modelu je žádoucı́ provést diagnostiku reziudı́ - zkoumáme ACF a PACF reziduı́. Řešı́me: zda se individuálnı́ autokorelace u jednotlivých zpožděnı́ lišı́ od 0 pro odhadované ACF/PACF zda se sada prvnı́ch n autokorelacı́ statisticky významně lišı́ od 0 (jako skupina) - Ljung-Boxova statistika = Q-statistika Obrázek 30: Diagnostika reziduı́ pomocı́ korelogramu Z korelogramů na obrázku 30 vidı́me statisticky význanou ACF v jednotlivých přı́padech v prvnı́ch 4 obdobı́ch, PACF významná v 1 obdobı́. Q-statistika a přı́slušná p-hodnota řı́ká, že se sada prvnı́ch n autokorelacı́ výhnamně lišı́ od nuly - v tomto přı́padě docházı́ k sériové korelaci. Obrázek 31: Výstup z EViews 38 3.5.5 Předpovědi Chceme předpovědět budoucı́ hodnoty y na základě dostupných dat v obdobı́ t. U MA(q) modelu - pro minulé a současné obdobı́ použı́t reálná data, pro budoucnost neočekává změnu → ut+1 = 0 U AR(p) modelu - pro minulé a současné obdobı́ použı́t reálná data, pro budoucnost čekáme propagaci šoků z minula → využitı́ předpovězených hodnot pro yt+1 , rezidua = 0 3.6 Nestacionarita Stacionarita - vlastnost časových řad - polud TS nejsou stacionárnı́, mı́sto ARMA musı́me použı́t ARIMA - vı́ce později.. Stacionarita - TS majı́ konstantnı́ průměr rozptyl sériovou korelaci U většiny ekonomických TS se průměrná hodnota v čase měnı́ - roste - majı́ trend - nemajı́ trvalý rovnovážný stav (např. přirozená mı́ra nezaměstnanosti) Některé ekonomické řady majı́ trvalé šoky, doposud jsme pracovali s přechodnými šoky. Pokud bychom ignorovali nestacionaritu, budeme mı́t chybné odhady koeficientů, nebo budou mı́t špatné vlastnosti. Definice - TS y je slabě stacionárnı́, pokud pro všechny t a s: E(yt ) = E(yt−s ) = µ (74)...průměr časové řady je neměnný v čase var(yt ) = var(yt−s ) = σ (75)...rozptyl časové řady je neměnný v čase cov(yt , (yt−s ) = cov(yt−j , yt−j−s ) = γs (76)...kovariance/korelace časové řady závisı́ pouze na vzdálenosti mezi obdobı́mi a je v čase konstantnı́ Nestacionárnı́ TS modelujeme, protože někdy nejsme schopni kontrolovat pro zdroje nestacionarity. 3.6.1 Modely s permanentnı́mi šoky AR(1) model obsahuje permanentnı́ šoky, pokud ϕ = 1 Náhodná procházka (random walk AR(1) model s ϕ = 1 → náhodná procházka → yt = yt−1 + ut trvalý účinek šoků absence návratu ke střednı́ hodnotě 39 absence předvı́datelnosti Náhodná procházka nenı́ predikovatelná ani při difererenciaci - dostaneme: ∆yt = ut - očekávaná hodnota náhodné procházky při predikci do budoucna je vždy současná hodnota - velká nejistota předpovědı́. Náhodná procházka s korelovanými šoky yt = yt−1 + at ; at ∼ ARM A(p, q) (77) Potřebujeme stacionárnı́ závislou proměnnou → diferenciace → ∆yt = at Náhodná procházka s autokorelovanými šoky -ARIM A(p, d, q) (Autocorrelated-Integrated-Moving Average). p... počet AR členů d... počet diferenciacı́ q... počet MA členů Prvnı́ diference se vždy vracı́ k průměrné hodnotě. ARIMA modely umožňujı́ propagaci i amplifikaci z hlediska prvnı́ch diferencı́ a částečné zvraty z hlediska úrovnı́ - pomáhajı́ předpovı́dat chovánı́ TS. Obrázek 32: Reakce ARIMA modelu na šoky Dı́ky předvı́datelnosti budoucı́ch hodnot šoků můžeme předpovı́dat budoucı́ změny v časové řadě. 3.6.2 Identifikace nestacionarity 1. Z grafu Pokud se zdá, že TS nemá pevný průměr nebo rozptyl, je nestacionárnı́ 2. Z korelogramu Pokud ACF nesměřuje dostatečně rychle k 0 a PACF se významně nelišı́ od nuly po prvnı́m zpožděnı́, máme nestacionárnı́ TS 40 Obrázek 33: Korelogram náhodné procházky 3. Testy Augmented Dickey Fuller (Upravený Dickey-Fullerův test) Kontrola stacionarity AR(p) p−1 X ∆(yt ) = ϕ̃yt−1 + ϕ̃j ∆yt−j + ut (78) j=1 Odhadneme rovnici 78 pomocı́ OLS, použitı́ AIC/BIC pro výběr počtu zpožděných prvnı́ch diferencı́ Otestovánı́ H0 : ϕ̃ = 0 → nestacionarita Pokud t-statistika velká, odmı́tneme H0 Phillips-Perron test Stejná H0 - nestacionarita Potřebujeme shromáždit dostatek důkazů, že je série stacionárnı́, jinak předpokládáme nestacionaritu - spı́še chybně uvažujeme nestacionaritu, než abychom chybně přijali stacionaritu - stejné pro ADF KPSS test H0 : stacionarita Potřebujeme shromáždit dostatek důkazů, že série nenı́ stacionárnı́, jinak předpokládáme stacionaritu - spı́še chybně uvažujeme stacionaritu, než abychom chybně přijali nestacionaritu Vždy užı́vat vı́ce testů, pokud si odporujı́ - užı́t rozum a ekonomickou teorii 3.7 Postup modelovánı́ 1. Odhalenı́ nestacionarity a) Graficky - graf, korelogram reziduı́ b) Testy - ADF, PP, KPSS c) Na základě rozumu a ekonomické teorie V důsledku zvolı́me určitý typ modelu a tı́m vnutı́me modelu strukturu - pokud nenı́ žádný způsob spolehlivý, zamyslet se, která chyba je nákladnějšı́ (modelovánı́ stacionárnı́ch v diferencı́ch nebo nestacionárnı́ch v úrovnı́ch) 2. Výběr ARMA/ARIMA modelu 41 a) Graficky - analýza korelogramu ACF, PACF - výběr člověkem b) Automaticky - software na základě AIC/BIC (BIC preferuje jednoduššı́ modely) 3. Analýza reziduı́ Vybrali jsme skutečně správně? a) Graficky - analýza korelogramu ACF, PACFreziduı́ b) T-statistiky a Q-statistika (Ljung-Box statistika) 4. Srovnánı́ predikce se skutečnými daty - jak odpovı́dajı́ predikce v krátkém a středně dlouhém obdobı́ 42 4 Třetı́ blok - metody řešenı́ endogenity, modely s binárnı́ závislou proměnnou Endogenita regresorů je porušenı́m MLR.3. Zmámena to, že bud’ existujı́ simultánnı́ vztahy mezi vysvětlovanou a vysvětlujı́cı́ proměnnou (inflace a HDP), nebo napřı́klad existuje faktor, pro který nekontrolujeme, a který ovlivňuje vysvětlovanou proměnou (v našem přı́padě je součástı́ náhodné složky). Takovou situaci potřebujeme řešit, jednou z metod jsou instrumentálnı́ proměnné, dalšı́mi metodami pak simultánnı́ rovnice a panelová data. Začneme u IVR (instrumental variables). 4.1 Instrumentálnı́ proměnné Existujı́ proměnné, které nejsme schopni zakomponovat do modelu a ovlivňujı́ vysvětlovanou proměnnou - schopnosti ovlivňujı́ mzdu. log(wagei ) = β0 + β1 educ1 + [abili + ui ] (79) Schopnosti zde součástı́ náhodné složky - existuje kovariance mezi schopnostmi a vzdělánı́m - βˆ1 je zkreslený a nekonzistentnı́ Rovnici 79 lze použı́t, nalezneme-li dodatečnou informaci (instrumentálnı́ proměnnou) pro educi → βˆ1 pak bude konzistentnı́. Pro konzistenci musı́ instrumentálnı́ proměnná splnit: nenı́ v základnı́ (strukturálnı́) rovnici → nemá vliv na y musı́ být korelována s endogennı́m regresorem (Weak Instruments Test) nenı́ korelována s chybovým členem (Sargan Test) V přı́kladu musı́ být IV (instrumental variable) korelována s educi a nekorelována s abili - např. vzdělánı́ rodičů. Využitı́ instrumentálnı́ proměnné mı́sto proměnné x může vylepšit vlastnosti odhadu koeficientu (IV nesmı́ být korelována s chybovou složkou). Vzorec pro OLS se při užitı́ instrumentálnı́ch proměnných měnı́ β̂OLS = (X ′ X)−1 X ′ y (80) β̂IV = (Z ′ X)−1 Z ′ y (81) kde Z je matice instrumentů (stejné rozměry jako X) Z vytvořena nahrazenı́m endogennı́ch regresorů v matici X, pro výpočet použı́váme robustnı́ SE. IVR stále zkreslená, ale oproti OLS konzistentnı́ při použitı́ správných instruměntů 4.1.1 Identifikačnı́ podmı́nky = podmı́nky odhadnutelnosti 1. Podmı́nka řádu 43 Potřebujeme alespoň tolik IV (mimo jiných exogennı́ch proměnných), kolik je endogennı́ch regresorů v strukturálnı́ rovnici 2. Podmı́nka hodnosti Matice Z musı́ mı́t plnout hodnost, jiank nelze spočı́tat 81 4.1.2 Dvoustupňová metoda nejmenšı́ch čtverců - 2SLS - 2 Stage Least Squares Metoda použı́vaná pro IV - 2x se provede OLS (v redukované a strukturálnı́ formě) Máme model s endogennı́m regresorem (y2 ) Strukturálnı́ rovnice: y1 = β0 + β1 y2 + β2 x2 + · · · + βk xk + u (82) Redukovaná forma - zahrnutı́ IV (z1 ) odstraňujı́cı́ch nekonzistenci spolu s exogennı́mi regresory (xi ) y2 = α0 + α1 z1 + α2 x2 + · · · + αk xk + ϵ (83) Prvnı́ stupeň - odhadnutı́ redukované formy pomocı́ OLS - zisk hodnot pro ŷ2 yˆ2 = αˆ0 + αˆ1 z1 + αˆ2 x2 + · · · + αˆk xk (84) Druhý stupeň - použitı́ ŷ2 k odhadu strukturálnı́ rovnice y1 = β0 + β1 yˆ2 + β2 x2 + · · · + βk xk + u (85) Nutno dodržet podmı́nky (aspoň 1 instrument pro každý endogennı́ regresor, podmı́nka hodnosti) Pokud máme vı́ce endogennı́ch regresorů, odhadneme redukovanou formu pro každý endogennı́ regresor, kterou dosadı́me do strukturálnı́. 4.1.3 Statistické vlastnosti Asymptotický rozdı́l IV je vyššı́ než u OLS - IV méně přesná. ROste však s rostoucı́ korelacı́ mezi IV a endogennı́m regresorem. Endogennı́ i instrumentálnı́ proměnné mohou být i dummy proměnné. Pokud je IV sama korelována s u (chybovou složkou), bude nekonzistence IV estimátoru značně vyššı́ než u OLS (Sarganův test) σu plim β̂1,OLS = β1 + corr(x, u) + (86) σx corr(z, u) σu plim β̂1,IV = β1 + + (87) corr(z, x) σx To samé platı́ v situaci, kdy je korelace mezi endogennı́ proměnnou a IV nı́zká (Test slabých instrumentů) R2 nemá u IVR žádný význam - může být i záporné SSR může být většı́ než SST - pokud chceme dosáhnout vysoké hodnoty R2 , použijeme OLS - IV využijeme pro lepšı́ ceteris paribus odhady x na y, pokud je x korelováno s u. 2SLS/IV je konzistentnı́ a asymptoticky normálnı́, zároveň je výrazně méně vydatný (efektivnı́) než OLS, většı́ S.E. 44 IV koeficienty zkreslené i když je y2 skutečně exogennı́ (OLS nezkresleno pro exogennı́ regresory) 2SLS/IV lze využı́t pro TS nebo panely, korekce pro heteroskedasticitu a autokorelaci obdobné jako u OLS 4.1.4 Testy instrumentálnı́ch proměnných Pro použitı́ IV musı́me dodržet určité předpoklady - pro jejich ověřenı́ použijeme statistické testy Endogenita regresorů - Durbin-Wu-Hausman Endogenity Test ”Má smysl použı́t IVR s ohledem na jejı́ cenu?” – Odhadnout rovnici redukované formy, uložit rezidua ϵ̂ – Přidat rezidua ϵ̂ do strukturálnı́ rovnice a odhadnout pomocı́ OLS – Je-li ϵ̂ statisticky významné, pak corr(ϵ, u) ̸= 0 → regresor endogennı́ H0 : ϵ̂ je nevýznamné po vloženı́ do strukturálnı́ rovnice → y2 je exogennı́ H1 : ϵ̂ je významné po vloženı́ do strukturálnı́ rovnice → y2 je endogennı́ Korelace instrumentů - Weak Instruments Test ”Jsou instrumenty dostatečně korelovány s endogennı́mi regresory?” – Pokud je korelace mezi instrumentem a endogennı́m regresorem slabá, metoda OLS může být lepšı́ než IVR. – Testovánı́ jednoho slabého instrumentu: ∗ t-test na H0 : α1 = 0 → instrument je slabý ∗ H1 : instrument je silný – Pokud je přı́tomna overidentifikace (vı́ce instrumentů než endogennı́ch proměnných): ∗ F-test pro společnou nevýznamnost: · H0 : koeficienty z1 = z2 = · · · = 0 (všechny instrumenty jsou slabé) · H1 : alespoň jeden instrument je silný Exogenita instrumentů - Sargan Test ”Jsou instrumenty exogennı́?” – H0 : všechny IV jsou nekorelované s u (jsou exogennı́) – H1 : alespoň jeden je korelovaný s u (je endogennı́) – V dobrém modelu nezamı́táme H0 – Odhadnout strukturálnı́ rovnici, uložit û 2 – Použı́t OLS k odhadu pomocné regrese û = f (x, z) a uložit Radj 2 – Podle H0 : nRadj ∼ χ2q , kde q = počet IV - počet overidentifying IV – H0 zamı́táme, překročı́-li testová statistika svu kritickou hodnotu 45 Naštěstı́ R Studio vše počı́tá za nás (ale je nutné znát hypotézy) 4.2 Panelová a Pooled CS data Doposud jsme řešili Průřezová data (CS) a TS. Panelová data kombinujı́ vlastnosti CS dat a TS - sledujeme n jednotek během časového obdobı́ T (jedntoky se neměnı́ - např. sledovánı́ vývoje porodnosti v 5 státech v 20 letech). Sdružená CS data (pooled) jsou podobná standardnı́m CS datům, ale obsahujı́ pozorovánı́ vı́ce obdobı́, ale nesledujeme stejné jedince - jiné náhodné skupiny. Jak pooled CS, tak panely rozšı́řı́ dataset a dokážı́ ukázat změny v čase. Panely navı́c dokážou vyřešit problém endogenity. S pooled CS lze pracovat snadno - přidánı́ dummy proměnné pro daný rok. Taková data jsou použı́vána i pro analýzu politik (metoda difference-in-differences) Panelová data Krátké panely (n >> T ) – analýza podobná analýze CS dat – netřeba řešit stacionaritu a autokorelaci Dlouhé panely (T >> n) – analýza podobná analýze TS Velké panelové datasety (velké T a n) – platı́ předpoklady jak pro CS data, tak pro TS – matematicky náročné odhadové metody Vyvážené panely – pozorovánı́ dostupná pro všechny t u všech průřezových jednotek – nechybı́ žádné hodnoty Nevyvážené panely – chybı́ pozorovánı́ – Pozorovánı́ chybı́ náhodě - lze použı́t stejné estimátory jako v přı́padě vyvážených panelů – Důvod chybějı́cı́ch pozorovánı́ korelován s chybovým členem - může způsobit zkreslené odhady – typicky: fotbalové týmy sestoupı́ z ligy - chybı́ data v nějakém roce - tato skutečnost může být korelována s chybovým členem Proč panely? Nemáme dostatek pozorovánı́ s CS daty Porušen předpoklad MLR.4 → OLS estimátor je Pokud očekáváme, že MLR.4 platı́, lze použı́t OLS estimátor (je BLUE) - takzvaný pooled OLS Pokud neplatı́ → speciálnı́ metody odhadu 46 U CS dat testuje korelaci nepozorované heterogenity a náhodné složky v IVR pomocı́ DWH testu u panelů B