Ekonometrija I Paskaita 03 PDF

Ekonometrija I Paskaita 03 Andrius Vainilavičius [email protected] Vilniaus universitetas 2024/2025 1 / 28 Praeitoje paskaitoje ▶ ˛Iverčiu˛ statistika; ▶ Determinacijos koeficientas; ▶ Modelio F statistika; ▶ Dauginė regresija; 2 / 28 Šioje paskaitoje ▶ Regresijos modelis matricu˛ algebros pavidalu; ▶ Standartinės hipotezės dauginiame regresijos modelyje; ▶ Determinacijos koeficientai; ▶ F testas grupei kintamu˛ju˛; ▶ Netiesiškumai tiesinėse regresijose; ▶ Koeficientu˛ interpretacijos; 3 / 28 Dauginė regresija yi = β0 + β1 x1i + β2 x2i +... + βm xmi + ui Lygtis galima būtu˛ perrašyti taip: y1 = β0 + β1 x11 + β2 x12 +... + βm x1m + u1 y2 = β0 + β1 x21 + β2 x22 +... + βm x2m + u2... ym = β0 + β1 xm1 + β2 xm2 +... + βm xmm + um 4 / 28 Dauginė regresija matricu˛ forma         y1 1 x11 x12 ··· x1m β0 u1  y2  1 x21 x22 ··· x2m   β1   u2      ..  = ....  × ..  + ..     ...... .  .....  .  .  ym 1 xm1 xm2 · · · xmm βm um Y = X × β + U (1) m×1 m×(m+1) (m+1)×1 m×1 ^ = Y X × β̂ (2) m×1 m×(m+1) (m+1)×1 5 / 28 Kaip rasti β? Porinės regresijos atveju β radome minimizuodami paklaidu˛ kvadratu˛ sumą. Dauginės regresijos atveju ieškosime to paties:         u1 y1 − yˆ1 y1 yˆ1  u2   y2 − yˆ2   y2   yˆ2  U=. =..  = ..  − ..  = Y − Ŷ         ..  .  .  .  um ym − yˆm ym yˆm Paklaidu˛ kvadratu˛ suma: n X SSR = Ûi2 =⇒ SSR = Û T Û i=1 6 / 28 Kaip rasti β? SSR = Û T Û SSR = (Y − Ŷ )T (Y − Ŷ ) SSR = (Y − X β̂)T (Y − X β̂) SSR = (Y T − β̂ T X T )(Y − X β̂) SSR = Y T Y − Y T X β̂ − β̂ T X T Y + β̂ T X T X β̂ Prieš randant β, kurios minimizuoja paklaidu˛ kvadratą, prisiminkime kelias taisykles apie matricu˛ diferenciaciją: Jei A yra mxn matrica, z yra mx1 matrica ir A yra nepriklausoma nuo z, tuomet: ∆B B = A =⇒ =0 ∆z ∆B B = Az =⇒ =A ∆z ∆B B = z T A =⇒ = AT ∆z ∆B B = z T Az =⇒ = 2z T A ∆z 7 / 28 Kaip rasti β? Taigi, siekiant rasti β, su kuriomis paklaidu˛ kvadrato suma yra minimizuojama, reikia rasti SSR išvestinę β atžvilgiu ir prisilyginti ją nuliui: ∆(SSR) ∆(Y T Y − Y T X β̂ − β̂ T X T Y + β̂ T X T X β̂) = =0 ∆β̂ ∆β̂ ∆(Y T Y ) ∆(Y T X β̂) ∆(β̂ T X T Y ) ∆(β̂ T X T X β̂) − − + =0 ∆β̂ ∆β̂ ∆β̂ ∆β̂ 0 − Y T X − (X T Y )T + 2β̂ T X T X = 0 −2Y T X + 2β̂ T X T X = 0 2β̂ T X T X = 2Y T X β̂ T = Y T X (X T X )−1 β̂ = (X T X )−1 X T Y 8 / 28 Dauginė regresija Radę β̂ galime suskaičiuoti estimuotus priklausomo kintamojo ˛iverčius (Ŷ ). Estimuotas βˆk ˛ivertis nurodo numanomą y pokyti˛, pasikeitus vienam vienetui xk , kitiems nepriklausomiems kintamiesiems(xi̸=k ) išliekant pastoviais. Pavyzdys: NT.kaina = 500 + 2*Populiacija + 50*Pragyvenimo.išlaidu˛.indeksas - 20*Nusikalstamumo.indeksas - 350*Atstumas.iki.parduotuvės 9 / 28 Dauginė regresija σ 2 estimuojama panašiai: Û T Û s2 = n−1−k kur k - nepriklausomu˛ kintamu˛ju˛ skaičius. O dispersiju˛-kovariaciju˛ matrica: vcov (β̂) = σ 2 (X T X )−1 10 / 28 Determinacijos koeficientas R 2 yra apskaičiuojamas taip pat, kaip ir porinėje regresijoje: SSE SSR R2 = =1− SST SST = i=1 Ûi2 , SSE = ni=1 (Ŷi − Ȳ )2 , o Pn P kur SSRP SST = ni=1 (Yi − Ȳ )2. R 2 interpretacija taip pat išlieka tokia pati. 11 / 28 Determinacijos koeficientas Deja, dauginėje regresijoje yra problema su R 2 ˛iverčiu - ji˛ galima ’išpūsti’ pridedant nepriklausomu˛ kintamu˛ju˛, net jei šie ir neturi pagrindo būti ˛itraukti ˛i regresiją. Tarkime, jog turime žemiau pateiktą modeli˛: ▶ Yi - mokiniu˛ pasiekimai; ▶ X1i - klasiu˛ dydis; ▶ X2i - % mokiniu˛, kuriems anglu˛ kalba nėra gimtoji; ▶ X3i - išlaidos vienam mokiniui; ▶ X4i - mokytoju˛ amžiaus suma; ▶ X5i - vidutinis mokytojo svoris mokykloje; Toks modelis visada turės ne žemesni˛, o, tikėtina, aukštesni˛ R 2 , nei turintis tik pirmuosius X1i , X2i ir X3i nepriklausomus kintamuosius. 12 / 28 Determinacijos koeficientas Kodėl taip yra? Pridėjus papildomą nepriklausomą kintamąji˛, net jei jis ir reikšmingai neprisideda prie priklausomo kintamojo variacijos paaiškinimo, tikėtina, jog gebės paaiškinti bent nedidelę jos dali˛. Dėl to Ŷ bus arčiau tikrosios Yi vertės ir R 2 bus didesnis. Dėl to atsiranda pagunda ˛itraukti nereikalingus kintamuosius, taip siekiant pakelti savo modelio R 2 ˛iverti˛. 13 / 28 Pakoreguotas (adjusted) determinacijos koeficientas Tokia ydinga praktika iššaukė koreguoto R̄ 2 (Ra2 , Radj 2 ) išvedimą. Koreguotas determinacijos koeficientas taip pat parodo, kaip gerai priklausomo kintamojo variacija yra paaiškinama variacija nepriklausomuose kintamuose, tačiau koreguoja rezultatą pagal ˛i modeli˛ ˛itrauktu˛ nepriklausomu˛ kintamu˛ju˛ skaičiu˛. Kaip apskaičiuojamas Ra2 ? (1 − R 2 )(n − 1) Ra2 = 1 − n−p−1 kur p - nepriklausomu˛ kintamu˛ju˛ kiekis. Koreguotas determinacijos koeficientas didėja tik tada, kuomet papildomas nepriklausomas kintamasis pagerina modeli˛ labiau, nei jis pagerėtu˛ atsitiktinai. Jei Jūsu˛ modelyje skirtumas tarp R 2 ir Ra2 yra didelis, tai gali indikuoti, jog modelyje yra per daug nepriklausomu˛ kintamu˛ju˛. 14 / 28 Pakoreguotas (adjusted) determinacijos koeficientas 15 / 28 Pakoreguotas (adjusted) determinacijos koeficientas 16 / 28 F testas grupei nepriklausomu˛ kintamu˛ju˛ Dažniausiai konstruojant modeli˛ pirmiausia sudedame visus dominančius nepriklausomus kintamuosius. Tuomet naturaliai gali kilti klausimas ar grupė nepriklausomu˛ kintamu˛ju˛ duoda naudingos informacijos apie y? Tą galime patikrinti naudodamiesi F testu. F testas skaičiuojamas panašiai, kaip ir tikrinant ˛iprastą nulinę hipotezę, tik šiuo atveju yra tikrinami tik dominančios grupės β koeficientus: H0 : βj = βj+1 =... = βj+k = 0 H1 : bent viena iš aukščiau paminėtu˛ β ̸= 0 17 / 28 F testas grupei nepriklausomu˛ kintamu˛ju˛ Neapribotas modelis (UR): y = β0 + β1 ∗ x1 + β2 ∗ x2 +... + βm ∗ xm Apribotas modelis (R): y = β0 + β1 ∗ x1 + β2 ∗ x2 +... + βm−k ∗ xm−k Tuomet F testo ˛iverti˛ rasime: (SSRR − SSRUR )/(m − k) F = SSRUR /(n − m − 1) F ˛iverti˛ lyginame su kritine F reikšme (F ∼ df1 (m − k), df2 (n − m − 1)). 18 / 28 Netiesiškumas regresijoje Ką daryti jei numanome ar žinome, jog sąryšis tarp priklausomo ir nepriklausomo kintamu˛ju˛ nėra visiškai tiesinis? Pvz.: gyvenimo kokybė ir darbo užmokestis ar darbo užmokestis ir išsilavinimas Kitaip tariant nepriklausomo kintamojo "ribinis efektas" nėra konstanta. Du dažniausiai pasitaikantys netiesiškumai tiesinėje regresijoje yra polinominė regresija bei logaritminė forma. 19 / 28 Polinominė regresija Seminaro metu susidursime, kuomet regresijose naudojome nepriklausomą kintamąji˛ pakeltą kažkokiu laipsniu. Kadangi laipsniu keliame nepriklausomą kintamąji˛, o ne koeficientą prie jo, modelis išlieka tiesinis, tačiau leidžia savyje talpinti netiesini˛ sąryši˛ tarp minėtojo nepriklausomo kintamojo ir priklausomo kintamojo. Regresijos modelis, kuriame yra ˛itrauktas kintamasis pakeltas n-uoju laipsniu (kur n ̸= 1) dar yra vadinamas polinomine regresija. Kaip žinoti, jog ˛i modeli˛ reikėtu˛ ˛itraukti nepriklausomą kintamąji˛ pakeltą tam tikru laipsniu? 20 / 28 Polinominė regresija Pirmiausia - teorinis sąryšis tarp kintamu˛ju˛. Jei numanote, jog tarp priklausomo ir nepriklausomo kintamu˛ju˛ egzistuoja netiesiškumas, tuomet ˛itraukite atitinkamą polinomini˛ nari˛. Antra - grafinė inspekcija. Prieš sukonstruojant regresiją, visuomet patartina pažiūrėti grafiką (priklausomas kintamasis - y ašyje, nepriklausomas - x ašyje). Netiesini˛ sąryši˛ gali atskleisti toks grafikas. Trečia - grafinė paklaidu˛ analizė. Sukonstravus regresiją, patartina nusibrėžti paklaidu˛ grafiką (regresijos paklaidos - y ašyje, nepriklausomas kintamasis/estimuotas priklausomas kintamasis [ŷ , fitted values] - x ašyje). Jei tokiam grafike ties viduriu yra nemažai teigiamu˛ paklaidu˛, o pakraščiuose - neigiamu˛ (ar atvirkščiai), tai taip pat gali indikuoti netiesišką sąryši˛ tarp priklausomo ir nepriklausomo kintamu˛ju˛. Vienas iš formaliu˛ testu˛, galinčiu˛ padėti atpažinti netiesiškumą - paklaidu˛ normalumo testas (Jarque-Bera). 21 / 28 Polinominė regresija 22 / 28 Polinominė regresija 23 / 28 Logaritmuoti kintamieji Kitas dažnai pasitaikantis netiesiškumas regresijoje yra kintamieji ˛itraukti logaritmuota forma. Toks kintamu˛ju˛ ˛itraukimas ˛i regresiją yra populiarus dėl keliu˛ priežasčiu˛: 1. Multiplikatyvios formos sąryši˛ leidžia konvertuoti ˛i adityvinės formos; 2. Leidžia "ištiesinti" eksponentinius kintamuosius (dažniausiai taikoma naudojant laiko eilutes) bei praskleisti stebėjimus (dažniausiai skerspjūvio duomenims); 3. Leidžia interpretuoti gautus rezultatus kaip elastingumą; 24 / 28 Logaritmuoti kintamieji Kaip interpretuoti rezultatus kuomet turime logaritmuotus kintamuosius? Tik priklausomas kintamasis yra logaritmuotas. Tuomet eksponuojame gauti koeficiento ˛iverti˛ ir atimame vienetą. Gautas skaičius atspindi priklausomo kintamojo procentini˛ pokyti˛ pasikeitus nepriklausomam kintamajam vienu vienetu. Pvz.: β1 = 0.2. exp 0.2 − 1 = 0.2214. Nepriklausomam kintamajam išaugus vienu vienetu, priklausomas kintamasis išaugs 22.12%. Tik nepriklausomas kintamasis yra logaritmuotas. ˛Iprastai koeficiento ˛iverti˛ dalintume iš 100 ir tuomet gautas rezultatas nurodys kiek vienetu˛ pasikeis priklausomas kintamasis, nepriklausomam kintamajam pasikeitus 1%. Pvz.: β1 = 2, tuomet nepriklausomam kintamajam pasikeitus 1%, priklausomas kintamasis pasikeis 0.02 vieneto. Didesniam ribiniam poveikiui (tarkime, x) dauginame koeficientą iš ln(1 + x), t.y. β1 ∗ ln(1.x). 25 / 28 Logaritmuoti kintamieji Ir priklausomas, ir nepriklausomas kintamieji yra logaritmuoti. Koeficientu˛ prie šiu˛ kintamu˛ju˛ interpretacija atitinka elastingumą, t.y. 1% nepriklausomo kintamojo pokytis lemia β1 % priklausomo kintamojo pokyti˛. Didesniam ribiniam poveikiui (tarkime, z): ((1 + z)β1 − 1) ∗ 100. 26 / 28 Interpretacijos pavyzdžiai π = 0.5 + 0.015W (3) kur π - logaritmuotas vartotoju˛ kainu˛ indeksas Lietuvoje, o W - vidutinis neto darbo užmokestis eurais. Kaip pasikeis vartotoju˛ kainu˛ indeksas vidutiniam darbo užmokesčiui išaugus 100 euru˛? U = 25 − 275Y (4) kur U - nedarbo lygis procentiniais punktais, Y - logaritmuotas BVP. Kaip pasikeis nedarbo lygis BVP nukritus 1%? O jei nukristu˛ 5%? 27 / 28 Interpretacijos pavyzdžiai Q = 2.51 − 2P (5) kur Q - logaritmuotas parduodamas sūreliu˛ kiekis, P - logaritmuota parduodamu˛ sūreliu˛ kaina. Kaip pasikeis parduodamas sūreliu˛ kiekis, ju˛ kainai išaugus 1%? Y = 4.82 + 0.02Uzt + 0.7Exp (6) kur Y - logaritmuotas Lietuvos BVP, Uzt - užimtu˛ asmenu˛ skaičius matuojamas 10,000, Exp - logaritmuotos Lietuvos eksporto apimtys. Kaip pasikeis Lietuvos BVP užimtu˛ asmenu˛ kiekiui nukritus per 10,000? Kaip pasikeis išaugus eksporto apimtims per 1%? 28 / 28

Ekonometrija I Paskaita 03 PDF

Document Details

Tags

Related

Summary

Full Transcript