Ekonometrija I Paskaita 03 PDF

Summary

These lecture notes cover econometrics topics, including multiple regression models, matrix form, calculation of β, and the use of F-tests for multiple independent variables. The document also touches upon logarithmic variables, regressions, and examples related to real-world scenarios.

Full Transcript

Ekonometrija I Paskaita 03 Andrius Vainilavičius [email protected] Vilniaus universitetas 2024/2025 1 / 28 Praeitoje paskaitoje ▶ ˛Iverčiu˛ statistika; ▶ Determinacijos koeficientas; ▶ Modelio F statistika; ▶ Daugi...

Ekonometrija I Paskaita 03 Andrius Vainilavičius [email protected] Vilniaus universitetas 2024/2025 1 / 28 Praeitoje paskaitoje ▶ ˛Iverčiu˛ statistika; ▶ Determinacijos koeficientas; ▶ Modelio F statistika; ▶ Dauginė regresija; 2 / 28 Šioje paskaitoje ▶ Regresijos modelis matricu˛ algebros pavidalu; ▶ Standartinės hipotezės dauginiame regresijos modelyje; ▶ Determinacijos koeficientai; ▶ F testas grupei kintamu˛ju˛; ▶ Netiesiškumai tiesinėse regresijose; ▶ Koeficientu˛ interpretacijos; 3 / 28 Dauginė regresija yi = β0 + β1 x1i + β2 x2i +... + βm xmi + ui Lygtis galima būtu˛ perrašyti taip: y1 = β0 + β1 x11 + β2 x12 +... + βm x1m + u1 y2 = β0 + β1 x21 + β2 x22 +... + βm x2m + u2... ym = β0 + β1 xm1 + β2 xm2 +... + βm xmm + um 4 / 28 Dauginė regresija matricu˛ forma         y1 1 x11 x12 ··· x1m β0 u1  y2  1 x21 x22 ··· x2m   β1   u2      ..  = ....  × ..  + ..     ...... .  .....  .  .  ym 1 xm1 xm2 · · · xmm βm um Y = X × β + U (1) m×1 m×(m+1) (m+1)×1 m×1 ^ = Y X × β̂ (2) m×1 m×(m+1) (m+1)×1 5 / 28 Kaip rasti β? Porinės regresijos atveju β radome minimizuodami paklaidu˛ kvadratu˛ sumą. Dauginės regresijos atveju ieškosime to paties:         u1 y1 − yˆ1 y1 yˆ1  u2   y2 − yˆ2   y2   yˆ2  U=. =..  = ..  − ..  = Y − Ŷ         ..  .  .  .  um ym − yˆm ym yˆm Paklaidu˛ kvadratu˛ suma: n X SSR = Ûi2 =⇒ SSR = Û T Û i=1 6 / 28 Kaip rasti β? SSR = Û T Û SSR = (Y − Ŷ )T (Y − Ŷ ) SSR = (Y − X β̂)T (Y − X β̂) SSR = (Y T − β̂ T X T )(Y − X β̂) SSR = Y T Y − Y T X β̂ − β̂ T X T Y + β̂ T X T X β̂ Prieš randant β, kurios minimizuoja paklaidu˛ kvadratą, prisiminkime kelias taisykles apie matricu˛ diferenciaciją: Jei A yra mxn matrica, z yra mx1 matrica ir A yra nepriklausoma nuo z, tuomet: ∆B B = A =⇒ =0 ∆z ∆B B = Az =⇒ =A ∆z ∆B B = z T A =⇒ = AT ∆z ∆B B = z T Az =⇒ = 2z T A ∆z 7 / 28 Kaip rasti β? Taigi, siekiant rasti β, su kuriomis paklaidu˛ kvadrato suma yra minimizuojama, reikia rasti SSR išvestinę β atžvilgiu ir prisilyginti ją nuliui: ∆(SSR) ∆(Y T Y − Y T X β̂ − β̂ T X T Y + β̂ T X T X β̂) = =0 ∆β̂ ∆β̂ ∆(Y T Y ) ∆(Y T X β̂) ∆(β̂ T X T Y ) ∆(β̂ T X T X β̂) − − + =0 ∆β̂ ∆β̂ ∆β̂ ∆β̂ 0 − Y T X − (X T Y )T + 2β̂ T X T X = 0 −2Y T X + 2β̂ T X T X = 0 2β̂ T X T X = 2Y T X β̂ T = Y T X (X T X )−1 β̂ = (X T X )−1 X T Y 8 / 28 Dauginė regresija Radę β̂ galime suskaičiuoti estimuotus priklausomo kintamojo ˛iverčius (Ŷ ). Estimuotas βˆk ˛ivertis nurodo numanomą y pokyti˛, pasikeitus vienam vienetui xk , kitiems nepriklausomiems kintamiesiems(xi̸=k ) išliekant pastoviais. Pavyzdys: NT.kaina = 500 + 2*Populiacija + 50*Pragyvenimo.išlaidu˛.indeksas - 20*Nusikalstamumo.indeksas - 350*Atstumas.iki.parduotuvės 9 / 28 Dauginė regresija σ 2 estimuojama panašiai: Û T Û s2 = n−1−k kur k - nepriklausomu˛ kintamu˛ju˛ skaičius. O dispersiju˛-kovariaciju˛ matrica: vcov (β̂) = σ 2 (X T X )−1 10 / 28 Determinacijos koeficientas R 2 yra apskaičiuojamas taip pat, kaip ir porinėje regresijoje: SSE SSR R2 = =1− SST SST = i=1 Ûi2 , SSE = ni=1 (Ŷi − Ȳ )2 , o Pn P kur SSRP SST = ni=1 (Yi − Ȳ )2. R 2 interpretacija taip pat išlieka tokia pati. 11 / 28 Determinacijos koeficientas Deja, dauginėje regresijoje yra problema su R 2 ˛iverčiu - ji˛ galima ’išpūsti’ pridedant nepriklausomu˛ kintamu˛ju˛, net jei šie ir neturi pagrindo būti ˛itraukti ˛i regresiją. Tarkime, jog turime žemiau pateiktą modeli˛: ▶ Yi - mokiniu˛ pasiekimai; ▶ X1i - klasiu˛ dydis; ▶ X2i - % mokiniu˛, kuriems anglu˛ kalba nėra gimtoji; ▶ X3i - išlaidos vienam mokiniui; ▶ X4i - mokytoju˛ amžiaus suma; ▶ X5i - vidutinis mokytojo svoris mokykloje; Toks modelis visada turės ne žemesni˛, o, tikėtina, aukštesni˛ R 2 , nei turintis tik pirmuosius X1i , X2i ir X3i nepriklausomus kintamuosius. 12 / 28 Determinacijos koeficientas Kodėl taip yra? Pridėjus papildomą nepriklausomą kintamąji˛, net jei jis ir reikšmingai neprisideda prie priklausomo kintamojo variacijos paaiškinimo, tikėtina, jog gebės paaiškinti bent nedidelę jos dali˛. Dėl to Ŷ bus arčiau tikrosios Yi vertės ir R 2 bus didesnis. Dėl to atsiranda pagunda ˛itraukti nereikalingus kintamuosius, taip siekiant pakelti savo modelio R 2 ˛iverti˛. 13 / 28 Pakoreguotas (adjusted) determinacijos koeficientas Tokia ydinga praktika iššaukė koreguoto R̄ 2 (Ra2 , Radj 2 ) išvedimą. Koreguotas determinacijos koeficientas taip pat parodo, kaip gerai priklausomo kintamojo variacija yra paaiškinama variacija nepriklausomuose kintamuose, tačiau koreguoja rezultatą pagal ˛i modeli˛ ˛itrauktu˛ nepriklausomu˛ kintamu˛ju˛ skaičiu˛. Kaip apskaičiuojamas Ra2 ? (1 − R 2 )(n − 1) Ra2 = 1 − n−p−1 kur p - nepriklausomu˛ kintamu˛ju˛ kiekis. Koreguotas determinacijos koeficientas didėja tik tada, kuomet papildomas nepriklausomas kintamasis pagerina modeli˛ labiau, nei jis pagerėtu˛ atsitiktinai. Jei Jūsu˛ modelyje skirtumas tarp R 2 ir Ra2 yra didelis, tai gali indikuoti, jog modelyje yra per daug nepriklausomu˛ kintamu˛ju˛. 14 / 28 Pakoreguotas (adjusted) determinacijos koeficientas 15 / 28 Pakoreguotas (adjusted) determinacijos koeficientas 16 / 28 F testas grupei nepriklausomu˛ kintamu˛ju˛ Dažniausiai konstruojant modeli˛ pirmiausia sudedame visus dominančius nepriklausomus kintamuosius. Tuomet naturaliai gali kilti klausimas ar grupė nepriklausomu˛ kintamu˛ju˛ duoda naudingos informacijos apie y? Tą galime patikrinti naudodamiesi F testu. F testas skaičiuojamas panašiai, kaip ir tikrinant ˛iprastą nulinę hipotezę, tik šiuo atveju yra tikrinami tik dominančios grupės β koeficientus: H0 : βj = βj+1 =... = βj+k = 0 H1 : bent viena iš aukščiau paminėtu˛ β ̸= 0 17 / 28 F testas grupei nepriklausomu˛ kintamu˛ju˛ Neapribotas modelis (UR): y = β0 + β1 ∗ x1 + β2 ∗ x2 +... + βm ∗ xm Apribotas modelis (R): y = β0 + β1 ∗ x1 + β2 ∗ x2 +... + βm−k ∗ xm−k Tuomet F testo ˛iverti˛ rasime: (SSRR − SSRUR )/(m − k) F = SSRUR /(n − m − 1) F ˛iverti˛ lyginame su kritine F reikšme (F ∼ df1 (m − k), df2 (n − m − 1)). 18 / 28 Netiesiškumas regresijoje Ką daryti jei numanome ar žinome, jog sąryšis tarp priklausomo ir nepriklausomo kintamu˛ju˛ nėra visiškai tiesinis? Pvz.: gyvenimo kokybė ir darbo užmokestis ar darbo užmokestis ir išsilavinimas Kitaip tariant nepriklausomo kintamojo "ribinis efektas" nėra konstanta. Du dažniausiai pasitaikantys netiesiškumai tiesinėje regresijoje yra polinominė regresija bei logaritminė forma. 19 / 28 Polinominė regresija Seminaro metu susidursime, kuomet regresijose naudojome nepriklausomą kintamąji˛ pakeltą kažkokiu laipsniu. Kadangi laipsniu keliame nepriklausomą kintamąji˛, o ne koeficientą prie jo, modelis išlieka tiesinis, tačiau leidžia savyje talpinti netiesini˛ sąryši˛ tarp minėtojo nepriklausomo kintamojo ir priklausomo kintamojo. Regresijos modelis, kuriame yra ˛itrauktas kintamasis pakeltas n-uoju laipsniu (kur n ̸= 1) dar yra vadinamas polinomine regresija. Kaip žinoti, jog ˛i modeli˛ reikėtu˛ ˛itraukti nepriklausomą kintamąji˛ pakeltą tam tikru laipsniu? 20 / 28 Polinominė regresija Pirmiausia - teorinis sąryšis tarp kintamu˛ju˛. Jei numanote, jog tarp priklausomo ir nepriklausomo kintamu˛ju˛ egzistuoja netiesiškumas, tuomet ˛itraukite atitinkamą polinomini˛ nari˛. Antra - grafinė inspekcija. Prieš sukonstruojant regresiją, visuomet patartina pažiūrėti grafiką (priklausomas kintamasis - y ašyje, nepriklausomas - x ašyje). Netiesini˛ sąryši˛ gali atskleisti toks grafikas. Trečia - grafinė paklaidu˛ analizė. Sukonstravus regresiją, patartina nusibrėžti paklaidu˛ grafiką (regresijos paklaidos - y ašyje, nepriklausomas kintamasis/estimuotas priklausomas kintamasis [ŷ , fitted values] - x ašyje). Jei tokiam grafike ties viduriu yra nemažai teigiamu˛ paklaidu˛, o pakraščiuose - neigiamu˛ (ar atvirkščiai), tai taip pat gali indikuoti netiesišką sąryši˛ tarp priklausomo ir nepriklausomo kintamu˛ju˛. Vienas iš formaliu˛ testu˛, galinčiu˛ padėti atpažinti netiesiškumą - paklaidu˛ normalumo testas (Jarque-Bera). 21 / 28 Polinominė regresija 22 / 28 Polinominė regresija 23 / 28 Logaritmuoti kintamieji Kitas dažnai pasitaikantis netiesiškumas regresijoje yra kintamieji ˛itraukti logaritmuota forma. Toks kintamu˛ju˛ ˛itraukimas ˛i regresiją yra populiarus dėl keliu˛ priežasčiu˛: 1. Multiplikatyvios formos sąryši˛ leidžia konvertuoti ˛i adityvinės formos; 2. Leidžia "ištiesinti" eksponentinius kintamuosius (dažniausiai taikoma naudojant laiko eilutes) bei praskleisti stebėjimus (dažniausiai skerspjūvio duomenims); 3. Leidžia interpretuoti gautus rezultatus kaip elastingumą; 24 / 28 Logaritmuoti kintamieji Kaip interpretuoti rezultatus kuomet turime logaritmuotus kintamuosius? Tik priklausomas kintamasis yra logaritmuotas. Tuomet eksponuojame gauti koeficiento ˛iverti˛ ir atimame vienetą. Gautas skaičius atspindi priklausomo kintamojo procentini˛ pokyti˛ pasikeitus nepriklausomam kintamajam vienu vienetu. Pvz.: β1 = 0.2. exp 0.2 − 1 = 0.2214. Nepriklausomam kintamajam išaugus vienu vienetu, priklausomas kintamasis išaugs 22.12%. Tik nepriklausomas kintamasis yra logaritmuotas. ˛Iprastai koeficiento ˛iverti˛ dalintume iš 100 ir tuomet gautas rezultatas nurodys kiek vienetu˛ pasikeis priklausomas kintamasis, nepriklausomam kintamajam pasikeitus 1%. Pvz.: β1 = 2, tuomet nepriklausomam kintamajam pasikeitus 1%, priklausomas kintamasis pasikeis 0.02 vieneto. Didesniam ribiniam poveikiui (tarkime, x) dauginame koeficientą iš ln(1 + x), t.y. β1 ∗ ln(1.x). 25 / 28 Logaritmuoti kintamieji Ir priklausomas, ir nepriklausomas kintamieji yra logaritmuoti. Koeficientu˛ prie šiu˛ kintamu˛ju˛ interpretacija atitinka elastingumą, t.y. 1% nepriklausomo kintamojo pokytis lemia β1 % priklausomo kintamojo pokyti˛. Didesniam ribiniam poveikiui (tarkime, z): ((1 + z)β1 − 1) ∗ 100. 26 / 28 Interpretacijos pavyzdžiai π = 0.5 + 0.015W (3) kur π - logaritmuotas vartotoju˛ kainu˛ indeksas Lietuvoje, o W - vidutinis neto darbo užmokestis eurais. Kaip pasikeis vartotoju˛ kainu˛ indeksas vidutiniam darbo užmokesčiui išaugus 100 euru˛? U = 25 − 275Y (4) kur U - nedarbo lygis procentiniais punktais, Y - logaritmuotas BVP. Kaip pasikeis nedarbo lygis BVP nukritus 1%? O jei nukristu˛ 5%? 27 / 28 Interpretacijos pavyzdžiai Q = 2.51 − 2P (5) kur Q - logaritmuotas parduodamas sūreliu˛ kiekis, P - logaritmuota parduodamu˛ sūreliu˛ kaina. Kaip pasikeis parduodamas sūreliu˛ kiekis, ju˛ kainai išaugus 1%? Y = 4.82 + 0.02Uzt + 0.7Exp (6) kur Y - logaritmuotas Lietuvos BVP, Uzt - užimtu˛ asmenu˛ skaičius matuojamas 10,000, Exp - logaritmuotos Lietuvos eksporto apimtys. Kaip pasikeis Lietuvos BVP užimtu˛ asmenu˛ kiekiui nukritus per 10,000? Kaip pasikeis išaugus eksporto apimtims per 1%? 28 / 28

Use Quizgecko on...
Browser
Browser