Aplikované kvantitativní metody - Úvod
41 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Při použití instrumentálních proměnných (IV), jaké jsou hlavní podmínky pro jejich správné použití?

Korelace s endogenním regresorem = Weak Instruments Test Nekorelace s chybovým členem = Sargan Test Snížení odhadovací chyby = IVR mnohem přesnější než OLS Minimální počet IV = Musí být více IV než endogenních regresorů

Jak se mění odhady koeficientů při použití OLS a IV?

Odhad OLS = β̂OLS = (X ′ X)−1 X ′ y Odhad IV = β̂IV = (Z ′ X)−1 Z ′ y Odhad OLS je nekonzistentní = pokud jsou regresory endogenní Odhad IV je konzistentní = při použití správných instrumentů

Jaké je rozlišení mezi OLS a IV odhady?

Odhad OLS = Je vždy konzistentní Odhad IV = Může být zkreslený, ale konzistentní

Co zahrnuje použití instrumentálních proměnných?

<p>Odhad koeficientů = Změna ve strukturní rovnici Endogenní regrese = Vyžaduje náhradu instrumentálními proměnnými Exogenní proměnné = Musí zůstat konstantní Chybový člen = Nesmí být korelován s IV</p> Signup and view all the answers

Jaké jsou důsledky použití správných instrumentálních proměnných?

<p>Zlepšení přesnosti odhadu = Díky eliminaci endogenity Zvýšení robustnosti SE = Při použití IV Konzistence IV odhadu = Není zaručena bez správných instrumentů Zbavení se biasu = Umožňuje lepší interpretaci výsledků</p> Signup and view all the answers

Zvažte následující typy panelových dat a jejich charakteristiky. Přiřaďte k nim správné popisy:

<p>Kratké panely = Netřeba řešit stacionaritu a autokorelaci Dlouhé panely = Analýza podobná analýze TS Vyvážené panely = Pozorovánı́ dostupná pro všechny t u všech průřezových jednotek Nevyvážené panely = Chybı́ pozorovánı́ náhodně</p> Signup and view all the answers

Přiřaďte následující metody odhadu k jejich použití v analýze dat:

<p>OLS estimator = Pokud předpoklad MLR.4 platı́ Pooled OLS = V případě dostatečného množství dat Speciální metody odhadu = Pokud MLR.4 neplatı́ DWH test = Testování korelace nepozorované heterogenity</p> Signup and view all the answers

Přiřaďte následující typy panelových datasetů k jejich předpokladům:

<p>Velké panelové datasety = Platí předpoklady pro CS i TS data Krátké panely = Analýza podobná CS dat Nevyvážené panely = Jedině pozorování chybí náhodně Vyvážené panely = Nechybí žádné hodnoty</p> Signup and view all the answers

Přiřaďte následující metody analýzy k jejich popisu:

<p>Difference-in-differences = Metoda pro analýzu politik Korelace nepozorované heterogenity = Testované u CS dat pomocí DWH testu Stacionarita = Není třeba řešit u krátkých panelů Odhadové metody = Matematicky náročné u velkých datasetů</p> Signup and view all the answers

Přiřaďte pojmy k jejich definicím v kontextu panelových dat:

<p>Chybející hodnoty = Mohu způsobit zkreslené odhady Fotbalové týmy = Příklad nevyvážených panelů Heterogenita = Pozorovaná variabilita mezi skupinami OLS = Metoda ke zjišťování ovlivněnosti jedné proměnné na druhou</p> Signup and view all the answers

Přiřaďte následující MLR předpoklady k jejich popisu:

<p>MLR.1 = Linearita v parametrech MLR.2 = Náhodný vzorek MLR.3 = Absence perfektní multikolinearity MLR.4 = Variabilita vzorku a vysvětlujících proměnných</p> Signup and view all the answers

Přiřaďte názvy proměnných k jejich charakteristice:

<p>β̂1 = Odhad regresního koeficientu VIF = Měření multikolinearity R² = Koeficient determinace X, Y = Nezávislé a závislé proměnné</p> Signup and view all the answers

Jaké jsou důsledky vysokých hodnot VIF?

<p>Významná multikolinearita = Zpravidla &gt; 5 nebo &gt; 10 Nízká korelace prediktoru = Blízko 1 Zvýšení rozptylu koeficientu = Kvůli multikolinearitě Nízké hodnoty VIF = Naznačují silnou korelaci</p> Signup and view all the answers

Přiřaďte typické příčiny vysoké multikolinearity:

<p>Použití stejného regresoru = V různých jednotkách Lineární kombinace = Jedna z proměnných Přítomnost konstantní proměnné = Vysoká korelace Využití interakce proměnných = Způsobuje kolinearitu</p> Signup and view all the answers

Přiřaďte výrazy k jejich definicím:

<p>Kolinearita = Korelace mezi nezávislými proměnnými Rozptyl = Míra variability hodnot Náhodný vzorek = Případová studie výběru Estimátor = Statistický odhad hodnoty</p> Signup and view all the answers

Přiřaďte typy regresních funkcí k jejich charakteristikám:

<p>Lineární regresní funkce = Přímková závislost Nelineární regresní funkce = Nekonstantní změna Vícenásobná regresní funkce = Více nezávislých proměnných Polynomialní regresní funkce = Zahrnuje mocniny proměnných</p> Signup and view all the answers

Přiřaďte definice k jejich pojmům:

<p>Odchylka = Rozdíl mezi skutečnou a odhadovanou hodnotou Prediktor = Proměnná, která ovlivňuje výsledek Determinace = Míra vysvětlenosti variabilit Odhad = Předpoklad hodnoty na základě vzorku</p> Signup and view all the answers

Přiřaďte chyby, které mohou nastat při regresní analýze, k jejich popisu:

<p>Zanedbání důležité proměnné = Může vést k biasu Málo dat = Snižuje robustnost modelu Perfektní multikolinearita = Nemožnost získat koeficienty Nevhodný model = Nestabilní výsledky</p> Signup and view all the answers

Přiřaďte modely k jejich charakteristikám:

<p>U MA(q) modelu = Pro budoucnost nečeká změnu U AR(p) modelu = Čekáme propagaci šoků z minulosti Nestacionární časové řady = Modelujeme je, když nej jsme schopni kontrolovat zdroje nestacionarity AR(1) model s ϕ = 1 = Obsahuje trvalé šoky a je náhodná procházka</p> Signup and view all the answers

Přiřaďte názvy stacionární vlastnosti k jejich definicím:

<p>Průměr = Nemení se v čase Rozptyl = Je neměnný v čase Kovariance = Závisí pouze na vzdálenosti mezi obdobími Seriová korelace = Je v čase konstantní</p> Signup and view all the answers

Přiřaďte následující pojmy k jejich definicím:

<p>Heteroskedasticita = Rozptyl chyby se liší pro různé hodnoty vysvětlující proměnné Homoskedasticita = Rozptyl chyby je konstantní pro všechny hodnoty vysvětlujících proměnných Normalita reziduí = Rezidua mají normální rozdělení se střední hodnotou nula Nevychýlenost = Odhady jsou v průměru shodné s pravými hodnotami parametrů</p> Signup and view all the answers

Přiřaďte vlastnosti nestacionárních časových řad k jejich popisu:

<p>Trend = Průměrná hodnota se mění v čase Přechodné šoky = Mají dočasný dopad Trvalé šoky = Mají trvalý účinek na hodnotu Absence návratu = Není predikovatelná návratnost k průměru</p> Signup and view all the answers

Přiřaďte definice nestacionarity k jejich popisům:

<p>E(yt) = Očekávaná hodnota časové řady var(yt) = Rozptyl časové řady cov(yt, yt−s) = Kovariance časové řady závisí na vzdálenosti mezi obdobími Nestacionární proces = Nelze kontrolovat pro zdroje nestacionarity</p> Signup and view all the answers

Přiřaďte vlastnosti estimátorů k jejich popisům:

<p>Nevychýlenost = Podmínka, že E(β̂j) = βj Konzistence = Odhady se při zvyšování vzorku soustředí kolem pravých hodnot Vychýlenost = Systematické nadhodnocení nebo podhodnocení skutečných hodnot OLS = Míra, jak dobře se model přizpůsobuje datům</p> Signup and view all the answers

Přiřaďte relevantní předpoklady k jejich výstupům:

<p>MLR.1 - MLR.4 = Odhady jsou nevychýlené MLR.5 = Odhady jsou vydatné Malé vzorky = Konzistentnost závisí na MLR.6 MLR.6 = Zajišťuje normalitu reziduí</p> Signup and view all the answers

Přiřaďte pojmy k jejich vlastnostem v AR(1) modelu:

<p>ϕ = 1 = Označuje náhodnou procházku Predikce do budoucna = Očekávaná hodnota je vždy současná hodnota Velká nejistota = Je charakteristická pro náhodnou procházku Absence predikovatelnosti = Vytváří problémy při předpovědi</p> Signup and view all the answers

Přiřaďte termíny k jejich číselným vzorcům:

<p>E(β̂j) = Populární koeficient βj σ² = Rozptyl chyby β̂j = Odhad parametru n = Velikost vzorku</p> Signup and view all the answers

Přiřaďte kategorie časových řad k jejich charakteristikám:

<p>Stacionární časové řady = Mají konstantní průměr, rozptyl a kovarianci Nestacionární časové řady = Mají měnící se průměr či trend Ekonomické časové řady = Často mají trvalé šoky ARIMA modely = Používají se, pokud časové řady nejsou stacionární</p> Signup and view all the answers

Přiřaďte definice k typům šoků v časových řadách:

<p>Přechodné šoky = Mají dočasný dopad na časovou řadu Trvalé šoky = Ovlivňují hodnoty navždy Diferenciace = Pomáhá odstranit nestacionaritu Predikce = Může být zatížena velkou nejistotou</p> Signup and view all the answers

Přiřaďte typy biasu k jejich popisům:

<p>Systematické nadhodnocení = Odhady jsou vždy větší než skutečné hodnoty Systematické podhodnocení = Odhady jsou vždy menší než skutečné hodnoty Nestrannost = Odhady se průměrně shodují s pravými hodnotami Bias = Odchylka od centrální tendence odhadů</p> Signup and view all the answers

Přiřaďte vlastnosti časových řad k jejich dopadům na předpovědi:

<p>Nestacionární řady = Vedou k chybným odhadům koeficientů Stacionární řady = Poskytují stabilní základ pro analýzu AR(1) model = Může vyústit v trvalé efekty šoků Náhodná procházka = Nemůže být předvídána</p> Signup and view all the answers

Přiřaďte typy distribuce k jejich vlastnostem:

<p>Normální rozdělení = Symetrické s nulovou střední hodnotou Uniformní rozdělení = Každá hodnota má stejnou pravděpodobnost Exponenciální rozdělení = Užívá se pro modelování času do události Binomické rozdělení = Založené na počtu úspěchů v n pokusech</p> Signup and view all the answers

Přiřaďte statistické vlastnosti k jejich významům:

<p>Konzistentnost = Odhady se blíží skutečným hodnotám s rostoucím vzorkem Nevychýlenost = Průměr odhadů odpovídá skutečným hodnotám Robustnost = Odolnost odhadů vůči chybám v datech Vydatnost = Schopnost estimátoru poskytovat dobré odhady</p> Signup and view all the answers

Přiřaďte pojmy k jejich definicím:

<p>Populace = Kompletní skupina průřezových jednotek, která nás zajímá Vzorek = Část populace, kterou pozorujeme Statistická inference = Dělání závěrů o populaci na základě vzorku Chyba měření = Chyby statistických úřadů při měření dat</p> Signup and view all the answers

Přiřaďte typy dat k jejich charakteristice:

<p>Panelová data = Stejný vzorek populace během určitého období Pooled data = Různé náhodné vzorky ve více obdobích Krátké panely = Průřezové jednotky následované časovými jednotkami Dlouhé panely = Dynamické panelové modely</p> Signup and view all the answers

Přiřaďte chyby vzorku k jejich příčinám:

<p>Výběrové zkreslení = Nereprezentativní vzorek Chyba měření = Chyby přenesené z statistických úřadů Odlehlé hodnoty = Zkreslení výsledků odhadu Reprezentativnost vzorku = Vyžaduje dobrý výběr vzorku</p> Signup and view all the answers

Přiřaďte popis k odpovídajícím typům analýzy:

<p>Jednoduchý regresní model = Nástroj pro analýzu kauzálního vztahu mezi proměnnými Dynamické panelové modely = Analyzují vztahy v dlouhých panelech Krátké panely = Analyzují stejné průřezové jednotky v čase Statistická inference = Závisí na reprezentativnosti vzorku</p> Signup and view all the answers

Přiřaďte výrazy k relevantnímu příkladu:

<p>Statistická inference = Studium vlivu vzdělání na mzdu Pooled data = Získání dat od 100 firem v různých letech Panelová data = Pozorování téměř stejného vzorku firem ročně Chyba měření = Nesprávné údaje přenesené z úřadu</p> Signup and view all the answers

Přiřaďte typy panele k jejich popisu:

<p>Krátké panely = Pouze několik období s vybranými jednotkami Dlouhé panely = Analýza stejného vzorku v mnoha obdobích Fixní efekty = Modely se stejnými jednotkami v panelech Náhodné efekty = Modely s variabilitou mezi jednotkami</p> Signup and view all the answers

Přiřaďte popis změn dat k jejich definicím:

<p>Panelová data = Zachycení stejných jednotek v různých obdobích Pooled data = Míchání dat z různých vzorků Statistická inference = Analýza na základě vzorku vedoucí k obecným závěrům Vzorek = Omezená část populace pro analýzu</p> Signup and view all the answers

Přiřaďte příklady k odpovídajícím problémům se vzorkem:

<p>Výběrové zkreslení = Studium pouze na vysokopŕıjmových skupinách Chyba měření = Nesoulad ve shromážděných datech Odlehlé hodnoty = Extrémní hodnoty ovlivňující průměry Reprezentativnost vzorku = Důležitá pro validní závěry</p> Signup and view all the answers

Flashcards

Linearita v parametrech (MLR.1)

Předpoklad o lineárním vztahu mezi závisle proměnnou a ​​nezávisle proměnnými v regresním modelu.

Náhodný vzorek (MLR.2)

Předpoklad, že data byla zvolena náhodně a jsou nezávisle a identicky rozdělena.

Absence perfektní multikolinearity (MLR.3)

Předpoklad, že mezi nezávisle proměnnými neexistuje perfektní lineární vztah.

Variance Inflation Factor (VIF)

Míra, která ukazuje, jak moc se zvyšuje rozptyl odhadovaného regresního koeficientu kvůli multikolinearity.

Signup and view all the flashcards

Nízké hodnoty VIF

Hodnoty VIF blízké 1 naznačují nízkou korelaci nezávisle proměnné s ostatními regresory.

Signup and view all the flashcards

Typické příčiny vysoké multikolinearity

Použití stejné proměnné v různých jednotkách ve stejném regresním modelu.

Signup and view all the flashcards

Typické příčiny vysoké multikolinearity

Poukžití proměnných, které jsou lineární kombinací stejných proměnných, spolu s využitím průsečíku β0 v regresním modelu.

Signup and view all the flashcards

Odhady v regresním modelu

Odhady, s nimiž se pracuje v regresní analýze, se pokládají za náhodné proměnné.

Signup and view all the flashcards

Sloučená průřezová data (pooled)

Sloučené průřezové datové sady zahrnují data z více časových období, ale s různými náhodnými vzorky v každém období.

Signup and view all the flashcards

Panelová data

Panelová data sledují stejný vzorek populace během více časových období.

Signup and view all the flashcards

Průřezová data

Data, která se shromažďují v jednom časovém okamžiku, ale zahrnují informace od více jednotlivců.

Signup and view all the flashcards

Jednoduchý regresní model

Statistický model, který zkoumá vztah mezi dvěma proměnnými.

Signup and view all the flashcards

Populace

Celá skupina objektů, která nás zajímá v analýze.

Signup and view all the flashcards

Vzorek

Část populace, o níž máme data a kterou pozorujeme.

Signup and view all the flashcards

Statistická inference

Vyvozování závěrů o populaci na základě dat ze vzorku.

Signup and view all the flashcards

Výběrové zkreslení

Chyba vznikající při výběru vzorku, která vede k nereprezentativnímu vzorku populace.

Signup and view all the flashcards

Co je potřeba pro dosažení konzistence instrumentálnı́ proměnné

Dosažení konzistence v instrumentálnı́ proměnné vyžaduje, aby nebyla součástı́ zakladnı́ rovnice a aby byla korelovaná s endogennı́m regresorem. Také nesmí být korelovaná s chybovým členem.

Signup and view all the flashcards

Co je to test Weak Instruments?

Test, který ověřuje, zda je instrumentálnı́ proměnná korelovaná s endogennı́m regresorem.

Signup and view all the flashcards

Co je to test Sargan?

Test, který ověřuje, zda je instrumentálnı́ proměnná nekorelovaná s chybovým členem.

Signup and view all the flashcards

Co je to IV (Instrumental Variable)?

Využívá se, když je potencionálně endogennı́ proměnná. Vylepšuje odhad koeficientu, ale musí splňovat podmínky konzistence.

Signup and view all the flashcards

Co je to podmı́nka řádu v instrumentálnı́ch proměnných?

Minimům počtu instrumentů, který by měl být v modelu, aby se dal odhadnout koeficient.

Signup and view all the flashcards

Stacionární časová řada

Časová řada, kde se průměr, rozptyl a autokorelace nezměňují v čase.

Signup and view all the flashcards

Nestacionární časová řada

Časová řada s proměnným průměrem, rozptylem nebo autokorelací v čase.

Signup and view all the flashcards

Permanentní šok

U AR(1) modelu, když parametr ϕ = 1, vliv šoku se v modelu trvale udržuje.

Signup and view all the flashcards

Náhodná procházka

Model, kde se hodnota v čase vyvíjí náhodným způsobem s nulovým průměrem.

Signup and view all the flashcards

ARIMA model

Model pro nestacionární časové řady s integrálním operátorem, který zaručuje stacionaritu.

Signup and view all the flashcards

Trend

Dlouhodobá změna v časové řadě, způsobená vnějšími faktory.

Signup and view all the flashcards

Průchodný šok

Náhlá krátkodobá odchylka v časové řadě, která se po čase vrátí k normálu.

Signup and view all the flashcards

Permanentní šok

Změna v časové řadě, která se trvale udrží.

Signup and view all the flashcards

Homoskedasticita

V chybovém členu regresního modelu je rozptyl konstantní pro všechny kombinace hodnot vysvětlujících proměnných. Jinými slovy, rozptyl predikovaných hodnot se nemění s proměnou prediktorů.

Signup and view all the flashcards

Heteroskedasticita

V chybovém členu regresního modelu se rozptyl mění v závislosti na hodnotách vysvětlujících proměnných. Rozptyl predikovaných hodnot se liší s proměnou prediktorů.

Signup and view all the flashcards

Normalita reziduí

Chybový člen regresního modelu má normální rozdělení s nulovou střední hodnotou a konstantním rozptylem. Předpoklad normálního rozdělení chyb je důležitý pro inference.

Signup and view all the flashcards

Nevychýlenost

Odhad regresního koeficientu je nestranný, pokud v regresním modelu nejsou žádné systémové chyby. Odhady jsou průměrně správné.

Signup and view all the flashcards

Konzistence

Odhady regresních koeficientů se s rostoucím počtem pozorování s konvergují (blíží se) k skutečné hodnotě regresního koeficientu. Znamená to, že odhady jsou spolehlivější s velkým počtem dat.

Signup and view all the flashcards

Vydatnost

Odhad regresního koeficientu je konzistentní, pokud je i nevychýlený a navíc se jeho rozptyl s rostoucím počtem pozorování snižuje. Výdatnost tedy znamená, že odhad se stává v průběhu sběru dat stále přesnějším.

Signup and view all the flashcards

Model splňuje MLR.1-MLR.4

Regresní model splňuje podmínky potřebné pro nalezení optimálního odhadu regresních koeficientů (nestrannosti a konzistence).

Signup and view all the flashcards

Model splňuje MLR.1-MLR.5

Model splňuje podmínky pro získání přesného odhadu regresních koeficientů (nestrannosti, konzistence a vydatnosti).

Signup and view all the flashcards

Dlouhé panely (T >> n)

V panelových datech, kdy počet opakovaných měření (T) je mnohem větší než počet jednotek (n). Využívá se statistická analýza časových řad (TS).

Signup and view all the flashcards

Krátké panely (n >> T)

V panelových datech, kdy počet opakovaných měření (T) je mnohem menší než počet jednotek (n). Využívá se standardních metod pro analýzu cross-sekčných dat (CS).

Signup and view all the flashcards

Vyvážené panely

Panel, kde pro všechny jednotky a v všech časových obdobích existují data. Žádná data nechybí.

Signup and view all the flashcards

Nevyvážené panely

Panel, kde chybí některá data. Může existovat náhodné chybění dat nebo chybění dat související s vlivem zkoumaného faktoru.

Signup and view all the flashcards

Study Notes

Aplikované kvantitativní metody - Úvodní komentář

  • Tento dokument slouží jako shrnutí předmětu Aplikované kvantitativní metody (AKM) pro akademický rok 2024/2025, doplněný o relevantní informace z Úvodu do ekonometrie.
  • Materiál je určen pro efektivní studium.
  • Autor bere odpovědnost za případné chyby a překlepy.
  • Dokument obsahuje klíčové poznatky a vzorce z přednášek.
  • Pro hlubší pochopení je vhodné studovat i prezentace z přednášek a Wooldridge/Kovářovu učebnici.
  • Na internetu jsou k dispozici četná videa a alternativní učebnice.
  • Umělá inteligence (AI) a analogie mohou pomoci s pochopením složitých pojmů.

Obsah

  • Obsah dokumentu je rozdělen do tří bloků: úvod, průřezová data a jednorozměrné časové řady.
  • Nultý blok - úvod,
  • První blok - průřezová data (jednoduchá regrese, odhad, vícenásobná regrese, problémy s modelem a diagnostika, hypotézy, testování).
  • Druhý blok - jednorozměrné časové řady (grafie, časové korelace, složky časových řad (trend, cyklická, sezónní, náhodné), šoky, ARMA modely, stacionarita, AR(1) a AR(p) modely, ARMA modely - smíšené modely).
  • Třetí blok - metody řešení endogenity a modely s binární závislou proměnnou (instrumentální proměnné, dvoustupňová metoda nejmenších čtverců, panelová a sloučená data, testové statistiky).
  • Čtvrtý blok - vícerozměrné časové řady (distribuovaná zpoždění, ARMAX modely, vektorová autoregrese, nestacionarita).

Typy dat

  • Nultý blok popisuje různé typy dat ve statistice (průřezová data, časové řady, panelová data).
  • Průřezová data - sledují data od jedné nebo několika skupin v daném časovém okamžiku (např. příjem jednotlivých osob).
  • Časové řady - sledují data v čase (např. HDP v jednotlivých letech).
  • Panelová data - kombinují průřezová a časová data v rozložení, kde sledujeme stejné subjekty/jednotky v čase.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Tento kvíz se zaměřuje na úvod do předmětu Aplikované kvantitativní metody a důležité aspekty ekonometrie. Studenti se budou moci seznámit se základními pojmy, technikami a vzorci, které souvisejí s průřezovými daty a časovými řadami. Dále se doporučuje doplnit studium prezentacemi a relevantními učebnicemi.

More Like This

Business Economics Quiz
5 questions

Business Economics Quiz

AdvancedSavannah avatar
AdvancedSavannah
Business Economics Quiz
5 questions

Business Economics Quiz

ExcitedSugilite912 avatar
ExcitedSugilite912
Business Economics Overview
16 questions
Use Quizgecko on...
Browser
Browser