Ekonometria - Wykład - PDF

Summary

Ten dokument przedstawia wprowadzenie do ekonometrii. Omówione są podstawowe pojęcia, takie jak zależności między zmiennymi ekonomicznymi, przykłady problemów badawczych i etapy modelowania ekonometrycznego. Zawiera informacje o różnych rodzajach danych, takich jak dane makroekonomiczne, mikroekonomiczne oraz modelach regresji liniowej.

Full Transcript

# Wykład 1 ## Ekonometria - Wprowadzenie Ekonometria to złożenie dwóch słów pochodzenia greckiego "oekonomia" oraz "metreo". Jest to nauka zajmująca się pomiarem zależności zachodzących w gospodarce pomiędzy obserwowanymi zmiennymi ekonomicznymi za pomocą metod statystyczno-matematycznych. Ekonomet...

# Wykład 1 ## Ekonometria - Wprowadzenie Ekonometria to złożenie dwóch słów pochodzenia greckiego "oekonomia" oraz "metreo". Jest to nauka zajmująca się pomiarem zależności zachodzących w gospodarce pomiędzy obserwowanymi zmiennymi ekonomicznymi za pomocą metod statystyczno-matematycznych. Ekonometria służy do: - weryfikacji hipotez ekonomicznych (cel poznawczy) - kwantyfikacji siły zależności między zmiennymi oraz przewidywania rozwoju zjawisk ekonomicznych na podstawie otrzymanych w procesie modelowania zależności (cel predyktywny) - symulacji zachowań systemów ekonomicznych w określonych warunkach (cel symulacyjny) ## Przykładowe problemy badawcze dla ekonometryka - Radni zastanawiają się, jak zmniejszyć przestępczość w mieście. Pytanie: jak liczba policjantów wpływa na liczbę popełnianych przestępstw? - Właściciel restauracji zastanawia się jaką kwotę przeznaczyć na reklamę w lokalnej gazecie. Pytanie: jak wydatki na reklamę wpływają na liczbę klientów? - Prywatna uczelnia wyższa planuje podwyższyć czesne. Pytanie: jak wyższa opłata za studia wpłynie na liczbę studentów tej uczelni w kolejnych latach? - Producent aut zastanawia się nad budową nowej linii produkcyjnej samochodów elektrycznych. Pytanie: jaka jest prognozowana wielkość popytu na "elektryki" w najbliższej dekadzie? ## Podstawowe elementy procesu modelowania ekonometrycznego 1. Teoria ekonomiczna o badanym zjawisku 2. Dane statystyczne dotyczące kategorii ekonomicznych związanych z modelowanym zjawiskiem 3. Metoda, która opierając się na danych statystycznych umożliwi weryfikację hipotez o modelowanym zjawisku 4. Wiedza na temat sposobów weryfikacji poprawności przeprowadzonego procesu modelowania. # Rodzaje danych ## Dane makroekonomiczne Dane dotyczące całej gospodarki, takie jak inflacja, PKB, stopa bezrobocia, stopy procentowe, kursy walut, itp. ## Dane mikroekonomiczne Dane dotyczące podmiotów np. przedsiębiorstw (np. zyski, przychody, koszty, udziały w rynku), czy gospodarstw domowych (np. dochody, wydatki) ## Dane ilościowe Dane wyrażone w liczbach, takie jak liczba pracujących w gospodarce, cena produktu, koszty produkcji, itp. ## Dane jakościowe Dane opisujące niemierzalne cechy jednostek, czyli takie cechy, których nie da się wyrazić za pomocą liczb np. płeć, kolor oczu, kraj pochodzenia itp. # Dane przekrojowe - PKB w krajach Unii Europejskiej w 2023 roku - Indeksowanie zmiennej za pomocą subskryptu *i* # Szeregi czasowe - PKB Polski w latach 2010-2023 - Indeksowanie zmiennej za pomocą subskryptu *t* # Dane panelowe (przekrojowo-czasowe) - PKB w krajach Unii Europejskiej w latach 2015-2023 - Indeksowanie zmiennej za pomocą subskryptu *it* # Model ekonometryczny Jest to podstawowe narzędzie wykorzystywane w ekonometrii. Przedstawia uproszczony opis rzeczywistości. Nie uwzględnia wszystkich zmiennych, jakie w rzeczywistości opisują analizowane zjawisko. Opisuje zasadnicze zależności występujące pomiędzy wybranymi zjawiskami ekonomicznymi w badanym fragmencie obiektywnie istniejącego systemu. Ma postać pojedynczego równania, bądź układu równań. # Model ekonometryczny a model ekonomiczny ## Model ekonomiczny Zbiór założeń, które w przybliżony sposób opisują zachowanie się gospodarki (lub określonej jej sfery). Można go przedstawić za pomocą np. wykresów, czy też równań matematycznych. ## Model ekonometryczny Równanie, bądź układ równań zawierający zmienne, parametry strukturalne oraz (nie zawsze) składniki losowe, opisujące badane zależności między zmiennymi ekonomicznymi. # Podstawowe założenia modelu ekonometrycznego: 1. **Model jest liniowy względem parametrów**: to oznacza, że każdy parametr w modelu jest mnożony przez zmienną i dodaany do sumy, a nie np. podniesiony do potęgi. 2. **Zmienne objaśniające są nielosowe**: to oznacza, że wartości zmiennych objaśniających są ustalonymi liczbami rzeczywistymi. 3. **Składnik losowy ma rozkład normalny**: ten warunek jest kluczowy dla wnioskowania statystycznego, ponieważ pozwala na wykorzystanie testów t i F do weryfikacji hipotez. 4. **Składnik losowy jest homoskedastyczny**: to oznacza, że wariancja składnika losowego jest stała dla wszystkich obserwacji. 5. **Brak autokorelacji**: to oznacza, że składniki losowe dla różnych obserwacji są nieskorelowane. # Etapy modelowania ekonometrycznego - Teoria ekonomiczna - Założenia Modelu - Dane statystyczne - Budowa Modelu - Dobór zmiennych objaśniających - Wybór postaci funkcyjnej modelu - Estymacja parametrów modelu - Weryfikacja Modelu - Weryfikacja merytoryczna - Weryfikacja statystyczna - Zastosowanie modelu - Opis rzeczywistości - Prognozowanie - Symulacja # Składnik losowy Jest to zmienna wyrażająca łączny efekt czynników, które nie zostały uwzględnione w modelu (takich jak zmienne nieobserwowalne, czy zdarzenia losowe), a także następujących błędów: - Błędów w konstrukcji modelu ekonometrycznego, np. przyjęcia niewłaściwej postaci funkcyjnej modelu - Błędów wynikających z niedoskonałości pomiarów zjawisk ekonomicznych (wartości zmiennych). # Ogólna postać modelu ekonometrycznego $Y = f(X_1, X_2,..., X_k, e)$ gdzie: - $Y$ - zmienna objaśniana (inaczej zmienna zależna lub regresant) - $X_1, X_2, ..., X_k$ - zmienne objaśniające (inaczej zmienne niezależne lub regresory) - $e$ - składnik losowy modelu # Wykład 2 ## Model regresji liniowej. Metoda KMNK **Korelacja** to zależność statystyczna pomiędzy dwiema zmiennymi losowymi. Analiza korelacji pozwala określić kierunek i siłę zależności pomiędzy badanymi zmiennymi. W analizie korelacji nie wyróżnia się zmiennej zależnej i niezależnej — korelacja między zmiennymi X i Y jest taka sama, jak między Y i X. **Współczynnik korelacji liniowej Pearsona (r)** jest miernikiem liniowej zależności między dwiema cechami. Jest to liczba niemianowana z przedzialu <-1, 1>. Im jest bliższe 1, tym silniejsza jest zależność liniowa między tymi cechami. - Jeśli *r > 0*, to większym wartościom jednej cechy odpowiadają (średnio) większe wartości drugiej cechy (korelacja dodatnia). - Jeśli *r < 0*, to większym wartościom jednej cechy odpowiadają (średnio) mniejsze wartości drugiej cechy i odwrotnie (korelacja ujemna). - Jeśli *r = 0*, to bez względu na wartości przyjmowane przez jedną z cech, średnie wartości drugiej cechy będą takie same – zmienne nieskorelowane. # Interpretacja współczynnika korelacji | Wartość absolutna współczynnika korelacji | Wniosek | |:---|---| | 0-0,2 | Bardzo słaba korelacja, zwykle jej brak | | 0,2-0,4 | Słaba korelacja | | 0,4 - 0,7 | Umiarkowana korelacja | | 0,7 - 0,9 | Silna korelacja | | 0,9-1 | Bardzo silna korelacja | Jika $|r|=1$, to między dwiema cechami występuje korelacja pełna, co oznacza, że zależność między nimi można opisać za pomocą funkcji, która w sposób dokładny odwzorowuje X w Y bez występowania jakiegokolwiek błędu (reszty). # Model regresji liniowej **Model regresji liniowej** to podstawowe narzędzie wykorzystywane w ekonometrii. Jest to uproszczony opis rzeczywistości, który nie uwzględnia wszystkich zmiennych, jakie w rzeczywistości opisują analizowane zjawisko. Opisuje zasadnicze zależności występujące pomiędzy wybranymi zjawiskami ekonomicznymi w badanym fragmencie obiektywnie istniejącego systemu. Ma postać pojedynczego równania, bądź układu równań. # Model regresji liniowej a model ekonomiczny - **Model ekonomiczny** to zbiór założeń, które w przybliżony sposób opisują zachowanie się gospodarki (lub określonej jej sfery). Można go przedstawić za pomocą np. wykresów, czy też równań matematycznych. - **Model ekonometryczny** to równanie, bądź układ równań zawierający zmienne, parametry strukturalne oraz (nie zawsze) składniki losowe, opisujące badane zależności między zmiennymi ekonomicznymi. # Zależność między konsumpcją (C) i dochodem (Y) - **Za pomocą równania deterministycznego (model ekonomiczny):** $C=a+bY$ - **Za pomocą równania stochastycznego (model ekonometryczny) poprzez dodanie do równania deterministycznego składnika losowego:** $C₁ = a+by+e$ # Modele ekonometryczne pozwalają zweryfikować na ile zależności teoretyczne opisywane przez modele ekonomiczne dobrze opisują obserwowane zjawiska. # Wykład 3 i 4 ## Założenia Gaussa-Markowa. Miary dopasowania **Model Gaussa-Markowa** to liniowy model regresji, który spełnia następujące założenia: 1. **Liniowość**. Model jest liniowy względem parametrów. 2. **Nielosowość zmiennych objaśniających**. Zmienne objaśniające są ustalone, nie są zmiennymi losowymi. 3. **Zerowa wartość oczekiwana składnika losowego**. Wartość oczekiwana składnika losowego jest równa zero dla wszystkich obserwacji. 4. **Homoskedastyczność składnika losowego**. Wariancja składnika losowego jest jednakowa dla wszystkich obserwacji. 5. **Brak autokorelacji składnika losowego**. Składniki losowe dla różnych obserwacji są nieskorelowane. # Miary dopasowania modelu do danych empirycznych - **Średni błąd modelu** informuje o ile jednostek przeciętnie różnią się wartości teoretyczne zmiennej objaśnianej (oszacowane na podstawie modelu) od wartości empirycznych (rzeczywistych) tej zmiennej. Błąd ten wyrażony jest w tych samych jednostkach, co zmienna objaśniana. - **Współczynnik zmienności** określa jaki procent średniej wartości zmiennej objaśnianej stanowi odchylenie standardowe reszt modelu (ô). Im mniejsza wartość współczynnika zmienności, tym większa zgodność modelu z danymi empirycznymi. # Estymator wariancji składnika losowego $σ^2 = \frac{\sum_{t=1}^{T} e_{t}^2}{T-(K+1)}$ # Testowanie własności składnika losowego - **Autokorelacja składnika losowego** to zjawisko, w którym składniki losowe dotyczące różnych obserwacji są ze sobą skorelowane. - **Heteroskedastyczność składnika losowego** to zjawisko, w którym wariancja składnika losowego jest różna dla różnych obserwacji. # Wykład 5 ## Wnioskowanie statystyczne. Testy istotności. Estymacja przedziałowa **Wnioskowanie statystyczne** to proces wnioskowania o wartościach populacyjnych na podstawie danych z próby. W modelach ekonometrycznych wnioskowanie statystyczne jest wykorzystywane do weryfikacji hipotez dotyczących wartości parametrów modelu. **Test statystyczny** to narzędzie umożliwiające weryfikację hipotezy. W testach statystycznych wyróżniamy następujące elementy: 1. **Hipoteza zerowa (H0)** to hipoteza, którą chcemy zweryfikować. Hipoteza zerowa jest zwykle zapisywana w formie równania lub nierówności. 2. **Hipoteza alternatywna (H1)** to hipoteza, która jest alternatywą dla hipotezy zerowej. 3. **Statystyka testowa** to zmienna losowa, której wartość jest obliczana na podstawie obserwacji w próbie. 4. **Obszar odrzucenia (lub wartość-p)** to obszar wartości statystyki testowej, które są niewiarygodne pod warunkiem prawdziwości hipotezy zerowej. 5. **Decyzja** to wniosek o odrzuceniu lub nie odrzuceniu hipotezy zerowej na podstawie wyników testu. Aby podjąć decyzję o odrzuceniu lub nie odrzuceniu hipotezy zerowej na podstawie wyników testu statystycznego, wykorzystujemy **wartość-p**. **Wartość-p** to prawdopodobieństwo otrzymania wyników testu co najmniej tak ekstremalnych jak obserwowane, pod warunkiem prawdziwości hipotezy zerowej. Jeśli wartość-p jest mniejsza od wybranego poziomu istotności (α), to odrzucamy hipotezę zerową. # Test t Studenta **Test t Studenta** jest najczęściej wykorzystywanymi testami statystycznymi do weryfikacji hipotez dotyczących średniej populacji. Test ten opiera się na zakładaniu, że zmienna losowa jest rozkładana z rozkładu normalnego. Aby zastosować ten test, należy ustalić hipotezę zerową i hipotezę alternatywną. # Estymacja przedziałowa **Estymacja przedziałowa** to metoda określania przedziału wartości parametru, który z pewnym prawdopodobieństwem zawiera prawdziwą wartość tego parametru. Przedział ufności dla parametru jest określany przez wartości graniczne przedziału ufności. Im wyższy jest poziom ufności, tym węższy jest przedział ufności. # Wykład 6 ## Testowanie własności składnika losowego oraz stabilności parametrów **Autokorelacja składnika losowego** oznacza sytuację, w której składniki losowe dotyczące różnych obserwacji są ze sobą skorelowane. **Heteroskedastyczność składnika losowego** oznacza sytuację, w której wariancja składnika losowego jest różna dla różnych obserwacji. ### Weryfikacja autokorelacji Do weryfikacji autokorelacji można wykorzystać **test Durbina-Watsona**. ### Weryfikacja heteroskedastyczności Do weryfikacji heteroskedastyczności można wykorzystać **test White'a**. ### Testowanie normalności rozkładu składnika losowego Do testowania normalności rozkładu składnika losowego można wykorzystywać **test Doornika-Hansena**. # Wykład 7 ## Model potęgowy **Model potęgowy** to model nieliniowy, który jest często wykorzystywany w ekonomii do opisywania funkcji produkcji. Model potęgowy ma następującą postać: $Y = aX₁^{a₁}X₂^{a₂}…X_k^{a_k}e$ # Wykład 8 ## Współliniowość zmiennych objaśniających. Zmienne zero-jedynkowe **Współliniowość** to zjawisko, w którym zmienne objaśniające są ze sobą silnie skorelowane. Współliniowość może być **dokładna** lub **przybliżona**. **Zmienne zero-jedynkowe** to zmienne, które przyjmują wartość 1, gdy dany warunek jest spełniony, i 0, gdy nie jest spełniony. # Wykład 9 ## Uzmiennianie parametrów modelu ## Zmiana wyrazu wolnego W modelach regresji liniowej wyraz wolny jest stały dla wszystkich obserwacji. Można jednak uwzględnić sytuację, w której wyraz wolny jest różny dla różnych grup obserwacji. W tym celu do modelu wprowadza się **zmienną zero-jedynkową**. Zmienne zero-jedynkowe są także wykorzystywane do modelowania **efektów interakcyjnych**. # Wykład 10 ## Wprowadzenie do modeli wielorównaniowych. Postać strukturalna **Modele wielorównaniowe** to układy równań, które opisują zależności między wieloma zmiennymi endogenicznymi i egzogenicznymi. **Postać strukturalna** modelu wielorównaniowego to układ równań, w którym zmienne endogeniczne są wyrażone jako funkcje zmiennych egzogenicznych. # Wykład 11 ## Modele wielorównaniowe. Postać zredukowana. Mnożniki **Postać zredukowana** modelu wielorównaniowego to układ równań, w którym zmienne endogeniczne są wyrażone jako funkcje wyłącznie zmiennych z góry ustalonych. **Mnożnik** to zmiana m-tej zmiennej endogenicznej wywołana wzrostem k-tej zmiennej egzogenicznej o jednostkę, po pewnym okresie. # Wykład 12 ## Estymacja parametrów modeli wielorównaniowych **Identyfikowalność modelu** to warunek, który musi być spełniony, aby można było wyznaczyć oceny parametrów modelu wielorównaniowego w postaci strukturalnej. Aby model był identyfikowalny, musi spełniać następujący warunek: liczba zmiennych z góry ustalonych, które nie występują w danym równaniu, musi być nie mniejsza od liczby zmiennych endogenicznych, które występują w tym równaniu w roli zmiennych objaśniających. **Nakładanie restrykcji** to metoda zmniejszenia liczby nieznanych parametrów modelu wielorównaniowego, aby zwiększyć jego identyfikowalność. Do najczęściej stosowanych restrykcji należą: - **Normalizacja** to ustalenie wartości pewnego parametru na jedność. - **Tożsamości** to wykorzystanie równań, które są znane *a priori*. - **Restrykcje wyłączające** to ustalenie wartości pewnych parametrów na zero. **Metody estymacji parametrów modeli wielorównaniowych** to algorytmy wykorzystywane do wyznaczenia ocen parametrów modelu. Do najczęściej stosowanych metod estymacji należą: - **Pośrednia metoda najmniejszych kwadratów (PMNK)** - **Metoda zmiennych instrumentalnych (MZI)** - **Podwójna metoda najmniejszych kwadratów (2MNK)** - **Metoda największej wiarygodności z ograniczoną informacją (MWOI)** - **Potrójna metoda najmniejszych kwadratów (3MNK)** - **Metoda największej wiarygodności z pełną informacją (MWPI)** **Metody estymacji pojedynczych równań** prowadzą do otrzymania estymatorów zgodnych, ale asymptotycznie nieefektywnych. **Pośrednia metoda najmniejszych kwadratów** jest wykorzystywana w przypadku, gdy wszystkie równania modelu są jednoznacznie identyfikowalne. **Podwójna metoda najmniejszych kwadratów** jest wykorzystywana w przypadku, gdy model jest nadmiernie identyfikowalny. **Metoda 3MNK** jest wykorzystywana w przypadku, gdy wszystkie równania modelu są jednoznacznie identyfikowalne. ==End of OCR==

Use Quizgecko on...
Browser
Browser