Podcast
Questions and Answers
Anta at det eksisterer en byregion med 12 distinkte soner, hvor beboere typisk bor i én sone og arbeider i en annen. Hvis vi antar at sone 1 fungerer som et sentralt forretningsdistrikt (CBD) og alle andre soner er ordnet sekvensielt basert på deres radiale avstand fra sone 1, hvor mange unike kombinasjoner eksisterer det hvor arbeidsplassen ligger nærmere CBD enn bostedet?
Anta at det eksisterer en byregion med 12 distinkte soner, hvor beboere typisk bor i én sone og arbeider i en annen. Hvis vi antar at sone 1 fungerer som et sentralt forretningsdistrikt (CBD) og alle andre soner er ordnet sekvensielt basert på deres radiale avstand fra sone 1, hvor mange unike kombinasjoner eksisterer det hvor arbeidsplassen ligger nærmere CBD enn bostedet?
Det er 66 slike kombinasjoner.
Gitt at $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$ representerer nytten en person opplever ved å reise fra sone i til sone j, der $\epsilon_{ij}$ er uavhengige og normalfordelte med null forventning og varians 50, og $\beta = 0.2$, beregn forventet nytte ved å reise fra i til j. Hvordan tolker du fortegnet til dette leddet?
Gitt at $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$ representerer nytten en person opplever ved å reise fra sone i til sone j, der $\epsilon_{ij}$ er uavhengige og normalfordelte med null forventning og varians 50, og $\beta = 0.2$, beregn forventet nytte ved å reise fra i til j. Hvordan tolker du fortegnet til dette leddet?
Den forventede nytten er $E[U_{ij}] = -\beta d_{ij}$. Fortegnet er negativt, noe som indikerer at nytten reduseres med økende avstand.
Definer $\epsilon = \epsilon_{11} - \epsilon_{12}$, hvor $\epsilon_{11}$ og $\epsilon_{12}$ er uavhengige og normalfordelte med null forventning og varians 50. Hva er fordelingen av $\epsilon$, og hva er forventningen og variansen?
Definer $\epsilon = \epsilon_{11} - \epsilon_{12}$, hvor $\epsilon_{11}$ og $\epsilon_{12}$ er uavhengige og normalfordelte med null forventning og varians 50. Hva er fordelingen av $\epsilon$, og hva er forventningen og variansen?
$\epsilon$ er normalt fordelt med forventning 0 og varians 100.
Benytt resultatet fra forrige spørsmål. Hva er sannsynligheten for at en person foretrekker å bo i sone 2 og jobbe i sone 1 fremfor å bo og jobbe i sone 1, gitt at $d_{11} = 0$ og $d_{12} = 50$?
Benytt resultatet fra forrige spørsmål. Hva er sannsynligheten for at en person foretrekker å bo i sone 2 og jobbe i sone 1 fremfor å bo og jobbe i sone 1, gitt at $d_{11} = 0$ og $d_{12} = 50$?
La $X$, $Y$, $Z$ og $W$ være tilfeldige variabler. Bevis at $\text{Cov}[X + Y, W] = \text{Cov}[X, W] + \text{Cov}[Y, W]$.
La $X$, $Y$, $Z$ og $W$ være tilfeldige variabler. Bevis at $\text{Cov}[X + Y, W] = \text{Cov}[X, W] + \text{Cov}[Y, W]$.
Anta at $X$, $Y$ og $Z$ er uavhengige tilfeldige variabler. Bevis at $\text{Cov}[X + Y, Z + Y] = \text{Var}[Y]$.
Anta at $X$, $Y$ og $Z$ er uavhengige tilfeldige variabler. Bevis at $\text{Cov}[X + Y, Z + Y] = \text{Var}[Y]$.
Anta at for alle par $(i, j)$ hvor $i = 1, ..., 12$ og $j = 1, ..., 12$, $\epsilon_{ij}$ er uavhengige med null forventning og konstant varians $\sigma^2 \neq 0$. Definer $\tilde{\epsilon}{ij} = \epsilon{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj}$. Finn forventning og varians til $\tilde{\epsilon}{ij}$ når $i \neq j$ og kovariansen mellom $\epsilon{12}$ og $\epsilon_{13}$. Er disse uavhengige variabler?
Anta at for alle par $(i, j)$ hvor $i = 1, ..., 12$ og $j = 1, ..., 12$, $\epsilon_{ij}$ er uavhengige med null forventning og konstant varians $\sigma^2 \neq 0$. Definer $\tilde{\epsilon}{ij} = \epsilon{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj}$. Finn forventning og varians til $\tilde{\epsilon}{ij}$ når $i \neq j$ og kovariansen mellom $\epsilon{12}$ og $\epsilon_{13}$. Er disse uavhengige variabler?
I en byregion bestående av 4 distinkte soner, gitt en matrise T som spesifiserer antall pendlere som bor i sone $i$ og jobber i sone $j$, finn marginaltotalene til tabellen. Hvordan tolker du disse tallene? Hva kjennetegner sone 1?
I en byregion bestående av 4 distinkte soner, gitt en matrise T som spesifiserer antall pendlere som bor i sone $i$ og jobber i sone $j$, finn marginaltotalene til tabellen. Hvordan tolker du disse tallene? Hva kjennetegner sone 1?
Hvordan ville tabellen sett ut hvis valg av arbeidssted var uavhengig av bosted i den samme byregionen med 4 soner?
Hvordan ville tabellen sett ut hvis valg av arbeidssted var uavhengig av bosted i den samme byregionen med 4 soner?
Bruk en kji-kvadrattest for uavhengighet på dataene for å undersøke om arbeidssted er uavhengig av bosted, ved å bruke et signifikansnivå på 5%. Hvilken konklusjon trekker du? Er dette en rimelig konklusjon? Hva er en svakhet ved denne testen?
Bruk en kji-kvadrattest for uavhengighet på dataene for å undersøke om arbeidssted er uavhengig av bosted, ved å bruke et signifikansnivå på 5%. Hvilken konklusjon trekker du? Er dette en rimelig konklusjon? Hva er en svakhet ved denne testen?
Anta at $d_{ii} = 0$ for alle verdier av $i$. Vis at $$ln\left(\frac{T_{ij}T_{ji}}{T_{ii}T_{jj}}\right) = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$$
Anta at $d_{ii} = 0$ for alle verdier av $i$. Vis at $$ln\left(\frac{T_{ij}T_{ji}}{T_{ii}T_{jj}}\right) = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$$
Definer $F_{ij} = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$. Hvordan vil du tolke størrelsen $d_{ij} + d_{ji}$? Hvilken verdi har residualen til $F_{11}$? Vis at residualene til $F_{12}$ og $F_{21}$ alltid vil være like. Hvorfor kan det være et problem?
Definer $F_{ij} = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$. Hvordan vil du tolke størrelsen $d_{ij} + d_{ji}$? Hvilken verdi har residualen til $F_{11}$? Vis at residualene til $F_{12}$ og $F_{21}$ alltid vil være like. Hvorfor kan det være et problem?
For å dempe problemene som er identifisert, vurder å bruke kun verdier for $F_{ij}$ der $i > j$. Hvor mange slike verdier finnes det? Har residualene konstant varians? Er alle residualene uavhengige? Kan vi bruke OLS for å estimere $\beta$?
For å dempe problemene som er identifisert, vurder å bruke kun verdier for $F_{ij}$ der $i > j$. Hvor mange slike verdier finnes det? Har residualene konstant varians? Er alle residualene uavhengige? Kan vi bruke OLS for å estimere $\beta$?
En GLS (generalisert minste kvadraters metode) brukes for å analysere data fra et område med 12 soner. GLS tar for seg heteroskedastisitet og korrelasjon i residualene. Regresjonskoeffisienten for nyedistanser
er 0.0121953 med en standardfeil på 0.0004149 og en tilhørende p-verdi <2e-16. Tolk denne utskriften i detalj.
En GLS (generalisert minste kvadraters metode) brukes for å analysere data fra et område med 12 soner. GLS tar for seg heteroskedastisitet og korrelasjon i residualene. Regresjonskoeffisienten for nyedistanser
er 0.0121953 med en standardfeil på 0.0004149 og en tilhørende p-verdi <2e-16. Tolk denne utskriften i detalj.
Regresjonsmodellen er: lm(formula = nyelogverdier ~ nyedistanser)
. En ny regresjon kjøres for en spesifikk befolkningsgruppe, og formelen endres til: lm(formula = logverdierGruppe2 ~ nyedistanser)
. Den estimerte koeffisienten for nyedistanser
er 0.0252023 med en standardfeil på 0.0003473 (p <2e-16). Sammenlign resultatene fra de to regresjonene. Er forskjellen signifikant? Hvilken konklusjon kan du trekke fra disse studiene?
Regresjonsmodellen er: lm(formula = nyelogverdier ~ nyedistanser)
. En ny regresjon kjøres for en spesifikk befolkningsgruppe, og formelen endres til: lm(formula = logverdierGruppe2 ~ nyedistanser)
. Den estimerte koeffisienten for nyedistanser
er 0.0252023 med en standardfeil på 0.0003473 (p <2e-16). Sammenlign resultatene fra de to regresjonene. Er forskjellen signifikant? Hvilken konklusjon kan du trekke fra disse studiene?
Anta i Oppgave 4 at et stort antall personer velger en kombinasjon av bosted/arbeidssted, hvor nytten for hver person i kan utledes $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$. Hvordan kan modellen utledes som en logisk konsekvens av denne setningen?
Anta i Oppgave 4 at et stort antall personer velger en kombinasjon av bosted/arbeidssted, hvor nytten for hver person i kan utledes $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$. Hvordan kan modellen utledes som en logisk konsekvens av denne setningen?
Anta at reisefrekvensen er en funksjon av pendleavstanden, og estimeres ved regresjon der nyelogverdier
brukes som avhengig variabel, og nyedistanser
benyttes som uavhengig variabel. Hvordan vil du vurdere den resulterende modellen dersom histogrammet over residualene viser betydelig skjevhet, og normalitet er en sterk antagelse?
Anta at reisefrekvensen er en funksjon av pendleavstanden, og estimeres ved regresjon der nyelogverdier
brukes som avhengig variabel, og nyedistanser
benyttes som uavhengig variabel. Hvordan vil du vurdere den resulterende modellen dersom histogrammet over residualene viser betydelig skjevhet, og normalitet er en sterk antagelse?
Anta at $T_{ij} = A_i B_j e^{-\beta d_{ij} + \epsilon_{ij}}$, der $A_i$ og $B_j$ er konstanter. Forklar hvorfor en direkte OLS regresjon med $T_{ij}$ som den avhengige variabelen, fører til logistiske avledningsproblemer. Hvilket rammeverk kan man modellere dette innenfor?
Anta at $T_{ij} = A_i B_j e^{-\beta d_{ij} + \epsilon_{ij}}$, der $A_i$ og $B_j$ er konstanter. Forklar hvorfor en direkte OLS regresjon med $T_{ij}$ som den avhengige variabelen, fører til logistiske avledningsproblemer. Hvilket rammeverk kan man modellere dette innenfor?
Vis at selv om det ikke er spesifisert eksplisitt i oppgavesettet, kan parameteren $\beta$ i Oppgave 4 tolkes direkte som representerende "villigheten til å betale" for å redusere reiseavstanden.
Vis at selv om det ikke er spesifisert eksplisitt i oppgavesettet, kan parameteren $\beta$ i Oppgave 4 tolkes direkte som representerende "villigheten til å betale" for å redusere reiseavstanden.
Under hvilke spesifikke forhold vil bruken av vanlige minste kvadrater (OLS) i stedet for generaliserte minste kvadrater (GLS) i konteksten av modell 4 føre til konsistente, men ineffektive estimatorer, men de rapporterte standardfeilene vil være upålitelige?
Under hvilke spesifikke forhold vil bruken av vanlige minste kvadrater (OLS) i stedet for generaliserte minste kvadrater (GLS) i konteksten av modell 4 føre til konsistente, men ineffektive estimatorer, men de rapporterte standardfeilene vil være upålitelige?
Flashcards
Kombinasjoner bosted/arbeidssted
Kombinasjoner bosted/arbeidssted
Antall mulige måter å velge bosted og arbeidssted på.
dij (reiseavstand)
dij (reiseavstand)
Reiseavstand mellom sone i og sone j.
Uij (nytte)
Uij (nytte)
Nytten en person har ved å reise fra sone i til sone j.
εij (tilfeldig variabel)
εij (tilfeldig variabel)
Signup and view all the flashcards
ε (definert differanse)
ε (definert differanse)
Signup and view all the flashcards
Kovarians
Kovarians
Signup and view all the flashcards
Varians
Varians
Signup and view all the flashcards
Bosted/arbeidssted-tabell
Bosted/arbeidssted-tabell
Signup and view all the flashcards
Marginaltotal
Marginaltotal
Signup and view all the flashcards
Kji-kvadrattest
Kji-kvadrattest
Signup and view all the flashcards
Tij-modell
Tij-modell
Signup and view all the flashcards
dij + dji
dij + dji
Signup and view all the flashcards
Generisk minste kvadraters metode (GLS)
Generisk minste kvadraters metode (GLS)
Signup and view all the flashcards
Forklaringskraft (R-squared)
Forklaringskraft (R-squared)
Signup and view all the flashcards
Normalscore-plott
Normalscore-plott
Signup and view all the flashcards
Residualplott
Residualplott
Signup and view all the flashcards
Konfidensintervall
Konfidensintervall
Signup and view all the flashcards
Study Notes
Oppgave 1
- En byregion består av 12 ulike soner, hvor innbyggere bor i én sone og jobber i en annen.
- Det totale antall kombinasjoner av bosted/arbeidssted er 144 (12 * 12).
- Hvis sone 1 er bysentrum, og andre soner er sortert etter avstand, er det 66 kombinasjoner der arbeidsstedet er nærmere bysentrum enn bostedet.
- Reiseavstanden mellom sone i og j er definert som dij, og nytten ved å reise fra i til j er gitt ved formelen Uij = −β dij + ϵij.
- ϵij er uavhengige og normalfordelte med forventning 0 og varians 50, og β = 0.2.
- Fortegnet til -βdij er negativt, noe som betyr at nytte reduseres med økende reiseavstand.
- Den nye variabelen ϵ er definert som ϵ11 - ϵ12.
- ϵ er normalfordelt.
- ϵ forventning er 0 (E[ϵ] = E[ϵ11]-E[ϵ12] = 0-0 = 0).
- e sin varians er 100 (Var[ϵ] = Var[ϵ11] + Var[-ϵ12] = 50 + 50).
- Sannsynligheten for at en person foretrekker å bo i sone 2 og jobbe i sone 1 fremfor å bo og jobbe i sone 1 er 15.87%, gitt at d11 = 0 og d12 = 50.
- Dette regnes ut ved P(U11 < U12) ved å sette inn de gitte verdiene og bruke standardnormalfordelingen.
Oppgave 2
- Cov[X + Y, W] = Cov[X, W] + Cov[Y, W] er vist ved å bruke definisjonen Cov[U, V] = E[U • V] – E[U] • E[V].
- Når X, Y og Z er uavhengige, er Cov[X + Y, Z + Y] = Var[Y].
- For alle par (i, j) der i og j går fra 1 til 12, er ϵij uavhengige med forventning 0 og konstant varians σ² ≠ 0.
- ϵ̃ij defineres som ϵij + ϵji − ϵii − ϵjj.
- Forventningen til ϵ̃ij når i ≠ j er 0.
- Variansen til ϵ̃ij når i ≠ j er 4σ².
- Kovariansen mellom ϵ̃12 og ϵ̃13 er σ² og er derfor avhengige.
Oppgave 3
- En byregion består av 4 soner, og tabellen viser antall personer som bor i sone i og jobber i sone j.
- Marginaltotalene viser totalt antall innbyggere i hver sone og antall arbeidsplasser i hver sone.
- Sone 1 er karakterisert som et bysentrum, da det er mange flere arbeidsplasser enn innbyggere der.
- Hvis valg av arbeidssted var uavhengig av bosted, ville tabellen vise fordelinger basert på produktet av marginaltotalene delt på totalen.
- En kji-kvadrattest for uavhengighet brukes til å undersøke om valg av arbeidssted er uavhengig av valg av bosted, med et signifikansnivå på 5%.
- Testen gir en sterk forkastning av uavhengighet, som er en rimelig konklusjon da bosted og arbeidsted ofte er relatert.
- Svakheten med testen er at med et stort antall observasjoner vil selv små effekter føre til forkastning.
Oppgave 4
- De enkleste deloppgavene er b), d) og e).
- En byregion består av 12 soner.
- dij betegner reiseavstanden fra sone i til sone j, og Tij betegner antall yrkesaktive som bor i sone i og jobber i sone j.
- Det antas at Tij = AiBje-βdij+ϵij, der β er en konstant og ϵij er uavhengige N[0, σ²]-fordelte.
- Under antakelsen dii = 0, kan man vise at ln(TijTji/TiiTjj) = −β(dij + dji) + (ϵij + ϵji − ϵii − ϵjj).
- Fij defineres som −β(dij + dji) + (ϵij + ϵji − ϵii − ϵjj).
- dij + dji kan tolkes som total reiseavstand til og fra arbeid.
- Residualen til F11 er alltid null.
- Residualene til F12 og F21 er alltid like, noe som kan være et problem da det indikerer manglende uavhengighet.
- Ved å kun benytte verdier av Fij der i > j, reduseres problemet i b).
- Det finnes 66 slike verdier.
- Variansen til residualene er konstant, men residualene er ikke uavhengige.
- OLS kan derfor ikke brukes til å finne β.
- GLS (generalisert minste kvadraters metode) er brukt for data som angitt i punkt c), og fjerner avhengigheten i residualene.
- Forklaringskraften er god (93%), og effekten av avstand er sterkt signifikant.
- Histogrammet ligner normalfordelingen, normalscore-plottet er tilnærmet rett, og residualene er homogene og fri for trender.
- En ny regresjon er utført for en spesiell befolkningsgruppe.
- Forklaringskraften er svært høy (99%), og avstand er sterkt signifikant.
- Den estimerte verdien til β er omtrent dobbelt så stor som for den første regresjonen.
- Konfidensintervaller brukes for å undersøke om forskjellen er signifikant.
- Intervallene overlapper ikke, og forskjellen er signifikant.
- Kort pendleavstand er viktigere for den spesielle befolkningsgruppen.
- En økning i avstand på 1 km fører til en nedgang i reisehyppighet på 2.5% for den spesielle befolkningsgruppen.
- For den første regresjonen vil en pendleavstand på 100 kilometer redusere hyppigheten med 70%.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.