Bysentrum preferanse modell

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson
Download our mobile app to listen on the go
Get App

Questions and Answers

Anta at det eksisterer en byregion med 12 distinkte soner, hvor beboere typisk bor i én sone og arbeider i en annen. Hvis vi antar at sone 1 fungerer som et sentralt forretningsdistrikt (CBD) og alle andre soner er ordnet sekvensielt basert på deres radiale avstand fra sone 1, hvor mange unike kombinasjoner eksisterer det hvor arbeidsplassen ligger nærmere CBD enn bostedet?

Det er 66 slike kombinasjoner.

Gitt at $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$ representerer nytten en person opplever ved å reise fra sone i til sone j, der $\epsilon_{ij}$ er uavhengige og normalfordelte med null forventning og varians 50, og $\beta = 0.2$, beregn forventet nytte ved å reise fra i til j. Hvordan tolker du fortegnet til dette leddet?

Den forventede nytten er $E[U_{ij}] = -\beta d_{ij}$. Fortegnet er negativt, noe som indikerer at nytten reduseres med økende avstand.

Definer $\epsilon = \epsilon_{11} - \epsilon_{12}$, hvor $\epsilon_{11}$ og $\epsilon_{12}$ er uavhengige og normalfordelte med null forventning og varians 50. Hva er fordelingen av $\epsilon$, og hva er forventningen og variansen?

$\epsilon$ er normalt fordelt med forventning 0 og varians 100.

Benytt resultatet fra forrige spørsmål. Hva er sannsynligheten for at en person foretrekker å bo i sone 2 og jobbe i sone 1 fremfor å bo og jobbe i sone 1, gitt at $d_{11} = 0$ og $d_{12} = 50$?

<p>Sannsynligheten er 15.87%.</p> Signup and view all the answers

La $X$, $Y$, $Z$ og $W$ være tilfeldige variabler. Bevis at $\text{Cov}[X + Y, W] = \text{Cov}[X, W] + \text{Cov}[Y, W]$.

<p>Beviset følger direkte fra definisjonen av kovarians og lineariteten av forventning.</p> Signup and view all the answers

Anta at $X$, $Y$ og $Z$ er uavhengige tilfeldige variabler. Bevis at $\text{Cov}[X + Y, Z + Y] = \text{Var}[Y]$.

<p>Beviset involverer å bruke uavhengigheten til å forenkle kovariansuttrykket, slik at bare variansen til Y gjenstår.</p> Signup and view all the answers

Anta at for alle par $(i, j)$ hvor $i = 1, ..., 12$ og $j = 1, ..., 12$, $\epsilon_{ij}$ er uavhengige med null forventning og konstant varians $\sigma^2 \neq 0$. Definer $\tilde{\epsilon}{ij} = \epsilon{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj}$. Finn forventning og varians til $\tilde{\epsilon}{ij}$ når $i \neq j$ og kovariansen mellom $\epsilon{12}$ og $\epsilon_{13}$. Er disse uavhengige variabler?

<p>Forventningen er 0, variansen er $4\sigma^2$, kovariansen er $\sigma^2$, og de er avhengige.</p> Signup and view all the answers

I en byregion bestående av 4 distinkte soner, gitt en matrise T som spesifiserer antall pendlere som bor i sone $i$ og jobber i sone $j$, finn marginaltotalene til tabellen. Hvordan tolker du disse tallene? Hva kjennetegner sone 1?

<p>Marginaltotalene representerer totalt antall beboere i hver sone og totalt antall arbeidsplasser i hver sone. Sone 1 er kjennetegnet ved flere arbeidsplasser enn beboere, typisk for et sentralt forretningsdistrikt.</p> Signup and view all the answers

Hvordan ville tabellen sett ut hvis valg av arbeidssted var uavhengig av bosted i den samme byregionen med 4 soner?

<p>Tabellen vil reflektere forventede frekvenser basert på uavhengighet, beregnet ved å multiplisere de respektive marginaltotalene og dividere med totalt antall observasjoner.</p> Signup and view all the answers

Bruk en kji-kvadrattest for uavhengighet på dataene for å undersøke om arbeidssted er uavhengig av bosted, ved å bruke et signifikansnivå på 5%. Hvilken konklusjon trekker du? Er dette en rimelig konklusjon? Hva er en svakhet ved denne testen?

<p>En kji-kvadrat-test vil mest sannsynlig føre til forkastning av nullhypotesen om uavhengighet. Med store utvalgsstørrelser kan imidlertid testen være overfølsom, noe som fører til statistisk signifikans selv om effekten er liten.</p> Signup and view all the answers

Anta at $d_{ii} = 0$ for alle verdier av $i$. Vis at $$ln\left(\frac{T_{ij}T_{ji}}{T_{ii}T_{jj}}\right) = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$$

<p>Ligningen kan bevises ved å erstatte definisjonen av $T_{ij}$ og forenkle ved å bruke logaritmeregler.</p> Signup and view all the answers

Definer $F_{ij} = -\beta(d_{ij} + d_{ji}) + (\epsilon_{ij} + \epsilon_{ji} - \epsilon_{ii} - \epsilon_{jj})$. Hvordan vil du tolke størrelsen $d_{ij} + d_{ji}$? Hvilken verdi har residualen til $F_{11}$? Vis at residualene til $F_{12}$ og $F_{21}$ alltid vil være like. Hvorfor kan det være et problem?

<p>$d_{ij} + d_{ji}$ representerer den totale tur-retur-reiseavstanden mellom sone i og j. Residualet til $F_{11}$ er null. Residualene til $F_{12}$ og $F_{21}$ er identiske på grunn av symmetri, som kan føre til kollinearitetsproblemer i regresjon.</p> Signup and view all the answers

For å dempe problemene som er identifisert, vurder å bruke kun verdier for $F_{ij}$ der $i > j$. Hvor mange slike verdier finnes det? Har residualene konstant varians? Er alle residualene uavhengige? Kan vi bruke OLS for å estimere $\beta$?

<p>Det er 66 slike verdier. Variansen er konstant. Residualene er ikke alle uavhengige. OLS er ikke passende, da residualene ikke er uavhengige.</p> Signup and view all the answers

En GLS (generalisert minste kvadraters metode) brukes for å analysere data fra et område med 12 soner. GLS tar for seg heteroskedastisitet og korrelasjon i residualene. Regresjonskoeffisienten for nyedistanser er 0.0121953 med en standardfeil på 0.0004149 og en tilhørende p-verdi <2e-16. Tolk denne utskriften i detalj.

<p>Effekten avstand er sterkt signifikant da p-verdien er ekstremt liten, og avstanden har en viktig betydning. Forklaringskraften er god, men en mer passende modell bør vurderes.</p> Signup and view all the answers

Regresjonsmodellen er: lm(formula = nyelogverdier ~ nyedistanser). En ny regresjon kjøres for en spesifikk befolkningsgruppe, og formelen endres til: lm(formula = logverdierGruppe2 ~ nyedistanser). Den estimerte koeffisienten for nyedistanser er 0.0252023 med en standardfeil på 0.0003473 (p <2e-16). Sammenlign resultatene fra de to regresjonene. Er forskjellen signifikant? Hvilken konklusjon kan du trekke fra disse studiene?

<p>Forskjellen er signifikant. Verdien av beta er mye større for den spesielle befolkningsgruppen hvilket betyr at kort pendleavstand er viktigere for denne gruppen.</p> Signup and view all the answers

Anta i Oppgave 4 at et stort antall personer velger en kombinasjon av bosted/arbeidssted, hvor nytten for hver person i kan utledes $U_{ij} = - \beta d_{ij} + \epsilon_{ij}$. Hvordan kan modellen utledes som en logisk konsekvens av denne setningen?

<p>Modellen i Oppgave 4 kan utledes som en logisk konsekvens av et stort antall individer som velger bosted og arbeidssted basert på nyttefunksjoner, som fører til en modelleringstilnærming som brukes i diskret valgmodellering.</p> Signup and view all the answers

Anta at reisefrekvensen er en funksjon av pendleavstanden, og estimeres ved regresjon der nyelogverdier brukes som avhengig variabel, og nyedistanser benyttes som uavhengig variabel. Hvordan vil du vurdere den resulterende modellen dersom histogrammet over residualene viser betydelig skjevhet, og normalitet er en sterk antagelse?

<p>Skjevhet i residualene indikerer en potensiell brudd på linearitetsantagelsen eller tilstedeværelsen av uteliggere. Transformasjon av variabler eller robust regresjon bør vurderes.</p> Signup and view all the answers

Anta at $T_{ij} = A_i B_j e^{-\beta d_{ij} + \epsilon_{ij}}$, der $A_i$ og $B_j$ er konstanter. Forklar hvorfor en direkte OLS regresjon med $T_{ij}$ som den avhengige variabelen, fører til logistiske avledningsproblemer. Hvilket rammeverk kan man modellere dette innenfor?

<p>Direkte OLS regresjon er problematisk på grunn av begrensede, ikke-negative $T_{ij}$. Poisson- eller negativ binomial regresjon vil være passende rammeverk for å modellere telledata.</p> Signup and view all the answers

Vis at selv om det ikke er spesifisert eksplisitt i oppgavesettet, kan parameteren $\beta$ i Oppgave 4 tolkes direkte som representerende "villigheten til å betale" for å redusere reiseavstanden.

<p>$\beta$ representerer marginal nytte av å redusere pendleavstand. Det kan derfor tolkes som den marginale villigheten til å betale i verktøyterm.</p> Signup and view all the answers

Under hvilke spesifikke forhold vil bruken av vanlige minste kvadrater (OLS) i stedet for generaliserte minste kvadrater (GLS) i konteksten av modell 4 føre til konsistente, men ineffektive estimatorer, men de rapporterte standardfeilene vil være upålitelige?

<p>OLS vil forbli konsistent, men ineffektiv og rapporterte standardfeil upålitelige når residualene er homoskedastiske men korrelerte. GLS bør brukes.</p> Signup and view all the answers

Flashcards

Kombinasjoner bosted/arbeidssted

Antall mulige måter å velge bosted og arbeidssted på.

dij (reiseavstand)

Reiseavstand mellom sone i og sone j.

Uij (nytte)

Nytten en person har ved å reise fra sone i til sone j.

εij (tilfeldig variabel)

En tilfeldig variabel som representerer individuell preferanse eller uforutsette faktorer i nytteberegningen.

Signup and view all the flashcards

ε (definert differanse)

Differansen mellom to tilfeldige variabler.

Signup and view all the flashcards

Kovarians

Mål på den lineære sammenhengen mellom to variabler.

Signup and view all the flashcards

Varians

Mål på spredningen til en variabel rundt dens forventningsverdi.

Signup and view all the flashcards

Bosted/arbeidssted-tabell

Tabell som viser antall personer som bor i en sone og jobber i en annen.

Signup and view all the flashcards

Marginaltotal

Summen av tallene langs radene eller kolonnene i en tabell.

Signup and view all the flashcards

Kji-kvadrattest

Statistisk test for å undersøke om to kategoriske variabler er uavhengige av hverandre.

Signup and view all the flashcards

Tij-modell

En modell som forklarer antall yrkesaktive personer som bor i sone i og jobber i sone j, basert på reiseavstand.

Signup and view all the flashcards

dij + dji

Total reiseavstand til og fra arbeid.

Signup and view all the flashcards

Generisk minste kvadraters metode (GLS)

En metode for å estimere parametere i en lineær modell når residualene ikke er uavhengige eller har konstant varians.

Signup and view all the flashcards

Forklaringskraft (R-squared)

Et mål på hvor godt modellen passer til dataene.

Signup and view all the flashcards

Normalscore-plott

Plot som viser residualene mot de teoretiske kvantilene av en normalfordeling.

Signup and view all the flashcards

Residualplott

En grafisk fremstilling av residualene mot de tilpassede verdiene.

Signup and view all the flashcards

Konfidensintervall

Et intervall som gir et estimat for en parameter med en viss grad av sikkerhet.

Signup and view all the flashcards

Study Notes

Oppgave 1

  • En byregion består av 12 ulike soner, hvor innbyggere bor i én sone og jobber i en annen.
  • Det totale antall kombinasjoner av bosted/arbeidssted er 144 (12 * 12).
  • Hvis sone 1 er bysentrum, og andre soner er sortert etter avstand, er det 66 kombinasjoner der arbeidsstedet er nærmere bysentrum enn bostedet.
  • Reiseavstanden mellom sone i og j er definert som dij, og nytten ved å reise fra i til j er gitt ved formelen Uij = −β dij + ϵij.
  • ϵij er uavhengige og normalfordelte med forventning 0 og varians 50, og β = 0.2.
  • Fortegnet til -βdij er negativt, noe som betyr at nytte reduseres med økende reiseavstand.
  • Den nye variabelen ϵ er definert som ϵ11 - ϵ12.
  • ϵ er normalfordelt.
  • ϵ forventning er 0 (E[ϵ] = E[ϵ11]-E[ϵ12] = 0-0 = 0).
  • e sin varians er 100 (Var[ϵ] = Var[ϵ11] + Var[-ϵ12] = 50 + 50).
  • Sannsynligheten for at en person foretrekker å bo i sone 2 og jobbe i sone 1 fremfor å bo og jobbe i sone 1 er 15.87%, gitt at d11 = 0 og d12 = 50.
  • Dette regnes ut ved P(U11 < U12) ved å sette inn de gitte verdiene og bruke standardnormalfordelingen.

Oppgave 2

  • Cov[X + Y, W] = Cov[X, W] + Cov[Y, W] er vist ved å bruke definisjonen Cov[U, V] = E[U • V] – E[U] • E[V].
  • Når X, Y og Z er uavhengige, er Cov[X + Y, Z + Y] = Var[Y].
  • For alle par (i, j) der i og j går fra 1 til 12, er ϵij uavhengige med forventning 0 og konstant varians σ² ≠ 0.
  • ϵ̃ij defineres som ϵij + ϵji − ϵii − ϵjj.
  • Forventningen til ϵ̃ij når i ≠ j er 0.
  • Variansen til ϵ̃ij når i ≠ j er 4σ².
  • Kovariansen mellom ϵ̃12 og ϵ̃13 er σ² og er derfor avhengige.

Oppgave 3

  • En byregion består av 4 soner, og tabellen viser antall personer som bor i sone i og jobber i sone j.
  • Marginaltotalene viser totalt antall innbyggere i hver sone og antall arbeidsplasser i hver sone.
  • Sone 1 er karakterisert som et bysentrum, da det er mange flere arbeidsplasser enn innbyggere der.
  • Hvis valg av arbeidssted var uavhengig av bosted, ville tabellen vise fordelinger basert på produktet av marginaltotalene delt på totalen.
  • En kji-kvadrattest for uavhengighet brukes til å undersøke om valg av arbeidssted er uavhengig av valg av bosted, med et signifikansnivå på 5%.
  • Testen gir en sterk forkastning av uavhengighet, som er en rimelig konklusjon da bosted og arbeidsted ofte er relatert.
  • Svakheten med testen er at med et stort antall observasjoner vil selv små effekter føre til forkastning.

Oppgave 4

  • De enkleste deloppgavene er b), d) og e).
  • En byregion består av 12 soner.
  • dij betegner reiseavstanden fra sone i til sone j, og Tij betegner antall yrkesaktive som bor i sone i og jobber i sone j.
  • Det antas at Tij = AiBje-βdij+ϵij, der β er en konstant og ϵij er uavhengige N[0, σ²]-fordelte.
  • Under antakelsen dii = 0, kan man vise at ln(TijTji/TiiTjj) = −β(dij + dji) + (ϵij + ϵji − ϵii − ϵjj).
  • Fij defineres som −β(dij + dji) + (ϵij + ϵji − ϵii − ϵjj).
  • dij + dji kan tolkes som total reiseavstand til og fra arbeid.
  • Residualen til F11 er alltid null.
  • Residualene til F12 og F21 er alltid like, noe som kan være et problem da det indikerer manglende uavhengighet.
  • Ved å kun benytte verdier av Fij der i > j, reduseres problemet i b).
  • Det finnes 66 slike verdier.
  • Variansen til residualene er konstant, men residualene er ikke uavhengige.
  • OLS kan derfor ikke brukes til å finne β.
  • GLS (generalisert minste kvadraters metode) er brukt for data som angitt i punkt c), og fjerner avhengigheten i residualene.
  • Forklaringskraften er god (93%), og effekten av avstand er sterkt signifikant.
  • Histogrammet ligner normalfordelingen, normalscore-plottet er tilnærmet rett, og residualene er homogene og fri for trender.
  • En ny regresjon er utført for en spesiell befolkningsgruppe.
  • Forklaringskraften er svært høy (99%), og avstand er sterkt signifikant.
  • Den estimerte verdien til β er omtrent dobbelt så stor som for den første regresjonen.
  • Konfidensintervaller brukes for å undersøke om forskjellen er signifikant.
  • Intervallene overlapper ikke, og forskjellen er signifikant.
  • Kort pendleavstand er viktigere for den spesielle befolkningsgruppen.
  • En økning i avstand på 1 km fører til en nedgang i reisehyppighet på 2.5% for den spesielle befolkningsgruppen.
  • For den første regresjonen vil en pendleavstand på 100 kilometer redusere hyppigheten med 70%.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

More Like This

Use Quizgecko on...
Browser
Browser