Lernzettel Quanti PDF

Summary

This document is a summary of quantitative methods for urban analysis. It covers topics such as sampling, different types of variables, and scales of measurement. The document also includes examples and exercises.

Full Transcript

## Zusammenfassung quantitative Methoden der Stadtanalyse Die Grundgesamtheit (population) ist die Menge aller Untersuchungselemente, für die eine Aussage gemacht werden soll. Eine Stichprobe (sample) ist eine Teilmenge der Grundgesamtheit, über die in der Untersuchung Daten gesammelt werden. Eleme...

## Zusammenfassung quantitative Methoden der Stadtanalyse Die Grundgesamtheit (population) ist die Menge aller Untersuchungselemente, für die eine Aussage gemacht werden soll. Eine Stichprobe (sample) ist eine Teilmenge der Grundgesamtheit, über die in der Untersuchung Daten gesammelt werden. Elemente der Stichprobe werden meist durch zufallsgesteuerte Verfahren ausgewählt. Grund: Jeder Merkmalsträger der Grundgesamtheit kann mit derselben Wahrscheinlichkeit in die Stichprobe aufgenommen werden. Ziel bei der Auswahl einer Stichprobe: von den Eigenschaften der Teilmenge auf die Eigenschaften der Grundgesamtheit schließen („repräsentative Stichprobe"). Wovon ist die Repräsentativität einer Stichprobe abhängig? - Stichprobenumfang - Stichprobenauswahlverfahren „Gesetz der Zahl": Eigenschaften der Stichprobe nähern sich mit zunehmendem Stichprobenumfang den Eigenschaften der Grundgesamtheit an (Stichprobenumfänge von n < 30 nicht repräsentativ). ### Merkmalstyp | | qualitativ | quantitativ/metrisch | |:------|:------------------|:----------------------| | | nominal | diskret | | | ordinal | stetig | Wichtig ist die eindeutige Bestimmung der Grundgesamtheit (GG). Grundgesamtheit: eindeutig definierte Menge von Untersuchungseinheiten (Anwohner, Kreisfreie Städte). Konzeptuelle GG: nicht tatsächlich existent, aber hypothetisch vorstellbar (Patienten, Autos). Eine Variable (Merkmal) ist eine Funktion, die jedem in Frage kommenden Untersuchungselement genau einen Wert (= Variablenwert) zuordnet. Ein Parameter ist die numerische Zusammenfassung einer Grundgesamtheit. Ein Stichprobenparameter ist die numerische Zusammenfassung der Stichprobenwerte. Die Elemente der Grundgesamtheit werden als statistische Einheiten bezeichnet. Es sind also diejenigen Personen oder Objekte, deren Eigenschaften für eine bestimmte Untersuchung von Interesse sind. ## Skalenniveaus | Skalenniveau | Beschreibung | |:-------------|:---------------------------------------------------------------------------------| | Nominalskala | von oben nach unten zunehmenden Informationsgehalt | | Ordinalskala | von oben nach unten zunehmenden Informationsgehalt | | Metrische Skalen | von oben nach unten zunehmenden Informationsgehalt | | Intervallskala | von oben nach unten zunehmenden Informationsgehalt | | Rationalskala | von oben nach unten zunehmenden Informationsgehalt | Bezeichnung von Variablen i.d.R. mit großen Buchstaben, z.B. X, Y, Z. Bezeichnung von Werten mit kleinen Buchstaben, z.B. xi, xj, yi, zk. ### Tabelle: Charakterisierung von Skalenniveaus | Skalenniveau | Zweck | Mögliche Relationen und Operationen | Beispiele | |:-------------|:-----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | Nominalskala | Identifikation von Untersuchungselementen i, j | x = x | →Geschlecht, →Staatsangehörigkeit, →Bundesland, →Städte der Größe nach geordnet | | Ordinalskala | Identifikation und Ordnung (der Größe nach) von Untersuchungselementen i, j | x = x, x > x, x < x | →Schüler der Leistung nach geordnet | | Intervallskala | Identifikation, Ordnung und Bewertung von Untersuchungselementen, so dass Aussagen wie „i ist um a Einheiten größer/kleiner als j" möglich sind | Wie oben und zusätzlich x = x + a, q-x = x | →Temperaturen in °C, Nullpunkt nicht „Startpunkt" sondern künstlich definiert | | Rationalskala | Identifikation, Ordnung und Bewertung von Untersuchungselementen, so dass zusätzliche Aussagen wie „i ist a-mal so groß wie j" möglich sind | Wie oben und zusätzlich X + X = c, x₁ = a x, x₁ = c, q/x = 'x | →Größe von Gebieten in km², →Länge von Wegen in km | # Arten von Stichproben ## Systematische Stichprobe Zur Erzielung einer systematischen Stichprobe mit dem Umfang n: - Zunächst zufällige Auswahl eines Stichprobenelementes unter den ersten [N/n] Elementen (Klammern zeigen an: nur ganzzahligen Teil von N/n nehmen). Bezeichnung für das zufällig ausgewählte erste Element: k. Die Elemente des Stichprobenrahmens, die sich in der Stichprobe befinden, sind k + i [N/n], i = 0, 1, ..., n-1. Mit N = 107 und n = 5, N/n = 21(,4). 45 - Zunächst zufällige Auswahl eines Stichprobenelementes unter den ersten [N/n] Elementen (Klammern zeigen an: nur ganzzahligen Teil von N/n nehmen). Bezeichnung für das zufällig ausgewählte erste Element: k. Die Elemente des Stichprobenrahmens, die sich in der Stichprobe befinden, sind k + i [N/n], i = 0, 1 n-1. Mit N = 107 und n = 5, N/n = 21(,4). Angenommen, unter den ersten 21 Stichprobenelementen haben wir das Element k = 3 zufällig ausgewählt, dann sind die ausgewählten 5 Stichprobenelemente: 3, 3 + 21 = 24, 3 + 42 = 45, 3 + 63 = 66, 3 + 84 = 87. ## ZUSAMMENFASSEN ### Geschichtete Stichprobe Elemente einer endlichen Grundgesamtheit werden in Klassen (Schichten) zusammengefasst. Annahme: - Elemente aus der gleichen Klasse haben hinsichtlich der untersuchten Frage ein ähnliches „Verhalten". - Elemente aus verschiedenen Klassen verhalten sich unterschiedlich. Anschließend Ziehung einer reinen Zufallsstichprobe aus jeder Klasse (Schicht). Beispiel: Freizeitverhalten nach Altersgruppen 47. ### Klumpenstichprobe Voraussetzung für Klumpenstichprobe: - Grundgesamtheit muss schon in gleichsam „natürliche" Gruppen aufgeteilt sein. - Eine dieser Gruppen (Klumpen) wird dann als Stichprobe gewählt. Klumpenstichproben weichen am stärksten von reinen Zufallsstichproben ab. - Verzerrung durch Fragestellung oder unklare Formulierung der Frage möglich. ### Häufigkeiten Beschreiben die Anzahl des Auftretens der Ausprägungen innerhalb einer Gruppe oder eines Wertebereiches (Klasse). Man unterscheidet - absolute Häufigkeiten, - relative Häufigkeiten, - kumulierte Häufigkeiten. #### Absolute Häufigkeiten - Jedem Beobachtungswert (bzw. jeder Klasse von Werten) wird eine Zahl zugeordnet, die angibt, wie oft dieser Beobachtungswert in der Urliste (bzw. innerhalb der jeweiligen Klasse) aufgetreten ist. - Summe aller absoluten Häufigkeiten ist gleich der Anzahl aller Beobachtungswerte. #### Relative Häufigkeit (relative frequency) Die relative Häufigkeit für ein Intervall ist der Anteil der Beobachtungen, die in ein bestimmtes Intervall fallen. #### Kumulierte Häufigkeiten - Summen von Häufigkeiten einzelner Ausprägungen - entweder in relativer oder in absoluter Form - Summe aller absoluten Häufigkeiten ist gleich der Anzahl aller Beobachtungswerte. ## Kontingenztafel: Beispiel Rauchen Männer häufiger als Frauen? ### Kreuztabelle 1c: Beobachtete Werte | | Männer | Frauen | Summe | |:--------|:-------|:-------|:------| | Raucher | 30 | 20 | 50 | | Nichtraucher | 20 | 30 | 50 | | Summe | 50 | 50 | 100 | N=100; keine fehlenden Werte. ## Übersicht: Maße der zentralen Tendenz und der Streuung | Maßzahl | Definition | Interpretation | Anwendbar auf Skalenniveau | |--------------------------------|:----------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------|:-------------------------------| | Zentrale Tendenz | | | | | Mittelwert (arithmetisches Mittel) | $\bar{x} = \frac{\sum x_i}{n}$ | Gravitationszentrum | metrisch | | Median | 50-Prozent-Perzentil | Mittlerer Variablenwert einer metrisch geordneten Datensammlung | metrisch, ordinal | | Modus | Der am häufigsten vorkommende Wert | Das wahrscheinlichste Ergebnis, anwendbar auf alle Datentypen | metrisch, ordinal, nominal | | Variabiliät/ Streuung | | | | | Varianz | $s^2 = \frac{\sum (x_i - \bar{x})^2}{n-1}$ | Je größer die Streuung, desto größer der Wert. Durchschnittliche quadrierte Abweichung vom Mittelwert | metrisch | | Standardabweichung | $s = \sqrt{\frac{\sum (x_i - \bar{x})^2}{n-1}}$ | Empirische Regel: Wenn glockenförmig, dann liegen 68%, 95% der Werte innerhalb von s, 2s entfernt vom Mittelwert | metrisch | | Spannweite | Differenz zwischen dem größten und dem kleinsten Variablenwert | Wird mit steigender Variabilität größer | metrisch | | Interquartilbereich | Differenz zwischen dem oberen und dem unteren Quartil | Umfasst die mittlere Hälfte der Daten | metrisch | Das Summenzeichnen „Sigma": Σ Gewichtetes arithmetisches Mittel: ### Streuungsmaße => dienen zur Messung des Abweichungsverhaltens von Merkmalsausprägungen Lagemaße => dienen der Beschreibung der zentralen Tendenz • WICHTIG: zwei Datensätze mit gleichem Lagemaß der zentralen Tendenz können unterschiedliche Streuung um den Wert dieses Lagemaßes aufweisen • Streuungsmaße geben Aufschluss über Abweichungsverhalten ### Interpretation von Streuungsmaßen: • Je größer der Wert, desto größer die Streuung • Ist der Wert klein, sind die Beobachtungen eher um einen Punkt konzentriert • ABER: konkrete Werte schwierig zu interpretieren, da: Auftreten völlig unterschiedlicher Grössenordnungen in Abhängigkeit vom betrachteten Maß und Datensatz • Verwendung von Streuungsmaßen erfordert quantitatives (metrisches) Merkmal ### Spannweite (Variationsbreite) (range) Die Spannweite ist die Differenz zwischen dem größten und dem kleinsten Wert einer Variablen. ### Unteres und oberes Quartil (lower and upper quartile) Das 25%-Perzentil wird das untere Quartil genannt, das 75%-Perzentil wird als das obere Quartil bezeichnet. ## Abweichung (deviation) Die Abweichung der iten Beobachtung $x_i$ vom Mittelwert ist ($x_i - \bar{x}$), also die Differenz zwischen den beiden Werten. Die mittlere Abweichung ist definiert als mittlerer (absoluter) Abstand der einzelnen Werte vom arithmetischen Mittelwert der Stichprobe oder Grundgesamtheit ## Standardabweichung (s) - dient wie die empirische Varianz ($s^2$) zur Messung der Streuung eines Datensatzes - wird aus Wurzel der empirischen Varianz gebildet - besitzt dieselbe Maßeinheit wie die Beobachtungswerte => eignet sich eher zum direkten Vergleich mit den Daten der Stichprobe oder der Grundgesamtheit ### Übersicht Grafische Datenaufbereitung | Merkmalstyp | Datenformat | Diagramm | |:-------------|:-------------|:-------------------------------------------------------------------------------| | nominal, ordinal, wichtig | Urliste, Häufigkeitstabelle, Einzeldaten | Säulen- und Balkendiagramm | | metrisch, reelle Zahlen (diskret quantitativ) | Urliste, klassierte Daten, Häufigkeitstabelle, Einzeldaten | Histogramm | | nominal, ordinal, metrisch (diskret quantitativ) | Urliste, Häufigkeitstabelle, Kontingenztabelle | Kreisdiagramm | | metrisch | Urliste, Einzeldaten | Stamm-Blatt | | | absolut, relativ, % | | | | absolut, relativ, % | | | | absolut, relativ, % | | | | einzelne Datenwerte | | ## Noch: Übersicht Grafische Datenaufbereitung | Merkmalstyp | Datenformat | Diagramm | |:-------------|:-------------|:-------------------------------------------------------------------------------| | metrisch, ordinal, reelle Zahlen (diskret quantitativ) | Urliste, Häufigkeitstabelle, Kontingenztabelle, Einzeldaten | Boxplot, Liniendiagramm, Streudiagramm | | metrisch, reelle Zahlen | Urliste, Einzeldaten | Verlaufskurve | | | absolut, relativ, % | | | | Lage- und Streuungsmaße | | | | einzelne Datenpunkte | |

Use Quizgecko on...
Browser
Browser