Lernzettel Quantitative Methoden PDF
Document Details
Uploaded by PortableExuberance3699
Johannes Gutenberg Universität Mainz
Tags
Summary
This document is lecture notes on quantitative methods, covering topics such as social research and empirical methods. It discusses various concepts, including different types of statements and the process of drawing conclusions.
Full Transcript
## Vorlesung 1 ### Merkmale quantitativer empirischer Sozialforschung - Sammlung Techniken & Methoden zur Durchführung wissenschaftlicher Untersuchungen menschlichen Verhaltens & gesellschaftlichen Phänomenen - Sozialforschung: neue Erkenntnisse & Wissen über Wirklichkeit menschlichen Zusammenlebens...
## Vorlesung 1 ### Merkmale quantitativer empirischer Sozialforschung - Sammlung Techniken & Methoden zur Durchführung wissenschaftlicher Untersuchungen menschlichen Verhaltens & gesellschaftlichen Phänomenen - Sozialforschung: neue Erkenntnisse & Wissen über Wirklichkeit menschlichen Zusammenlebens, Verstehen & Erklären: Was? Wie Warum? - empirische Methoden: Beobachtung/ERfahrung Welt unter Verwendung wissenschaftlicher Methoden und Techniken (Werzeugkasten -> Diekmann) - Quantitativ: Darstellung von Sachverhalten & Zusammenhängen anhand von Zahlen, Statistik, standardisierten Verfahren bsp. identische Fragen- & Antwortkategorien erlauben Zuordnung von Beobachtungen zu Zahlenwerten ### Ziele quantitativer empirischer Sozialforschung - Aufklärung Menschen über Prozesse, außerhalb & innerhalb der jeweiligen Sozialorganisatzion ablaufen - Exploration, Beschreibung, Erklärung, Prognose ### Probleme Alltagswahrnehmung & -forschung - Quellen der Verzerrung "bias" - ungenaue Beobachtung - erwartungsabhängige Beobachtung: Bestätigungsbias, hypothesengesteuerte Beobachtung durch soziale Werte/ Normen, Konformitätsdruck, Autoritäten - selektive Wahrnehmung: Auswahl, Wahrnehmung, Erinnerung nur bestimmter Ausschnitte der Wirklichkeit - Pseudo-Regelmäßigkeiten & vorschnelle Verallgemeinerungen: Erkennen von Mustern & Zusammenhänge wo keine sind - unlogisches & falsches Schlussfolgern: bsp. Stereotype, Widersprüche, "Ausnahme bestätigt die Regel" ## Vorlesung 2 ### Satzarten unterscheiden & Merkmale benennen können #### Präskriptive Sätze - Werteurteil, soziale Normen - Soll-Sätze: bsp. 10 Gebote - nicht rein erfahrungswissenschaftliche brgründbar - aus "Sein" folgt kein "Sollen" - spielt in der empirischen Wissenschaft bei der Begründung von Normen eine Rolle #### Logische Sätze - Wahrheit / Falschheit durch empirische Verfahren nicht nachweisbar, nur durch logisch-mathematische Beweisverfahren - Analytisch wahre Sätze: immer wahr - Deduktion aus Axiomen - Tautologien - Definitionen - Konntradiktionen: immer falsch - Widersprüche #### Empirische Sätze - Behauptungen, dass Sachverhalte wahr/falsch sein können - Prüfung durch logische Analyse (Widerspruchsfreiheit/Tautologie) - Prüfung empirischer Gültigkeit (Übereinstimmung empirischer Beobachtungen) - Singuläre Sätze - raum-zeitlich fixiert - Beschreibung/Prognose - Mainz hat (derzeit) circa 200.000 Einwohner - Hypothetische Sätze - raum-zeitlich unbegrenzt - All-Sätze - Hypothesen: - Wenn-Dann, Je-Desto -> Annahme über Zusammenhänge - Gesetzte: - raum-zeitlich unbegrenzte Hypothesen, die als empirisch bestätigt gelten - Quasi-Gesetze: - raum-zeitliche Gültigkeit - bsp. Epochen ### Inforationsgehalt empirischer Sätze vergleichen & einordnen - Informationsgehalt -> Menge diesen Satz ausgeschlossenen Beobachtungsansätze - ausgeschlossene Sätze: potenzielle Falsifikatoren, ermöglichen empirische Aufdeckung der Falschheit des Satzes - hohere Anzahl potenzieller Falsifikatoren -> höherer Informationsgehalt - umso mehr Falsifikatoren meinen Satz verneinen können, desto höher ist der Informationsgehalt dieses Satzes - steigt, je präziser Begriffe definiert sind - steigt mit Umfang der Wenn-Komponente -> größerer Anwendungsbereich - sinkt mit Umfang der Dann-Komponente -> ungenauer Vorhersage ### Verfahren des Schließens (Induktion, Deduktion) sowie Probleme (Induktionsproblem, Induktionsfehler) benennen & anwenden - Induktion -> Schluss vom Besonderen aufs Allgemeine - Deduktion -> Schluss vom Allgemeinen aufs Besondere - Verfahren des Schließens von zwei Prämissen (A) (B) auf einen empirischen Einzelfall (C) bzw. umgekehrt - (A) -> allgemeine Gesetzmäßigkeit - (B) -> Randbedingung - (C) -> Einzelfall #### Deduktion: - (A) Alle Pinguine sind schwarz-weiß - (B) Pisko ist ein Pinguin - (C) Pisko ist schwarz-weiß - Schluss gegebener Prämissen (A) & (B) auf logisch zwingende Konsequenz (C) - logisch = zwingen -> etwas muss sein - Deduktionsschluss notwendig wahr - zunächhst kein Erkennntnisgewinn - neue Erkenntnisse durch empirische Falsifikation der deduktiv abgeleiteten Schlussfolgerung - Suche nach Beobachtungen, die (A) widersprechen -> dadurch Anstoß zu neuen/besseren Theorien - möglichst viele Beobachtungen #### Induktion: - (C) Pisko ist schwarz-weiß - (B) Pisko ist ein Pinguin - (A) Alle Pinguine sind schwarz-weiß - Nach (C) und (B) ist wahrscheinlich, dass (A) folgt, aber keineswegs zwingend - Sicher ist nur der beobachtete Einzelfall (Pinguin Pisko) - durch Einzelfall auf alle anderen Fälle per Verallgemeinerung geschlossen - etwas ist tatsächlich wirksam - generalisierende Hypothesen in der Praxis immer induktiv gewonnen - immer unsicher - Exploration in der quantitativen Sozialforschung #### Abduktion: - (A) Alle Pinguine sind schwarz-weiß - (C) Pisko ist schwarz-weiß - (B) Pisko ist ein Pinguin - Schluss von (A) und (C) auf (B) - Schluss von (C) und (A) auf (B) - Gemäß (A) und (C) ist (B) möglich, aber nicht unbedingt - Kann auch durch Zufall wahr sein - Für seine Gültigkkeit keine einzige gesicherte empirische Beobachtung - etwas kann sein - spekuliert unnd verwertet Indizien - Hypothesengenerierend #### Deduktiv-nomologisches Erklärungsmodell (HO-Schema) - Erklärung: Antwort auf Warum-Frage -> Zentrales Ziel empirischer Forschung - Explanans (= das Erklärende) - Explanandum (= das zu Erklärende) - Gesetz/Hypothese (raum-zeitlich unbegrenzt) - Randbedingung (singulärer Satz) - Phänomen (singulärer Satz) - (Alle) Taxifahrer*innen sind Rüpel. - Peter ist ein Taxifahrer. - Peter ist ein Rüpel. - Schluss von Gesetz und Randbedingung (zusammen -> Explanans) auf das Explanandum - D/N Erklärungen sind deterministisch - Schluss von Explanans auf Explanandum muss logisch korrekt sein - Explanans: mindestens ein gültiges Gesetz enthalten, beiungeprüften Hypothesen potenzielle Erklärungen - Randbedingung müsse wahr sein - Explanans muss empirischen Gehalt haben (nicht metaphysischer Natur) #### Probalistisches (induktiv-statistisches) Erklärungsmodell - in der Sozialwissenschaft gibt es lediglich wahrscheinliche Zusammenhänge - Explanans - Explanandum - Gesetz/Hypothese - Für 70% Fälle gilt: (Alle) Taxifahrer*innen sind Rüpel. - Randbedingung - Peter ist ein Taxifahrer. - Phänomen - Peter ist ein Rüpel. ??? - kein strikter (deterministischer) Zusammenhang wird angenommen - Explanandum folgt nicht mehr logisch (zwingend) aus dem Explanans -> könnte sein, dass Peter kein Rüpel ist, was Gesetz nicht widerspräche - genügt nicht mehr nur ein Fall, um Gesetz zu widerlegen - große Zahl an Fällen ist nötig - diese Art = wichtigste Form der Erklärungen in Sozial- und Humanwissenschaften #### Falsifikationismus/ Kritischer Rationalismus (Popper) - Logik der Forschung - jede Theorie kann falsch sein - alle Annahmen/Überzeugungen kritisch hinnterragt werden - Verifikation nicht möglich - Experimente/Beobachtungen können Theorie nie endgültig beweisen - Falsifikation aber möglich - Erkennntnisfortschritt durch Falsifikation -> Falsifikationismus - Konstruktion möglichst informationshaltiger Theorien, die sich falsifizieren lassen - harte Bewährungsproben (Falsifikationsversuche) - nicht falsifizierbare Theorien (vorläufig) behalten - intersubjektive Nachvollziehbarkeit (Replikationen) ### Probleme des naiven Falsifikationismus - zwischen Theorie & Realität stehen Beobachtungsansätze - Beobachtungsansätze können falsch sein, wenn Messinstrumente falsch messen (Basissatzproblem) - Forscher brauchen eine Theorie über Validität Messinstrumente (Instrumententheorie) - Begriffe Beobachtungsansätze können Begriffen Theorie abweichen (Korresponndenzproblem) - Korrespondenzregeln empirisch überprüfbar - daher: methodischer Falsifikationismus - auch auf Korrespondenzregeln und Instrumententheorie anzuwenden - Grundhaltung: kritisch gegenüber Theorien, Indikatoren, Beobachtungen - Popper: Wissenschaft ist ständiger Zweifel ## Vorlesung 3 ### Verstanden haben, was eine Hypothese ist und Hypothesenarten unterscheiden #### Hypothesen: -Zusammenhänge zwischen Variablen werden untersucht - Gesetz (All-Aussage) -> gut bestätiger Zusammenhang - Hypothese/hypothetischer Satz = Annahme über einen Sachverhalt/Zusammenhanng, wenn man erst noch herausfinden/ prüfen muss, ob der Zusammenhang besteht - Theorien manchmal direkt als Hypothesen formuliert. Häufig besteht Theorie aus Menge von Annahmen, aus denen empirisch überprüfbate Hypothesen abgeleitet werden müssen. - Hypothesenformulierung zentrale Voraussetzung Theorie zu prüfen. #### Deskriptive Hypothesen: - singuläre Sätze - Man kann Aussagen über einzelne Sachverhalte als Hypothesen bezeichnen - "Stimmmteil der Grünen liegt bei 20%" #### Zusammenhangshypothesen: Beziehung zwischen mindestens zwei Variablen - Wenn-Dann-Hypothese: - UV und AV dichotom - Alle Studierenden sind schlau -> Wenn Studierende Soziologie studieren, dann sind sie schlau. - Beispiel: "Arbeiter haben ein hohes Klassenbewusstsein" - Wenn Arbeiter (A), dann hohes Klassenbewusstsein (KB) -> Erwartung - UV = Klasse (Arbeiter / nicht-Arbeiter) - AV = Stärke Klassenbewusstsein (niedrig / hoch) - Implikationsbeziehung: probabilistisch, keine Aussage über~ A - Wenn (A), dann hohes (KB) - Wenn (nicht-A), dann (KB) oder (nicht-KB) - Empirisch: (A) und (nicht-KB) = Falsifikator - Äquivalenzbeziehung: Wenn und nur wenn-dann - Wenn (A), dann (B). Wenn (nicht-A), dann (nicht-KB) - Wenn Arbeiter, dann hohes Klassenbewusstsein. Wenn kein Arbeiter, dann kein hohes Klassenbewusstsein. - Deterministische Äquivalenz: Ein abweichender Fall genügt für die Falsifikation. - Probabilistische Äquivalenz: Wenn Arbeiter, dann höhere Wahrscheinlichkeit, ein hohes KB zu haben (häufiger hohhes KB). -> ...als wenn kein Arbeiter. - Hypothesen meist als probabilistische Äquivalenz gemeint - Wenn- Dann-Hypothesen: Prüfug mit Kreuztabelle - Wie lassen sich probabilistische Äquivalenzhypothesen empirisch überprüfen lassen? - Beispiel: Wenn (A), dann höhere Wahrscheinlichkeit hohes (KB) zu haben (häufiger hohes KB). -> ...als wenn (kein-A) - Überprüfung Vier-Felder Kreuztabelle: - UV: Berufliche Stellung - Angestellter - Arbeiter - Niedrig - I Konfirmatoren - II Falsifikatoren - AV: Klassenbewusstsein (KB) - Hoch - III Falsifikatoren - IV Konfirmatoren - Wahrscheinlichkeit P eines hohen (KB) bei (A) höher als bei (nicht-A)? - Prüfung mittels Vergleich Anteilwerte: Anteile hohes (KB) bei (A) > Anteil hohes (KB) bei (nicht-A) - Falsifikator-Beobbachtung nicht mit Hypothese vereinbar Konfirmator Hypothese mit Beobachtung vereinbar - Beispiel mit Fiktiven Daten: Umfrage unter 200 Beschäftigten - UV: Berufliche Stellung - Nicht- Arbeiter - Arbeiter - Niedrig - Konfirmatoren n=60 - Falsifikatoren n=40 - AV: Klassenbewusstsein - Hoch - Falsifikatoren n=40 - Konfirmatoren n=60 - Hypothese: Wahrscheinlichkeit P eines hohen Klassenbewusstsein wird bei Arbeitern höher sein als bei Angestellten. - Hypothese: - P (hohes KB I Arbeiter) > P (hohes KB I Nicht-Arbeiter) - Empirisch: - 60/(60+40) = 60% > 40/ (60+40) = 40% - Prozentsatzdifferenz: - 60%-40% = 20% - Hypothese ist vorläufig nicht falsifiziert - Wenn-Dann-Hypothesen: Grafische Prüfung - Energiesparen: Zurückdrehen der Heizung bei Abwesenheit - H1: Umweltbewusste Menschen sind eher Energiesparer - UV = Umweltbewusstsein (ja/nein) - gemessen mit Skala, zwei Gruppen - H2: Wenn nach Verbrauch abgerechnet wird, spart man eher - UV = Abrechnungsmodus nach Verbrauch oder Umlage - %. Energiesparer - %. Energiesparer - 37 - 23.5 - 23,4 - 17.5 - nicht u. bewusst - Umweltbewusst - Umlageregel - nach Verbrauch - Je-Desto-Hypothesen: - UV & AV (stetig oder haben Reihenfolge = ordinal) - Beispiel: Mit Berufserfahrung nimmt Einkommen zu - weitere Unterscheidungen nach Art & Richtung - positiver Zusammenhang: "mit x nimmt y zu" / "je höher x, desto höher y" (Anstieg durchgehend) - negativer Zusammenhang: "mit x geht y zurück" / "je höher x, desto niedriger y" - linear vs. kurvilinear (bsp. exponentiell, logistisch) - linear positiv - Y - y=atb.x - -X - linear negativ - Y - kurvilinear monoton steigend - Y - X - bsp. exponentiell - kurvilinear negativ - X - bsp. logistisch - nicht-monotone Zusammenhänge - U-förmig - umgekehrt U-förmig - i.d.R. empirische Prüfung probabilistische Gleichungen so formuliert, dass zufälliger ABweichungen berücksichtigt werden - Gerade: Y = a+b*x - Y = a+b*x+e -> lineares Regressionsmodell mit e = zufälliger Abweichung (Fehlerterm) - Je-Desto-Hypothesen -> positiver Zusammenhang - bsp. Je höher die Arbeitsstunden, desto höher das Einkommen - Empirisch: linear positiver Zusammenhang - erwerbstätige mit höheren Wochenarbeitsstunden tendieren zu höherem Einkommen - Je-Desto-Hypothesen -> negativer Zusammenhang - bsp. Je länger die Arbeitslosigkeit, (desto geriger die sozialen Kontakte und) desto geringer die Zufriedenheit mit dem Sozialleben. - Empirisch: (schwacher) linearer negativer Zusammenhang - Korrelation: -0,1 - Je-Desto-Hypothesen -> umgedreht u-förmiger Zusammenhang - bsp. Je höher Arbeitsstunden, desto höher der Stundenlohn - Empirisch: umgedreht u-förmiger Zusammenhang - Je-Desto-Hypothesen -> exponentieller Zusammenhang - bsp. Je höher die bestehenden Ansteckungen, desto mehr weitere Ansteckungen - Empirisch: exponentieller Zusammenhang (Wachstumsprozess); UV = Zeit - Je-Desto-Hypothesen -> s-förmiger Zusammenhang - bsp. Verbreitung/Diffusion von Smartphones: zunächst langsam, dann stark, dann Sättigung - Empirisch: s-förmiger (logistischer) Verlauf - häufig bei Diffusions- und Ansteckungsprozessen ### Individualistischer Fehlschluss - Individualeffekte führen nicht zwangsläufig zu korrespondierenden Kollektivhypothesen - Individual- und Kollektiveffekte auch gegenläufig verlaufen - Individuell gilt: Je höher Qualifikation einer Person, desto höher das Einkommen. -Kollektiv gilt nicht unbedingt: Je höher durchschnittliche Qualifikationen in einem Wirtschaftszweig, desto höher das Durchschnittseinkommen. - Kollektiv dagegen gilt: Je höher durchschnittliche Qualifikationen einem Wirtschaftszweig, desto niedriger Durchschnittseinkommen. (bsp. Universitäten, Schulen) ### Ökologischer Fehlschluss - unzulässiger Schluss von Kollektiv- auf Individualhypothese - hier "Ökologisch" = kollektiv - bsp. Empirischer Befund: Regionen hohem Anteil an Afd-Wählern sind Infektionszahlen besonders hoch - Jeder Punkt steellt Landkreis mit jeweiligen Kombination aus Stimmanteil & 7-Tage Inzidenz dar - Bezirke höherem Stimmanteil dendieren höherer 7-Tage Inzidenz in Ost & West (33% AfD & 550 Inzidenz) - Kollektv gilt also: Je höher Stimmanteil in Bezirk, desto höher 7-Tage Inzidenz - gilt das auch auf der Individualhypothese? - Individualhypothese: AfD-Wähler Verstoßen häufiger gegen Verbote - 1. AfD-Wähler verstoßen häufiger gegen Verbote -> Individualhypothese - 2. individuelle Missachtung Verboten erhöht individuelle Wahrscheinlichkeit einer Infektion -> Individualhypothese - 3. Ansteckungen erhöhen sich auch bei Verbotsbefolgern (exp. Wachstum) -> Aggregationsregel - Alternative Erklärungen für Zusammenhang Afd-Wähler & Infektionszahlen - Zufall? -> Problem: Erhebung nur zu einem Zeitpunkt, bsp. Beginn der Pandemie: Ost viel niedriger Grenznahe Gebiete (Scheinkorrelation?) - anderen Einflüsse - Fazit: Wissen es bis dato nicht, indirekte Hinweise - Ökologischer Fehlschluss nur zuverlässig durch empirische Untersuchungen auf Individualebene ausschließen, aber hierzu kaum Daten vorhanden ## Vorlesung 4 ### Ablauf einer empirischen Untersuchung - Formulierungund Präzisierung des Forschungsproblems: Fragestellung, Theorie, Hypothesen - Glaubenszugehörigkeit - Bildung - Vorurteile - Wahlverhalten - Soziale Klasse - Datengewinnung - Untersuchungsplan - Stichprobenziehung - Beobachtung / Datenerhebung - Datenauswertung - Datenanalyse - Y = a+x1+x2+x3+x4+e - y/x = 34% - Forschungsergebnisse/ Anwendung ### Konzeptspezifikation - häufig zu erfassende Merkmal nicht direkt beobachtbar - direkt beobachtbar: Alter, Geschlecht, Beobachtungsbegriff, manifeste Variable -> keine Indikatoren & Konzepte notwendig - nicht direkt beobachtbar: Umweltbewusstsein, soziale Schicht (theoretischer begriff, latente Variable) -> Konstrukte bzw. Konzepte der Forscher - in Theorien auftauchende Konzepte häufig mehrdeutig & vieschichtig - Definition bzw. möglichst präzise Umschreibung der Begriffe - Klärung möglicher Dimensionen (Bedeutungen), die der Begriff enthält - bsp. Religiösität -> Glaubensdimension, rituelle Dimension, Wissensdimension - bsp. soziale Herkunft -> Bildung der Eltern, Berufsprestige der Eltern, Status elterlichen Wohngegend ### Operationalisierung - schließt an Konzeptspezifikation an - Anweisung, wie theoretische Begriffe bzw. deren Dimensionen gemessen werden können - Zuordnung Begriffen zu empirisch beobachtbaren Sachverhalten, gleichzeitig Festlegung Variablen - erstreckt sich bis zur Datenauswertung - zunächst: Indikatoren für Dimensionen auswählen & festlegen - Indikator: empirisches Äquivalent, anhand zu untersuchenden Dimensionen erfasst werden soll - bsp. rituelle Dimension Religiosität -> Indikator: Kirchgangshäufigkeit - bsp. Bildung der Eltern -> Indikator: Schulabschluss Mutter/Vater - bsp. Operationalisierung "soziale Schicht" - Einkommen - Lohn - Zinsen - "Wie hoch monatliches Nettoeinkommen?" - "Wie hoch monatliches Zinseinkommen?" - Soziale Schicht - Bildung - Schulbildung - "Welchen Schul-abschluss haben Sie?" - Berufsbildung - "Welchen Berufs-abschluss haben Sie?" - Frau Meyer hat einen Masterabschluss ### Skalenniveuas von Variablen unterscheiden & Variabblen entsprechen Skalenniveaus kategorisieren können - Nominal: gleich / ungleich - Ordinal: größer, kleiner Relationen <> - Intervall: Gleichheit von Differenzen + - - Ratio: Gleichheit von Verhältnissen: x - bsp. Geschlecht, Staatsangehörigkeit - bsp. Schulnoten, Bildungsniveau - bsp. IQ, Temperatur in C°, Kalenderjahre - bsp. Temperatur in K, Einkommen, Alter ### Prinzip Indexbildung, sowie Skalierungsverfahren erklären können - Indexbildung: - Index = Messung anhand mehrerer Indikatoren - jeder Indikator entspricht einer Variable, jede Variable Teil einer Dimension - Einzelindikatoren einem Index zusammenfassen, wenn dieser ganze theoretische Konstrukt/KOnnzept repräsentiert - gelegentlich unter inem Index einzige Messgröße verstanden -> Big-Mac-Index - reduziert Ungenauigkeit Messung, trifft wahren Sachverhalt eher - nur sinnvoll, wenn: Einzelvariablenn Konstrukt valide & reliable messen, einzelnen Variablen selben Einheit gemessen & identisch gepolt sind, bei additivem Index wenn Annahme einelne Items unabhängig voneinander wirken - Skalierungsverfahren: - Messverfahren mittels Skala theoretischen Dimensionen Konstrukts erfassen (mehrere Indikatoren) - häufig Indexbildung aus Skalen (Likert-Skalen, in Umfragen "Items") - Skala: modelltheoretischer Index, umfasst alle Indikatoren eines Konstrukts, sowie Vorschrift ihrer Verrechnung, welche durch Skalierungsverfahren erarbeitet wurden - Verwendung häufig Messungen Einstellungen & Motivationen oder Beurteilungen Objekten ### Gütekriterien der Messung benennen und erläutern können - Objektivität: - bezieht sich auf Messung durch Dritte, liegt vor Messergebnisse unabhängig von Person sind, die Messung durchführt - standardisierte Fragen, kein Spielraum für verschiedene Interviewer - Unabhängigkeit zw. Auswertung & Erfassung und Codierung der Daten - ohne Werteurteil zwischen interpretierender Person und Interpretation - Validität: - bezeichnet Ausmaß, indem Instrument misst, was es messen soll - Hauptziel Messung - Reliabilität: - Ausmaß Messinstrument bei wiederholter Messung selben Objekt immer gleichen Messwert liefert, Genauigkeit einer Messung ## Vorlesung 5 ### Was sind Bedingungen um von Kausalität zu sprechen - muss ein Zusammenhang zwischen X und Y bestehen (Korrelation) - X (Ursache) muss Y (Wirkung) zeitlich vorausgehen -> schließt nicht aus, dass Y auf X zurückwirkt - Zusammenahng X und Y nicht durch andere Einflüsse Z (Störfaktoren, Drittvariablen) bedingt sein - Problem der "Scheinkorrelation/Scheinkausalität": Drittvariable Z verursacht X, als auch Y ### Merkmale echten Experiments benennen & erläutern, Stärken Experiments gegenüber bsp. Ex-Post-facto Design - mit Experimenten versucht Untersuchunng a priori so zu gestalten, dass genannte Probleme (fehlende Vergleichsggruppe, Drittvariablen, falsche zeitliche Ordnung) nicht auftreten/ausgeschaltet werden - mind. zwei Vergleichsgruppen (Versuchs- & Kontrollgruppe): Zuweisung Versuchspersonen zu Kategorien der anabhängigen Variablen - kontrollierte Manipulation von X (Stimulus, Treatment), durch Forscher manipuliert & kontrolliert gesetzt -> Herstellung zeitlicher Ordnung - Randomisierung schließt Störfaktoren Z aus: zufällige Aufteilung Versuchspersonen in Versuchs- & Kontrollgruppe - das Verfahren zur Untersuchung von Kausaleffekten - Ex ante: vor der Datenerhebung - Vorteil: keine genaue Kenntniis möglicher Störfaktoren notwendig - Nachteil: nicht immer möglich - wenn Bildung Vergleichsgruppen & Kontrolle Störfaktoren nicht a priori möglich - ex-post-facto Design: Kontrolle Störfaktoren nach Datenerhebung - Regelfall bei Befragungsstudien (Surveys) ### Gütekriterien und Probleme von Experimenten erläutern - Interne Validität: - Annahme, dass beobachteten Unterschiede zwischen Versuchs- & Kontrollgruppe tatsächlich auf X zurückzuführen sind - d.h. wie gut gelingt Isolierung Stimulus, Ergebnis Folge treatments & sonst nichts - Externe Validität: - wie gut lassen sich Ergebnisse verallgemeinern, etwa auf soziale Leben jenseits des Labors - verallgemeinbarkeit auf andere Studienn, andere Gruppen, adere Outcomes - Probleme: - Reaktivität seitens der Versuchspersonen - Wissen, man Studie teilnimmt, Ergebnisse beeinflussen (Hawthorne-Effekt) - gleichzeitig unethisch VP nicht mitzuteilen, dass Teil Experiments sind - Treatment-Status anderer VP beeinflusst eigenen Outcome - bsp. zufällige Zuweisung zu beruflichen Weiterbildungskursen -> Maßnahme verändert Arbeitsmarkt, dass Personen in Kontrollgruppe nach Experiment schlechter gestellt - Problem Reaktivität seitens Versuchsleiter - Kenntnis Hypothese und/oder des Stimulus zu unbewussten Verhaltensänderungen führen (bsp. Krankenpfleger weiß, dass nur Placebo verabreicht -> Pygmalion-Effekt) - Lösung: Blindversuch und Doppelblindversuchh - Praktische und ethische Durchführbarkeit - Untersuchung Heiratseffekte Probanden nicht zufällig verheiratet werden oder nicht - Untersuchung gesundheitlicher Schäden durch Schadstoffbelastung Probanden nicht absichtlich und zufällig kontrolliert hohen Belastung ausgesetzt werden (weder praktisch noch ethisch) ### Probleme der Prüfung von Kausalhypothesen: keine Vergleichsgruppe - keine Vergleichsgruppe, keine Varianz - immer nur eine Ausprägung der Variablen betrachtet - ohne Varianz keine Prüfung von Zusammenhanngshypothesen ### Probleme der Prüfung von Kausalhypothesen: Störgrößen - zur Überprüfung Kausalhypothesen Kontrolle Drittvariablen nötig - bestimmte Kombination UV & AV treten entlang Ausprägungen Drittvariablen gehäuft auf: - bsp. wenig urbanisierten Landkreisen sowohl mehr Störche als auch mehr Geburten - bsp. Selbstselektion: bessere Schüler selektierensich aufgrund (hier Motivation) in Klasse mit neuer Methode - Zusammenhang getrennt Kategorien Z-Variable (Stadt/Land & motiviert/unmotiviert) betrachtet, d.h. wenn Einfluss der Urbanisierung bzw. Motivation konstant hält/kontrolliert, dann gibt es keine Unterschiede in Geburtenraten zw. Regionen vielen & wenigen Störchen bzw. in Matheleistung Schüler nach Unterrichtsmethode - Zusammenhanng (Scheinkorrelation) allein durch ungleiche Verteilung von Stöchen & Geburten zwischen Stadt & Land zustande bzw. durch ungleiche Verteilung von motivierten & unmotivierten Schülern auf neue oder alte Unterrichtsmethode - Störche & Unterrichtsmethodehaben diesen Beispielen keinen ursächlichen Einfluss - Kontrolle Drittvariablen (Störfaktoren) notwendig ## Vorlesung 6 ### Erhebungsdesigns und Datentypen #### Querschnittstudie: - Einmalige Erhebung von Variablenwerten zu einem Zeitpunkt. - Liefert Zustandsinformationen, jedoch keine dynamischen Entwicklungen. - Vorteil: Geringer Aufwand, Nachteil: Schwierig für Kausalanalysen. #### Trendstudie: - Wiederholte Erhebung der gleichen Variablen zu mehreren Zeitpunkten, aber mit unterschiedlichen Stichproben. - Analysiert Veränderungen auf Aggregatebene, z. B. soziale Trends. - Vorteil: Eignet sich für langfristige Entwicklung, Nachteil: Keine Aussagen über individuelle Veränderungen. #### Panelstudie: - Wiederholte Erhebung bei derselben Stichprobe (Panelwellen). - Liefert individuelle Veränderungsdaten und ist ideal für Kausalanalysen. - Nachteile: Hohe Kosten, Zeitaufwand, Panelmortalität und -effekte. #### Ereignisdaten: - Retrospektive oder lückenlose Erfassung von Ereignissen und Zustandswechseln (z. B. Berufsverläufe). - Zusammenhang zwischen Erhebungsdesigns und Datentypen: - Querschnittdaten bieten Zustandsinformationen. - Trenddaten zeigen Aggregatebene-Veränderungen. - Paneldaten ermöglichen individuelle Veränderungsanalysen. - Ereignisdaten erfassen präzise Verlaufsdaten. ### Vor- und Nachteile verschiedener Erhebungsdesigns - Querschnittdesigns: Effizient, aber ungeeignet für dynamische Analysen. - Paneldesigns: Erlauben die Kontrolle von Ausgangsniveaus und besseren Kausalschlüsse, jedoch teuer und mit methodischen Herausforderungen (z. B. Panelmortalität) verbunden. - Trenddesigns: Gut für makrosoziale Trends, jedoch weniger aussagekräftig für individuelle Veränderungen. ### Probleme mit Querschnittsdaten - Kausalanalyse: Keine Vorher-Nachher-Messung, daher Gefahr von Scheinkorrelationen und Selbstselektionseffekten. Multivariate Statistiken können Probleme teilweise lösen. ### Prinzip der Kausalanalyse mit Paneldaten - Vorteile: - Simuliert Vorher-Nachher-Design (ähnlich einem Experiment). - Kontrolliert für Selbstselektion. - Nutzt Methoden wie Difference-in-Difference (DiD), um kausale Effekte zu schätzen. -Vergleich mit Experimenten: Keine Randomisierung, aber Ausgangswerte (Baseline) kompensieren dies teilweise. - Beispiel: Einkommenseffekte von Bildung oder Ehe werden durch Paneldaten realitätsnäher analysiert, da sie Vorher-Werte einbeziehen können. ### APC-Problem (Age-Period-Cohort-Problem) - Definition: Schwierigkeit, Alters-, Perioden- und Kohorteneffekte in Querschnittsdaten zu trennen. - Alterseffekt: Individuelle Veränderungen im Lebenslauf. - Kohorteneffekt: Unterschiede zwischen Generationen. - Periodeneffekt: Historische Ereignisse, die alle Kohorten betreffen. - Beispiel: Materialistische Werte könnten entweder durch Lebensalter oder Kohortenunterschiede bedingt sein, was mit Querschnittsdaten unklar bleibt. - Lösung mit Längsschnittdaten: Trennung von Alters- und Kohorteneffekten ist besser möglich, jedoch nicht vollständig, wenn Periodeneffekte vorliegen. ### Ex-post-facto-Design und Unterschied zu experimentellen Designs #### Ex-post-facto-Design: - Nachträgliche Analyse von Beobachtungsdaten ohne Randomisierung oder kontrollierte Stimulussetzung. - Beispiel: Selbstselektion in Studiengruppen (z. B. Studierende mit höherer Fähigkeit wählen ein Studium). - Gefahr von Scheinkorrelationen durch Störgrößen. - Unterschied zu experimentellen Designs: - Experimente setzen Stimuli kontrolliert, während ex-post-facto-Designs auf existierenden Daten ohne Eingriff beruhen. - Experimente minimisieren Verzerrungen durch Randomisierung, was bei ex-post-facto-Designs durch statistische Verfahren kompensiert werden muss. ## Vorlesung 8 ### Stellenwert der standardisierten Befragung Die standardisierte Befragung ist ein zentraler Bestandteil der quantitativen empirischen Sozialforschung, da sie objektive und zuverlässige Datenerhebungen ermöglicht. Sie wird häufig eingesetzt, um schwer beobachtbare oder vergangene Ereignisse, subjektive Einstellungen sowie Meinungen und Wissen systematisch zu erfassen. Trotz ihrer Vorteile (z. B. Kosteneffizienz) ist methodisches Wissen erforderlich, um valide und reliable Ergebnisse sicherzustellen. #### Formen der Befragung - Kommunikationsmodus: Mündlich (Face-to-Face), telefonisch, schriftlich oder online. - Strukturierungsgrad: - Standardisiert: Einheitliche Fragen und Antwortkategorien. - Teilstandardisiert: Offene und geschlossene Fragen kombiniert. - Nicht standardisiert: Freie Interviews. #### Zentrale Fragetypen - Nach dem Fragegegenstand: - Einstellungs- und Meinungsfragen (z. B. Rating-Skalen). - Überzeugungsfragen (subjektive Einschätzungen von Fakten). - Verhaltensfragen (retrospektiv oder prospektiv). - Eigenschaftsfragen (soziodemografische Merkmale). - Nach den Antwortvorgaben: - Geschlossene, offene und hybride Fragen. - Instrumentelle Fragen wie Filter- oder Aussprechfragen. ### 10 Grundregeln der Frageformulierung 1. Einfachheit: Keine Fremdwörter oder komplexen Formulierungen. 2. Präzision: Zeit- und Kontextbezug beachten. 3. Neutralität: Keine Suggestivfragen oder wertbesetzten Begriffe. 4. Keine falschen Prämissen: Vermeidung von impliziten Annahmen. 5. Eindimensionalität: Eine Frage = ein Thema. 6. Keine doppelten Negationen: Verständlichkeit sichern. 7. Befragte nicht überfordern: Vermeidung komplexer Rechenaufgaben. 8. Keine Hypothetik: Realistische Szenarien verwenden. 9. Antwortvorgaben: Eindeutig, disjunkt und erschöpfend. 10. Balancierte Skalen: Neutralität der Antwortkategorien gewährleisten. ### Fehlerquellen und Gegenmaßnahmen - Soziale Erwünschtheit: Befragte neigen dazu, sozial akzeptierte Antworten zu geben. - Gegenmaßnahmen: Anonymität, Randomized-Response-Techniken. - Response Sets: Systematische Antwortmuster wie Zustimmungstendenz oder Tendenz zur Mitte. - Gegenmaßnahmen: Umpolung von Items, klare Formulierungen. - Kontexteffekte: - Reihenfolge der Fragen beeinflusst Antworten (z. B. Halo- oder Kontrasteffekte). - Gegenmaßnahmen: Fragesplits, kontrollierte Reihenfolge. - Interviewereffekte: Verhalten oder Merkmale des Interviewers beeinflussen die Befragten. - Gegenmaßnahmen: Interviewerschulungen, Standardisierung. - Anwesenheit Dritter: Kann die Offenheit der Antworten beeinträchtigen. - Gegenmaßnahmen: Interviews in privater Umgebung durchführen. ## Vorlesung 9 ### Befragungsmodi: Unterschiede, Vor- und Nachteile #### Persönlich-mündliches Interview: - Vorteile: Geringe Abbruchquote, hohe Ausschöpfungsrate, Kontrolle der Erhebungssituation, Erhebung komplexer Informationen möglich. - Nachteile: Hohe Kosten (ca. 50 € pro Interview), Interviewereffekte, potenzielle Fälschungen. #### Telefonische Befragung: - Vorteile: Günstiger und schneller, einfache Stichprobenziehung, geringe Fälschungsgefahr. - Nachteile: Fehlende visuelle Hilfen, Undercoverage (z. B. keine Telefonnummer), sinkende Ausschöpfungsquote. #### Schriftliche Befragung (Paper & Pencil): - Vorteile