Multivariate Statistik und Datenanalyse 2024/25
56 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Welches der folgenden Beispiele beschreibt eine Level-1 Einheit?

  • Schule
  • Schüler*innen (correct)
  • Arbeitnehmer*innen
  • Therapeut*innen

Hierarchische Daten haben immer die gleiche Anzahl von Level-1 Einheiten innerhalb der Level-2 Einheiten.

False (B)

Nennen Sie ein Beispiel für eine Level-2 Einheit aus dem Bereich der medizinischen Patientenversorgung.

Therapeut*innen

Eine Klasse von Schüler*innen ist ein Beispiel für eine _____-2 Einheit.

<p>Level</p> Signup and view all the answers

Ordnen Sie die Beispiele den richtigen Hierarchieebenen zu:

<p>Schüler<em>innen = Level-1 Patient</em>innen = Level-1 Schulen = Level-2 Therapeut*innen = Level-2</p> Signup and view all the answers

Was ist eine Voraussetzung des ALM bezüglich der Residuen?

<p>Sie sollten normalverteilt sein. (A)</p> Signup and view all the answers

Verletzungen der Normalverteilung der Residuen haben keinen Einfluss auf die Güte der Schätzungen von b.

<p>True (A)</p> Signup and view all the answers

Was könnte bei großen Stichproben bezüglich der Residuen als unproblematisch angesehen werden?

<p>Die Verletzung der Normalverteilung.</p> Signup and view all the answers

Die __________ der Residuen ist eine Voraussetzung des ALM, besonders bei Längsschnittdaten.

<p>Unabhängigkeit</p> Signup and view all the answers

Was ist ein möglicher Einfluss bei Verletzungen der Normalverteilung der Residuen?

<p>Performanz der Signifikanztests (B)</p> Signup and view all the answers

Nennen Sie eine Bedingung, die die Unabhängigkeit der Residuen betrifft.

<p>Daten aus größeren Gruppen.</p> Signup and view all the answers

Ordnen Sie die ALM-Voraussetzungen den entsprechenden Beschreibungen zu:

<p>Normalverteilung der Residuen = Beeinflusst die Güte der Schätzungen Unabhängigkeit der Residuen = Beeinflusst die Validität bei Längsschnittdaten Stichprobengröße = Kann Verletzungen unproblematisch machen Signifikanztests = Haben Performanceprobleme bei Verletzung der Normalverteilung</p> Signup and view all the answers

Die Unabhängigkeit der Residuen ist nicht wichtig für die Ergebnisse von Längsschnittdaten.

<p>False (B)</p> Signup and view all the answers

Was stellt das Symbol $x$ in vielen mathematischen Ausdrücken dar?

<p>Eine Variable (D)</p> Signup and view all the answers

Das Symbol $!$ steht immer für die Fakultät einer Zahl.

<p>True (A)</p> Signup and view all the answers

Was bedeutet das Zeichen $+$ in mathematischen Ausdrücken?

<p>Addition</p> Signup and view all the answers

$b$ ist eine ______ in der mathematischen Notation.

<p>Variable</p> Signup and view all the answers

Ordne die folgenden mathematischen Symbole wie folgt zu:

<p>% = Prozent ⋅ = Multiplikation $ = Mathematische Ausdrücke</p> <ul> <li>= Addition</li> </ul> Signup and view all the answers

Was könnte das Symbol '.' in einem mathematischen Ausdruck bedeuten?

<p>Multiplikation (C)</p> Signup and view all the answers

Das Zeichen % steht in der Mathematik immer für einen Anteil.

<p>True (A)</p> Signup and view all the answers

Was bedeutet die Verwendung von $e$ in der Mathematik?

<p>Die Eulersche Zahl</p> Signup and view all the answers

In mathematischen Ausdrücken wird $𝑏$ oft durch eine ______ ersetzt.

<p>Zahl</p> Signup and view all the answers

Was bedeutet das Zeichen % in einem Ausdruck?

<p>Ein Prozentsatz (D)</p> Signup and view all the answers

Die Symbole in mathematischen Ausdrücken sind immer eindeutig definiert.

<p>False (B)</p> Signup and view all the answers

Was beschreibt die Homoskedastizität in Bezug auf Signifikanztests?

<p>Ein gleichmäßiges Verteilungsmuster der Fehler (A)</p> Signup and view all the answers

Linear Mixed Models (LMMs) werden nicht verwendet, um hierarchische Daten zu analysieren.

<p>False (B)</p> Signup and view all the answers

Was ist ein Beispiel für einen Einfluss von mathematischer Leistung auf Intelligenz?

<p>Positiver Zusammenhang zwischen IQ und Matheleistung.</p> Signup and view all the answers

Multilevel-Modelle sind auch bekannt als _____________ Modelle.

<p>Hierarchische lineare</p> Signup and view all the answers

Ordne die Begriffe den richtigen Definitionen zu:

<p>Multilevel-Modelle = LMMs zur Analyse hierarchischer Daten Homoskedastizität = Konstanz der Fehler-Varianz Hierarchische lineare Modelle = Gleiche wie Multilevel-Modelle Random-Coefficients Modelle = LMMs mit zufälligen Effekten</p> Signup and view all the answers

Welches Beispiel zeigt einen negativen Zusammenhang?

<p>IQ verringert sich, Matheleistung erhöht sich (B)</p> Signup and view all the answers

Hierarchische Daten haben keinen Einfluss auf die Ergebnisse von Signifikanztests.

<p>False (B)</p> Signup and view all the answers

Was ist ein Hauptproblem bei der Analyse hierarchischer Daten?

<p>Die Abhängigkeit der Daten innerhalb der Gruppen.</p> Signup and view all the answers

Ein negativer Zusammenhang zwischen IQ und Matheleistung bedeutet, dass ____________.

<p>höhere IQ-Werte mit niedrigeren Matheleistungen korrelieren</p> Signup and view all the answers

Welche der folgenden Aussagen über mathematische Leistung ist wahr?

<p>Mathematische Leistung kann positiv mit dem IQ korrelieren. (A)</p> Signup and view all the answers

Was beschreibt das Simpson-Paradox?

<p>Aggregierte Daten führen zu verzerrten Sichtweisen auf Zusammenhänge. (B)</p> Signup and view all the answers

Ökologische Fehlschlüsse treten nicht auf, wenn Zusammenhänge auf mehreren Ebenen betrachtet werden.

<p>False (B)</p> Signup and view all the answers

Was bedeutet 'Abhängigkeit' im Kontext hierarchischer Daten?

<p>Daten sind korreliert und beeinflussen sich gegenseitig.</p> Signup and view all the answers

Das Risiko falscher Schlüsse bei der Analyse von Ergebnissen eines ALMs ist vor allem wegen _____ der Daten präsent.

<p>Abhängigkeit</p> Signup and view all the answers

Ordne die folgenden Begriffe den richtigen Definitionen zu:

<p>Kriterium = Die zu messende Leistung oder Eigenschaft Prädiktor = Ein Faktor, der das Kriterium beeinflusst Ökologischer Fehlschluss = Falsche Schlussfolgerung aufgrund aggregierter Daten ALM = Allgemeines lineares Modell für Datenanalyse</p> Signup and view all the answers

Welcher dieser Punkte beschreibt eine Herausforderung bei hierarchischen Daten?

<p>Falsche Standardfehler durch Überschätzung der Stichprobengröße. (B)</p> Signup and view all the answers

Ein linear mixtes Modell kann für die Analyse hierarchischer Daten verwendet werden.

<p>True (A)</p> Signup and view all the answers

Nenne eine der Ebenen, auf denen Zusammenhänge betrachtet werden können.

<p>Innerhalb von Schulen oder zwischen Schulen.</p> Signup and view all the answers

Was ist ein zentraler Nachteil bei der Ignoranz der hierarchischen Datenstruktur?

<p>Ökologische und statistische Fehlschlüsse (D)</p> Signup and view all the answers

Das Aggregieren von Daten führt immer zu genauen Ergebnissen.

<p>False (B)</p> Signup and view all the answers

Was beschreibt die Korrelation zwischen IQ und Mathematikleistung?

<p>Ein positiver Zusammenhang.</p> Signup and view all the answers

Der Zusammenhang zwischen IQ und der Mathematikleistung wird in der Regel durch ________ dargestellt.

<p>regression</p> Signup and view all the answers

Ordnen Sie die Schritte zur Durchführung einer Zwei-Schritt-Regression zu:

<p>Schritt 1 = Berechnung eines ALM innerhalb jeder Level-2-Einheit Schritt 2 = Zusammenfassung der Ergebnisse mit deskriptiver Statistik</p> Signup and view all the answers

Welches Modell ist am besten geeignet für die Modellierung hierarchischer Daten?

<p>Multilevel-Modell (B)</p> Signup and view all the answers

Ein Zwei-Schritt-Regressionsvorgehen eliminiert immer ökologische Fehlschlüsse.

<p>False (B)</p> Signup and view all the answers

Was sind häufige Probleme bei der Aggregation von hierarchischen Daten?

<p>Ökologische Fehlschlüsse.</p> Signup and view all the answers

Die Häufigkeit eines α-Fehlers hängt von der Stichprobengröße (N) und der ________ zwischen den Datenpunkten ab.

<p>Korrelation</p> Signup and view all the answers

Was wurde als problematischer Ansatz bei der Modellierung hierarchischer Daten erwähnt?

<p>Ignoranz der hierarchischen Datenstruktur (D)</p> Signup and view all the answers

Multilevel-Modelle sind nicht geeignet für die Analyse von hierarchischen Daten.

<p>False (B)</p> Signup and view all the answers

Nennen Sie einen Vorteil der Verwendung von Multilevel-Modellen.

<p>Berücksichtigung der Datenhierarchie.</p> Signup and view all the answers

Die Berechnungen des ALM variieren je nach ________ der Schülerin oder des Schülers.

<p>Schule</p> Signup and view all the answers

Ordnen Sie die Schulen den entsprechenden IQ-Werten zu:

<p>Schule A = IQ kann zwischen 1-10 variieren Schule B = IQ kann zwischen 4-8 variieren Schule C = IQ kann zwischen 1-3 variieren</p> Signup and view all the answers

Flashcards

Normalverteilung der Residuen

Die Annahme, dass die Residuen einer Regression normalverteilt sind. Diese Annahme ist wichtig für die Signifikanztests, aber weniger kritisch für die Schätzung der Regressionskoeffizienten.

Unabhängigkeit der Residuen

Die Annahme, dass die Residuen einer Regression unabhängig voneinander sind. Diese Annahme ist wichtig, um die Genauigkeit der Standardfehler und Signifikanztests zu gewährleisten.

Verletzung der Normalverteilung

Die Verletzung der Annahme der Normalverteilung der Residuen hat keinen großen Einfluss auf die Schätzung der Regressionskoeffizienten, aber kann die Genauigkeit der Signifikanztests beeinflussen.

Verletzung der Unabhängigkeit

Die Verletzung der Annahme der Unabhängigkeit der Residuen kann die Schätzung der Standardfehler und die Signifikanztests stark beeinflussen.

Signup and view all the flashcards

Große Stichproben

Bei großen Stichproben ist die Verletzung der Normalverteilung der Residuen in der Regel unproblematisch.

Signup and view all the flashcards

Längsschnittdaten

Längsschnittdaten, Daten aus größeren Gruppen usw. können die Unabhängigkeit der Residuen beeinflussen.

Signup and view all the flashcards

String

Eine Abfolge von Zeichen, die als einzelne Einheit behandelt werden. In Programmiersprachen können Strings verwendet werden, um Text, Namen oder andere Daten darzustellen.

Signup and view all the flashcards

Variable

Ein Symbol oder eine Zeichenfolge, die eine bestimmte Idee, Variable oder ein Konzept darstellt.

Signup and view all the flashcards

Operator

Ein Befehl oder eine Anweisung, die in einer Programmiersprache ausgeführt wird, um eine bestimmte Aktion durchzuführen.

Signup and view all the flashcards

Boolescher Ausdruck

Ein Ausdruck, der ausgewertet wird, um einen Wahrheitswert (wahr oder falsch) zu erzeugen.

Signup and view all the flashcards

Bedingte Anweisung

Ein Programmblock, der nur ausgeführt wird, wenn eine bestimmte Bedingung erfüllt ist.

Signup and view all the flashcards

Schleife

Ein Programmblock, der wiederholt ausgeführt wird, solange eine bestimmte Bedingung erfüllt ist.

Signup and view all the flashcards

Funktion

Ein Programmblock, der eine bestimmte Aufgabe ausführt und dann zurückkehrt, um an der Stelle im Code fortzufahren, an der er aufgerufen wurde.

Signup and view all the flashcards

Variable

Ein Wert, der während der Programmlaufzeit innerhalb eines Programms geändert werden kann.

Signup and view all the flashcards

Array

Eine Sammlung von Werten des gleichen Datentyps, die über einen Index zugreifbar sind.

Signup and view all the flashcards

Konvertierung

Eine Operation zur Umwandlung von Daten in eine andere Form oder einen anderen Datentyp.

Signup and view all the flashcards

Hierarchische Daten: Definition

In hierarchischen Daten ist jede Einheit der niedrigeren Ebene (Level-1) eindeutig einer Einheit der höheren Ebene (Level-2) zugeordnet. Beispielsweise gehört jede Schülerin zu genau einer Schulklasse.

Signup and view all the flashcards

Variierende Anzahl an Level-1 Einheiten

Die Anzahl der Einheiten der niedrigeren Ebene (Level-1) in einer Einheit der höheren Ebene (Level-2) kann variieren. Beispielsweise können Schulklassen unterschiedlich viele Schüler/innen haben.

Signup and view all the flashcards

Herausforderung 1: Abhängigkeit

Die Interdependenz zwischen Level-1 Einheiten innerhalb einer Level-2 Einheit stellt eine Herausforderung dar. Die Daten sind nicht unabhängig voneinander. Beispielsweise können Schüler/innen in der gleichen Klasse ähnliche Leistungen erbringen.

Signup and view all the flashcards

Herausforderung 2: Unterschiedlichkeit

Die Unterschiedlichkeit zwischen Level-2 Einheiten stellt eine weitere Herausforderung dar. Die Daten von Schüler/innen aus verschiedenen Klassen sind nicht direkt vergleichbar. Beispielsweise können verschiedene Klassen unterschiedliche Lehrkräfte haben.

Signup and view all the flashcards

Verzerrung durch hierarchische Daten

Bei hierarchischen Daten kann es zu verzerrten Ergebnissen kommen, wenn die Abhängigkeit und Unterschiedlichkeit nicht berücksichtigt werden. Beispielsweise könnte man zufällige Unterschiede zwischen Klassen fälschlicherweise als echten Effekt interpretieren.

Signup and view all the flashcards

Hierarchische Daten

Daten, bei denen Beobachtungen auf mehreren Hierarchieebenen eingeordnet sind, z. B. Schüler*innen in Klassen, Klassen in Schulen.

Signup and view all the flashcards

Multilevel-Modelle

Die Analyse von Daten, die auf mehreren Hierarchieebenen eingeordnet sind, um Effekte auf verschiedenen Ebenen zu modellieren.

Signup and view all the flashcards

Linear gemischte Modelle (LMM)

Ein Verfahren zur Analyse hierarchischer Daten, das unterschiedliche Effekte auf verschiedenen Ebenen modellieren kann, z. B. den Einfluss von Klassen auf Schülerleistungen.

Signup and view all the flashcards

Homoskedastizität

Ein Konzept bei hierarchischen Daten, das beschreibt, dass die Varianzen auf den verschiedenen Ebenen miteinander in Beziehung stehen können.

Signup and view all the flashcards

Heteroskedastizität

Ein Begriff, der beschreibt, dass die Beziehungen zwischen Variablen zwischen den Ebenen unterschiedlich sein können.

Signup and view all the flashcards

Abhängigkeit

Ein wichtiger Faktor bei hierarchischen Daten. Wenn Datenpunkte innerhalb einer Gruppe ähnlicher sind als zwischen verschiedenen Gruppen, ist dies gegeben.

Signup and view all the flashcards

Gruppen- oder Schulleffekte

Effekte, die auf einer höheren Hierarchieebene wirken, z. B. der Einfluss einer Schule auf die Leistungen der Schüler*innen.

Signup and view all the flashcards

Individuelle Effekte

Effekte, die auf einer niedrigeren Hierarchieebene wirken, z. B. der Einfluss eines individuellen Schülers auf die Leistungen im Unterricht.

Signup and view all the flashcards

Zwei-Schritt-ALM (Aggregierte Lineare Modellierung)

Ein Verfahren zur Analyse hierarchischen Daten, bei dem man zuerst die Daten auf der unteren Ebene analysiert und dann die Ergebnisse auf die höhere Ebene überträgt.

Signup and view all the flashcards

verletzt

Die Güte der Signifikanztests kann durch diese Faktoren beeinträchtigt werden.

Signup and view all the flashcards

Ökologischer Fehlschluss

Die Beobachtung eines Zusammenhangs zwischen zwei Variablen (z.B. Intelligenz und Mathematikleistung) auf einer Ebene (z.B. innerhalb einer Schule), der sich auf einer anderen Ebene (z.B. zwischen Schulen) anders darstellt.

Signup and view all the flashcards

Simpson-Paradox

Ein Zusammenhang zwischen zwei Variablen, der sich auf einer aggregierten Ebene (z.B. Gesamtzahl der Schüler) anders darstellt als auf der Ebene der einzelnen Beobachtungen (z.B. einzelne Schüler).

Signup and view all the flashcards

Abhängigkeit in hierarchischen Daten

Die Annahme, dass die Messwerte innerhalb einer Gruppe (z.B. Klasse) korreliert sind. Dies kann passieren, weil alle Mitglieder der Gruppe ähnlichen Einflüssen ausgesetzt sind (z.B. gleiche Lehrkraft).

Signup and view all the flashcards

Linear Mixed Model (LMM)

Ein Modell, das die Beziehung zwischen Prädiktoren und Kriterien in hierarchischen Daten untersucht. Es berücksichtigt die Abhängigkeit zwischen Datenpunkten und erlaubt es, die Effekte verschiedener Ebenen zu schätzen.

Signup and view all the flashcards

Falsche Standardfehler bei LMMs

Die Standardfehler bei der Verwendung von LMMs werden aufgrund der Abhängigkeit in hierarchischen Daten überschätzt. Dadurch werden die Signifikanztests ungenau.

Signup and view all the flashcards

Interpretation von LMM-Ergebnissen

Die Interpretation von Ergebnissen aus LMMs ist komplexer als bei einfachen Regressionsmodellen. Man muss die Effekte auf verschiedenen Ebenen berücksichtigen.

Signup and view all the flashcards

Ignoranz der hierarchischen Datenstruktur

Die Ignoranz der hierarchischen Struktur von Daten kann zu ungenauen Ergebnissen führen.

Signup and view all the flashcards

Aggregation hierarchischer Daten

Die Aggregation von Daten auf der höheren Ebene kann zu ökologischen Fehlschlüssen führen.

Signup and view all the flashcards

Zwei-Schritt-Regressionsvorgehen

Ein Ansatz, der die Daten auf jeder Ebene separat analysiert und die Ergebnisse dann kombiniert.

Signup and view all the flashcards

Varianz zwischen Gruppen

Die Varianz, die durch die Gruppierung von Datenpunkten auf der höheren Ebene entsteht, z.B. die Varianz der Mathematikleistung zwischen verschiedenen Schulen.

Signup and view all the flashcards

Varianz innerhalb von Gruppen

Die Varianz, die durch individualistische Unterschiede innerhalb jeder Gruppe entsteht, z.B. die Varianz der Mathematikleistung zwischen Schüler*innen innerhalb einer Schule.

Signup and view all the flashcards

Intra-Klassen Korrelation (ICC)

Eine statistische Kenngröße, die die Varianz auf der höheren Ebene erklärt.

Signup and view all the flashcards

Fest-Effekt-Modell

Ein gemischter Effekt-Modell, bei dem ein Teil der Varianz durch festen Faktoren erklärt wird.

Signup and view all the flashcards

Zufalls-Effekt-Modell

Ein gemischter Effekt-Modell, bei dem ein Teil der Varianz durch zufällige Faktoren erklärt wird.

Signup and view all the flashcards

Gemischtes Effekt-Modell

Ein gemischter Effekt-Modell, bei dem die Varianz sowohl durch feste als auch durch zufällige Faktoren erklärt wird.

Signup and view all the flashcards

Zentrierung

Eine Methode, bei der die zufällige Varianz zwischen den Gruppen reduziert wird, indem man die Daten auf die gleiche Weise zentriert.

Signup and view all the flashcards

Zentrierung und Skalierung

Eine Methode, die die Korrelation zwischen den Prädiktoren auf der niedrigen und der hohen Ebene reduziert.

Signup and view all the flashcards

Interpretation von Multilevel-Modellen

Die Interpretation der Koeffizienten eines Multilevel-Modells unterscheidet sich von der Interpretation der Koeffizienten eines traditionellen linearen Modells.

Signup and view all the flashcards

Study Notes

Vorlesung: Multivariate Statistik und Datenanalyse

  • Thema: Multivariate Statistik und Datenanalyse, Wintersemester 2024/25, gehalten von Florian Scharf, 19. November 2024
  • Kurs: LMM I: Grundidee, hierarchische Daten, Multilevel-Modelle

Themen der Vorlesung

  • Allgemeines Lineares Modell I: Modell, Interpretation und Inferenz (22.10.)
  • Allgemeines Lineares Modell II: Kategoriale Prädiktoren und Interaktionen (29.10.)
  • Logistische Regression I: Modell, Interpretation der Modellparameter (05.11.)
  • Logistische Regression II: Schätzung, Modellgüte und statistische Inferenz (12.11.)
  • LMM I: Grundidee, Modelltypen: (19.11.)
  • LMM II: Modellschätzung, Interpretation: (26.11.)
  • LMM III: Modellierung wiederholter Messungen: (03.12.)
  • CFA I: Grundmodell und Modellmatrix: (10.12.)
  • CFA II: Schätzung und Modellgültigkeit: (17.12.)
  • SEM I: Grundidee, Schätzung und Parameterinterpretation: (14.01.)
  • SEM II: Flexibilität von SEMs, Pfadanalyse und Probleme von SEMs: (21.01.)
  • Längsschnittlich SEMs I: Latente Wachstumskurvenmodelle: (28.01.)
  • Längsschnittliche SEMs II: Messinvarianz und weitere Modelle (04.02.)
  • Statistik und Kausalität: (11.02.)

Rückblick (Allgemeines Lineares Modell - ALM)

  • Frage: Einfluss eines oder mehrerer Prädiktoren auf ein metrisches Kriterium.
  • Grundgleichung: Yn = bo + b₁X1n + b2X2n + ... + bp*Xpn + en
  • Interpretation der ALM-Parameter: Welche Bedeutung haben die Parameter b?
  • Interpretation der ALM-Parameter bei Zentrierung: Wie ändert sich die Interpretation der Parameter durch Zentrierung bezüglich der Variablen?
  • Voraussetzungen des ALM:
    • Normalverteilung der Residuen: Verletzungen haben keinen Einfluss auf die Schätzungen von b, aber auf die Performanz der Signifikanztests bei grossen Stichproben.
    • Unabhängigkeit der Residuen: Bei Längsschnittdaten oder Daten aus grösseren Gruppen kann die Unabhängigkeit verletzt sein. Dies hat einen starken Einfluss auf die Güte der Signifikanztests.
    • Homoskedastizität: Starker Einfluss auf die Güte der Signifikanztests.

Überblick (Hierarchische Daten, Multilevel-Modelle)

  • Was sind "hierarchische Daten"? Daten mit mehreren Ebenen (z.B. Schüler innerhalb von Schulen).
  • Problem bei der Analyse hierarchischer Daten: Risikofalscher Schlüsse.
  • Analyse hierarchischer Daten durch Zwei-Schritt-ALM: Berechne ein ALM innerhalb jeder Level-2 Einheit, fasse Ergebnisse zusammen.
  • Was ist ein Multilevel-Modell? und wie interpretiert man seine Parameter?

Linear Gemischte Modelle (LMMs)

  • Definition: Zur Analyse von hierarchischen Daten, verschiedene Namen für LMMs: Multilevel-Modelle (MLM), Hierarchische lineare Modelle (HLM) und Random-Coefficients Modelle.
  • Hierarchische Daten: Beispiele: Schüler in Schulen, Arbeitnehmer in Betrieben, Patient*innen in Behandlungen, Messzeitpunkte innerhalb von Personen, persönliche Ziele.

Herausforderungen hierarchischer Daten

  • Risiko falscher Schlüsse: Zusammenhänge auf verschiedenen Ebenen betrachtet. Dadurch können ökologische Fehlschlüsse auftreten. Verfälschte Zusammenhänge durch Aggregation (Simpson-Paradoxon).
  • Risiko falscher Schlüsse bei der inferenzstatistischen Testung der Ergebnisse eines ALMs: Hierarchische Daten sind in der Regel abhängig. Falsche Standardfehler durch die Überschätzung der Stichprobengrösse können auftreten.

Modellierung hierarchischer Daten

  • Problematische Ansätze: Ignoranz der hierarchischen Datenstruktur (z.B. Aggregation) führt zu ökologischen und statistischen Fehlschlüssen. Zwei-Schritt-Regressionsvorgehen (Berechnung eines ALMs pro Level-2-Einheit und Zusammenfassung der Ergebnisse).

  • Zwei-Schritt-Regressionsvorgehen: Zwei Schritte: (1) Berechne ein ALM innerhalb jeder Level-2-Einheit. (2) Fasse die Ergebnisse aus Schritt 1 zusammen, z.B. mit deskriptiver Statistik.

  • Beispiele und Interpretationen der Ergebnisse der Zwei-Schritt Analyse in der Vorlesung anhand von Beispielen.

  • Multilevel-Modelle - Zusammenfassung der Grundlagen zur Analyse hierarchischer Daten und die Idee des Ein-Schritt-Verfahrens

  • Interpretation der Zufallseffekte - welche Bereiche im Modell repräsentieren Zufallsvariationen, die durch die einzelnen Variablen erklärt sind.

  • Interpretation der Parameter - Interpretation der festen und zufälligen Effekte, inklusive der Kovarianz.

Zusammenfassung und Ausblick (Hierarchische Daten, Multilevel-Modelle)

  • Hierarchische Daten: Definition und Beispiele für hierarchische Daten.

  • Ignorieren des hierarchischen Problems: Mögliche Fehler: ökologische Fehlschlüsse, falsche inferenzstatistische Entscheidungen.

  • Zwei-Schritt-Regressionsvorgehen: Erläuterung des Verfahrens.

  • Multilevel-Modell: Idee eines Ein-Schritt-Multilevel-Modells zur Schätzung von Parametern, und Interpretation der Ergebnisse.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Description

Dieses Quiz behandelt die Themen der Multivariaten Statistik und Datenanalyse, die im Wintersemester 2024/25 behandelt werden. Es umfasst Inhalte wie allgemeine lineare Modelle, logistische Regression und multilevel Modelle. Testen Sie Ihr Wissen über verschiedene statistische Techniken und deren Anwendungen in der Datenanalyse.

More Like This

Master Multivariate Statistics
5 questions
Overview of Multivariate Analysis
7 questions
Multivariate Statistik und Datenanalyse
12 questions
Use Quizgecko on...
Browser
Browser