Multivariate Verfahren 3.3 Regressionsanalyse mit Moderatoreffekten PDF

Summary

This document contains detailed information about regression analysis, including moderated regression, topics in statistics covered include background, steps in regression analysis, test statistics and significance testing, implementation, and summarization

Full Transcript

Wintersemester M I.2 Multivariate Verfahren 3.3 Regressionsanalyse mit Moderatoreffekten Thomas Hering 1 Regressionsanalyse mit Moderatoreffekten Themen Moderierte Regres...

Wintersemester M I.2 Multivariate Verfahren 3.3 Regressionsanalyse mit Moderatoreffekten Thomas Hering 1 Regressionsanalyse mit Moderatoreffekten Themen Moderierte Regression Hintergrund Schritte (bei jeder Regressionsanalyse) Teststatistik und Signifikanztestung Durchführung und Beispiel Zusammenfassung 2 2 1 Wintersemester Regressionsanalyse mit Moderatoreffekten Hintergrund (1) Vergleiche zweifaktorielle Varianzanalyse Ziel: Untersuchung des Einflusses einer Drittvariable (MoV) auf den Zusammenhang zwischen uV und aV Beispiel: je wacher die Stimmung von Menschen ist, desto höher ist ihre Lebenszufriedenheit. Dieser Effekt verschwindet, wenn das Merkmal „gute vs. schlechte Stimmung“ im Modell berücksichtigt wird. Wenn die Stimmung gut ist, dann fühlt man sich auch bei Müdigkeit lebenszufrieden Beeinflusst ein Merkmal den Zusammenhang zweier Merkmale, wird dies als Moderatoreffekt bezeichnet. 3 3 Regressionsanalyse mit Moderatoreffekten Hintergrund (2) Formal: Z X Y bei Vorliegen eines Zusammenhangs zwischen X (uV) und Y (aV) wird dieser durch eine Drittvariable verändert. In der Population: 𝑌 𝛽 𝑋 𝛽 𝑍 𝛽 𝑋𝑍 𝛼. In der Stichprobe: 𝑦 𝑏 𝑥 𝑏 𝑧 𝑏 𝑥𝑧 𝑎. 4 4 2 Wintersemester Regressionsanalyse mit Moderatoreffekten Hintergrund (2) Visualisierung des Moderatoreffekts 𝑦 𝑏 ·𝑥 𝑏 ·𝑧 𝑏 ·𝑥 ·𝑧 𝑎. 5 𝐸𝑆 0,37 · 𝑄𝐴𝐵 0,23 · 𝑍𝑇 0,26 · QAB · 𝑍𝑇 1,75 5 Regressionsanalyse mit Moderatoreffekten Schritte bei jeder Regressionsanalyse Inhaltliche Vorüberlegungen dazu, ob kausale und lineare Zusammenhänge zwischen zwei oder mehreren Merkmalen inhaltlich und theoretisch fundiert sind (auch wenn bei Querschnittstudien keine Kausaleffekte ermittelt werden können) 1. Ermitteln der Regressionsfunktion (OLS, s. einfache lineare Regression) 2. Prüfen der Voraussetzungen (s. einfache lineare Regression) 3. Quadratsummen und Varianzzerlegung (s. einfache lineare Regression) 4. Ermittlung der Güte der Regressionsfunktion (s. multiple lineare Regression) 5. Signifikanztestung des Modells und (bei signifikantem Modell) der einzelnen Regressionskoeffizienten 6 6 3 Wintersemester Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (1) Allgemeine Voraussetzungen für die moderierte Regression kausaler Zusammenhang zwischen uV, MoV und aV inhaltlich begründbar Linearität des Zusammenhangs inhaltlich begründbar Voraussetzungen für die lineare Regression mit Schluss auf die Population (s. lineare Regression) 𝐸 𝑒 0 Erwartungswert der Residuen ist 0 COV(xi, e) = 0 keine Korrelation zwischen Residuen und uV VAR(e) = σ², Varianz der Residuen ist konstant über den gesamten Wertebereich von X (Homoskedastizität) COV(ei) = 0, Residuen der uV sind unkorreliert (keine Autokorrelation) uV sind unabhängig (keine Multikollinearität) Residuen ei (𝑦 𝑦) sind normalverteilt 7 7 Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (2) a) Test des Regressionsmodells insgesamt (r²) Wie gut repräsentiert die Regressionsfunktion die Punktwolke? Basis: Vergleich des Nullmodells ohne Prädiktoren und des Regressionsmodells beruht auf ANOVA mit F-verteilter Testgröße signifikant p ≤ α? Dann → Regressionsfunk on korrespondiert nicht mit der Annahme keiner Modellpassung in der Population b) Test der Regressionskoeffizienten (b) gegen 0 t-Test 8 8 4 Wintersemester Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (Modell 1) Signifikanztestung des Modells 1. Formulieren einer inhaltlichen Annahme 2. Formulierung von H0 und HA H0: 𝛽 𝛽 𝛽 0 (möglich wäre auch ein Test gegen andere Werte als 0) H1: 𝛽 0 (für mindestens einen Prädiktor) / 3. Verteilung der Testgröße 𝐹 ⁄ unter der Annahme, H0 ist gültig → F-Verteilung j = Anzahl der uV (Regressoren) = dfZähler, n – j – 1 = dfNenner Festlegen des α-Niveaus (üblich α = 0.05) 4. Schwellenwert unter der Testverteilung, ab der p ≤ α gilt bei dfZähler = j, dfNenner = n – j – 1, signifikant wenn 𝐹 𝐹 9 9 Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (Modell 2) 5. Berechnung der Testgröße 6. p-Wert ermitteln (F-Tabelle oder Statistiksoftware) = Wahrscheinlichkeit für den beobachteten oder einen extremeren Regressionskoeffizienten b, wenn β in der Population = 0 7. Ergebnis der Signifikanztestung ermitteln: H0: Fkrit > Femp, p > α HA: Fkrit ≤ Femp, p ≤ α 10 10 5 Wintersemester Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (Koeffizient 1) Bei signifikantem Modell → Testung einzelner Regressionskoeffizienten Vorgehen bei der Signifikanztestung allgemein 1. Formulieren einer inhaltlichen Annahme 2. Formulierung von H0 und HA H0: 𝛽 0 (für jeden Regressionskoeffizienten) H1:𝛽 0 (ungerichtete Hypothese, für jeden Regressionskoeffizienten) 3. Verteilung der Testgröße 𝑡 unter der Annahme H0 ist gültig → t-Verteilung, 𝑏 = Regressionskoeffizient, 𝜎 = Standardfehler des Regressionskoeffizienten, Festlegen des α-Niveaus (üblich α = 0.05), 4. Schwellenwert unter der Testverteilung, ab der p ≤ α gilt bei df = n – j – 1 (n = Stichprobengröße, j = Anzahl der uV), signifikant wenn 𝑡 𝑡 11 11 Regressionsanalyse mit Moderatoreffekten Teststatistik und Signifikanztestung (Koeffizient 2) 5. Berechnung der Testgröße 6. p-Wert ermitteln (t-Tabelle oder Statistiksoftware) = Wahrscheinlichkeit für den beobachteten oder einen extremeren Regressionskoeffizienten b, wenn β in der Population = 0 7. Ergebnis der Signifikanztestung ermitteln: H0: 𝑡 𝑡 ,p>α HA: 𝑡 𝑡 ,p≤α 12 12 6 Wintersemester Regressionsanalyse mit Moderatoreffekten Durchführung (1) Vorgehen vgl. hierarchische Regression, SPSS (ohne PROCESS): 1. Theoretische Fundierung! 2. Prädiktoren (uV) müssen zentriert werden (Messwert – Mittelwert) 3. Reduziertes Modell (Einschluss) enthält die beiden Prädiktorvariablen (abweichendes Vorgehen in PROCESS oder R) 𝑦 𝑏 𝑥 𝑏 𝑧 𝑎. 4. Aufbauendes Modell (Einschluss) mit Interaktionsterm 𝑦 𝑏 𝑥 𝑏 𝑧 𝑏 𝑥𝑧 𝑎. 5. Modellvergleich (ANOVA) – Interaktion signifikant? 6. (Analyse bedingter Slopes mit Signifikanztest der Moderation) nur SPSS + PROCESS oder R 13 13 Regressionsanalyse mit Moderatoreffekten Durchführung (2) Berechnung mit Bootstrapping (PROCESS, JASP, R): 1. Verteilung wird aus der Stichprobe ermittelt Bootstrapping-Methode ist unabhängig von der Verteilung des Datensatzes Moderatoranalyse, Interaktionsterm ist kein linearer Term 2. mit „Zurücklegen“ werden viele Stichproben aus vorliegender Stichprobe gezogen, jeweils Koeffizienten berechnet und daraus die Verteilung ermittelt Population Stichprobe 1, 5, 5, 8, 11, 11, 4, 12 1 9 8 11 14 15 1 8 11 2 3 5 6 10 13 16 5 13 16 4, 5, 8, 8, 11, 13, 4, 16 4 7 12 2 4 12 1, 1, 1, 4, 13, 13, 5, 16 Zufallsauswahl 1.000, 5.000 oder mehr Ziehungen 14 14 7 Wintersemester Regressionsanalyse mit Moderatoreffekten Durchführung in JASP (1) 2. Zentrieren erfolgte 3. Modell H0 ohne, 4. Modell H1 mit Interaktion, 5. Modellvergleich Ein Modell mit Interaktion „passt“ besser zu den Daten – R²-Change ist signifikant Die Interaktion ist signifikant. Je besser die Stimmung ist, desto mehr ändert sich der Einfluss von wm in Richtung „+“. Wer müde ist, dessen Lebenszufriedenheit reduziert sich weniger, wenn die Stimmung gut ist. 15 15 Regressionsanalyse mit Moderatoreffekten Durchführung in JASP (2) 6. Analyse bedingter Slopes – Visualisierung der Interaktion (R) 16 16 8 Wintersemester Regressionsanalyse mit Moderatoreffekten Durchführung in JASP (3) 6. Analyse signifikanter Moderatoreffekte Johnson-Neyman-Methode: bei welchen Werten der MoV (Z) ist der Effekt uV - > aV signifikant (enthält das Konfidenzintervalll nicht die 0) Bei Werten der zentrierten MoV von < -0.031 ist der bedingte (also der in Verbindung mit der Ausprägung der MoV stehende) Effekt der uV auf die aV signifikant 17 17 Regressionsanalyse mit Moderatoreffekten Darstellung in wissenschaftlichen Arbeiten 18 18 9 Wintersemester Regressionsanalyse mit Moderatoreffekten Zusammenfassung (1) Hintergrund Beeinflusst eine Drittvariable (theoretisch begründet) einen Zusammenhang zwischen zwei Merkmalen? In Regressionsanalysen durch Aufnahme von Interaktionstermen Durchführung: Zentrierung der Prädiktoren Je ein Regressionsmodell ohne und eines mit Interaktionsterm (in SPSS ein Interaktionsterm gebildet werden) Modellvergleich Analyse bedingter Regressionsgeraden und Signifikanz der Moderation 19 19 Regressionsanalyse mit Moderatoreffekten Zusammenfassung (2) Interpretation des Regressionskoeffizienten einer Interaktion Einfluss der Moderatorvariablen auf den Steigungskoeffizient des interagierenden Prädiktors. Bericht in wissenschaftlichen Arbeiten analog hierarchische Regression: …mit der Regressionsgleichung berichten 20 20 10 Wintersemester Regressionsanalyse mit Moderatoreffekten Übung 6 Untersuchen Sie den Einfluss von Gewissenhaftigkeit (gewiss) und Neurotizismus (neuro) auf Prokrastination (prok). Berücksichtigen Sie auch die Interaktion der Prädiktoren (Luhmann, 2015). 1. Zentrieren Sie die Prädiktoren. 2. Führen Sie Regressionsanalysen mit und ohne Interaktion durch. Verbessert die Interaktion die Vorhersagegüte? Denken Sie daran, fehlende Werte zu eliminieren. 3. Interpretieren Sie die Regressionskoeffizienten. 4. Visualisieren Sie die bedingten Regressionsgeraden und ermitteln Sie, ob die Moderation signifikant ist. 5. Finden Sie eine angemessene tabellarische Darstellungsform der Ergebnisse für wissenschaftliche Arbeiten. 21 21 11

Use Quizgecko on...
Browser
Browser