SEM 1: Multivariate Statistik und Datenanalyse PDF

Summary

These lecture notes cover Multivariate Statistik und Datenanalyse, focusing on SEM (Structural Equation Modeling). The material, presented by Florian Scharf on January 14, 2025, includes topics on general linear models, logistic regression, and other related statistical concepts. The document provides information and discussions on the topics including examples and equations.

Full Transcript

Multivariate Statistik und Datenanalyse Wintersemester 2024/25 Florian Scharf 14. Januar 2025 SEM I: Grundidee, Schätzung und Parameterinterpretation Themen der Vorlesung 1 22.10. Allgemeines Lineares Modell I: Modell, Interpretation & Inferenz 2...

Multivariate Statistik und Datenanalyse Wintersemester 2024/25 Florian Scharf 14. Januar 2025 SEM I: Grundidee, Schätzung und Parameterinterpretation Themen der Vorlesung 1 22.10. Allgemeines Lineares Modell I: Modell, Interpretation & Inferenz 2 29.10. Allgemeines Lineares Modell II: Kategoriale Prädiktoren & Interaktionen 3 05.11. Logistische Regression I: Modell, Interpretation der Modellparameter 4 12.11. Logistische Regression II: Schätzung, Modellgüte und stat. Inferenz 5 19.11. LMM I: Grundidee, Modelltypen 6 26.11. LMM II: Modellschätzung, Interpretation 7 03.12. LMM III: Modellierung wiederholter Messungen 8 10.12. CFA I: Grundmodell und Modellmatrix 9 17.12. CFA II: Schätzung und Modellgültigkeit 10 14.01. SEM I: Grundidee, Schätzung und Parameterinterpretation 11 21.01. SEM II: Flexibilität von SEMs, Pfadanalyse und Probleme von SEMs 12 28.01. Längsschnittliche SEMs I: Latente Wachstumskurvenmodelle 13 04.02. Längsschnittliche SEMs II: Messinvarianz und weitere Modelle 14 11.02. Statistik und Kausalität 504 Faktorenanalyse zwei weitere Formulierungen des Grundmodells: 1. für eine Variable p (in Vektorenschreibweise): Yp = μp ∙ 1N + λp1 ∙ η1 + λp2 ∙ η2 + … + λpQ ∙ ηQ + εp 2. Formulierung in Matrixschreibweise: Y= μ +Λ∙ η + ε dabei ist Λ die Faktorladungsmatrix Rückblick 505 Modell-implizierte Kovarianzmatrix auf Basis des Modells erwartete Varianzen und Kovarianzen der manifesten Variablen: Σ = Λ ∙ Φ ∙ ΛT + Ψ - dabei ist: § Λ : Faktorladungsmatrix § Φ: Varianz-Kovarianz-Matrix der latenten Faktoren § Ψ: Matrix der Fehlervarianzen (und Kovarianzen) - Modellschätzung erfolgt so, dass ∑ und S möglichst „ähnlich“ sind - Modellbewertung: - Likelihood-Ratio-Test - relative fit-Indizes: vergleiche Passung mit einem Referenzmodell - absolut fit-Indizes: bewerte Ähnlichkeit zwischen ∑ und S Rückblick 506 Überblick Was sind SEMs? – Was modelliert man? – Grundbegriffe – Warum rechnet man SEMs? Wie schätzt man ein SEM? Wie interpretiert man die Parameter eines SEMs? SEM I: 507 Grundidee Modellschätzung Interpretation der Parameter Beispiel Zusammenhang zwischen Offenheit und Vorurteilsneigung Offenheit Vorurteilsneigung Person Y1 Y2 Y3 Y4 Y5 Y6 1 3 4 3 5 4 4 2 1 2 2 3 3 3.. 500 4 3 4 1 2 2 Item-Beispiele: Y1: „Ich bin fantasievoll.“ Y4: „Ausländer sollten sich nicht in Deutschland aufhalten.“ SEM I: 508 Grundidee Modellschätzung Interpretation der Parameter Grundidee 2-faktorielle CFA unter Annahme miteinander kovariierender latenter Variablen ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV SEM I: 509 Grundidee Modellschätzung Interpretation der Parameter Grundidee Strukturgleichungsmodell = zwischen latenten Faktoren werden „Regressionsmodelle“ definiert ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO 𝜁v Achtung: der Pfadkoeffizient von X zu Y wird mit bYX notiert! SEM I: 510 Grundidee Modellschätzung Interpretation der Parameter Grundidee Strukturgleichungsmodell = zwischen latenten Faktoren werden „Regressionsmodelle“ definiert ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO 𝜁v ωV = Konstante + bVO · ωO + εv AAAEUniclVJNb9NAEB03AdpQaFqO5WARgRBEkW2pAQ5IFd8SQi2IpBVxFNnOxqzirC17E5pavvILufAf+AWIA2+3DqgpEbDRZmbfzLx5nl0/iXgmLeursVapXrp8ZX2jdnXz2vWt+vZON4unacA6QRzF6bHvZSzignUklxE7TlLmTfyIHfnjpyp+NGNpxmPxXs4T1p94oeAjHngS0KD+2fVZyEXuRTwU94qay6Q36Jp3HpuvY5FJT0hm3jddyU6kbtZ79/JJP7cfOU2r6VhF7g/y7kFRmG4wjKWpqw/+UOA4zb12095zitw9VUkz1UoMF30H9YbVsvQyLzp26TSoXIfxtvGBXBpSTAFNaUKMBEn4EXmU4dcjmyxKgPUpB5bC4zrOqKAaaqfIYsjwgI7xH+LUK1GBs+LMdHWALhF2ikqTbmO/0Iw+slVXBj+D/YF9qrFwZYdcMyuFc1gfjBua8Q1wSR+R8bfKSZm50PIvlQnic0TUBLL/qFTzkDSih3oOHF+WaERNKPjF8wyRFNhYR0x6rjNDcPj6PMPsBGwH2tX9LBhMPashrKct0yyiZPTAl8Kqe1N6VmsMwKv0ZVD6ezqr84dQxIFmS/d8cu6mVf2ZHkafdGSi2ZXSHLGRruXIn2vtI/1lEboXOq7ULOM1vHN7+VVfdLpOy2632m+dxn67fPHrtEu36C5e9QPap1d0iGkG9M3YMXaNm5Uvle9Vo1o5S10zypobdG5VN38CALTuhQ== SEM I: 511 Grundidee Modellschätzung Interpretation der Parameter Grundidee Strukturgleichungsmodell = zwischen latenten Faktoren werden „Regressionsmodelle“ definiert ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO SEM I: 512 Grundidee Modellschätzung Interpretation der Parameter Strukturgleichungsmodelle Strukturgleichungsmodell (SEM): ein multivariates Verfahren, mit dem man theoretisch hergeleitete Kausalzusammenhänge zwischen latenten (und/oder manifesten) Variablen prüfen kann SEM-Terminologie: - endogene vs. exogene Variablen o endogen = Variable „empfängt“ Pfeile, exogen = aus der Variable gehen nur Pfeile aus (d.h. sie sind “Varianzquellen“) - rekursive vs. nicht-rekursive SEMs; Achtung: wir beschäftigen uns nur mit rekursiven SEMs - die zwei Komponenten des SEMs: das Messmodell und das Strukturmodell SEM I: 513 Grundidee Modellschätzung Interpretation der Parameter Beispiel Endogene Variablen werden im SEM „erklärt“; exogene Variablen werden nicht erklärt ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO exogene endogene Variable Variable SEM I: 514 Grundidee Modellschätzung Interpretation der Parameter Beispiel Rekursive SEMs: der kausale Fluss geht nur in eine Richtung ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO SEM I: 515 Grundidee Modellschätzung Interpretation der Parameter Beispiel Nicht-Rekursive SEMs: der kausale Fluss kann in beide Richtungen laufen ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV SEM I: 516 Grundidee Modellschätzung Interpretation der Parameter Strukturgleichungsmodelle Messmodell = Spezifikation, welche manifesten Variablen die latenten Faktoren jeweils messen ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO Messmodell Messmodell SEM I: 517 Grundidee Modellschätzung Interpretation der Parameter Strukturgleichungsmodelle Strukturmodell = Spezifikation der gerichteten Beziehungen zwischen den latenten Faktoren ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V ηO ηV bVO Strukturmodell SEM I: 518 Grundidee Modellschätzung Interpretation der Parameter Warum rechnet man SEMs? Zusammenhang zwischen Offenheit und Vorurteilsneigung Offenheit Vorurteilsneigung Person Y1 Y2 Y3 Yo Y4 Y5 Y6 Yv 1 3 4 3 3.33 5 4 4 4.33 2 1 2 2 1.67 3 3 3 3.00.. … … 500 4 3 4 3.67 1 2 2 1.67 ein ALM: Yvn = b0 + b ∙ Yon + εn SEM I: 519 Grundidee Modellschätzung Interpretation der Parameter Warum rechnet man SEMs? ALM: pro Person: Yon = (Y1n + Y2n + Y3n)/3 SEM: SEM I: 520 Grundidee Modellschätzung Interpretation der Parameter Warum rechnet man SEMs? im Vergleich zum ALM kann man im SEM für den Messfehler, d.h. für die fehlende Reliabilität, kontrollieren SEM I: 521 Grundidee Modellschätzung Interpretation der Parameter SEM und Reliabilität Simulationsstudie zur Untersuchung des Effekts von Messfehlern: zwei Konstrukte, die jeweils mit drei Items erfasst wurden (s. Bsp.) variiert wird das Verfahren, mit dem Zusammenhang (b = 0.60) geschätzt wird [ALM vs. SEM] und die Reliabilität des Summenwerts [α = 0.75 vs. α = 0.90 vs. α = 1.00] SEM I: 522 Grundidee Modellschätzung Interpretation der Parameter SEM und Reliabilität ALM: pro Person: Yon = (Y1n + Y2n + Y3n)/3 SEM: SEM I: 523 Grundidee Modellschätzung Interpretation der Parameter SEM und Reliabilität Simulationsstudie zur Untersuchung des Effekts von Messfehlern: zwei Konstrukte, die jeweils mit drei Items erfasst wurden (s. Bsp.) variiert wird das Verfahren, mit dem Zusammenhang (b = 0.60) geschätzt wird [ALM vs. SEM] und die Reliabilität des Summenwerts [α = 0.75 vs. α = 0.90 vs. α = 1.00] in jeder Bedingung werden 1000 Stichproben gezogen und dann der Mittelwert der Parameterschätzungen (= der Bias) bestimmt; Ergebnis: Reliabilität (Cronbachs α) Verfahren 0.75 0.90 1.00 Regression 0.44 0.53 0.59 SEM 0.61 0.59 0.60 SEM I: 524 Grundidee Modellschätzung Interpretation der Parameter Warum rechnet man SEMs? im Vergleich zum ALM kann man im SEM für den Messfehler, d.h. für die fehlende Reliabilität, kontrollieren das SEM ist sehr flexibel, d.h. man kann (sehr) komplexe Modelle für quer- und längsschnittliche Daten bestimmen (vgl. die nächsten Sitzungen) das hat aber seinen Preis…. - “Zoo“ verschiedener Modelle - verwirrende Bezeichnungen ARE YOU USING SEMS? (jingle-jangle-Problem) - komplexe Modelle sind schwer zu schätzen - hohe Anforderungen an die Daten SEM I: 525 Grundidee Modellschätzung Interpretation der Parameter Strukturgleichungsmodelle Strukturgleichungsmodell (SEM): ein multivariates Verfahren, mit dem man theoretisch hergeleitete Kausalzusammenhänge zwischen latenten (und/oder manifesten) Variablen prüfen kann Wie „gut“ beschreibt das spezifizierte Modell die Daten? Ablauf: - Schritt 1: Spezifikation des Mess- und des Strukturmodells; Herleitung der modell-implizierten Varianz-Kovarianzmatrix Σ und der modell-implizierten Erwartungswerte - Schritt 2: Schätzung der Modellparameter - Schritt 3: Modellbewertung - Schritt 4: Modellrevision oder Interpretation der Parameter SEM I: 526 Grundidee Modellschätzung Interpretation der Parameter Schritt 1: Aufstellen des SEMs Was muss a priori spezifiziert werden? - Messmodell (vgl. CFA): § Anzahl der latenten Faktoren § Zuordnung der Variablen zu den Faktoren § ggf. Zusammenhänge zwischen den Fehlern - Strukturmodell: Wie genau hängen latente Faktoren miteinander zusammen? SEM I: 527 Grundidee Modellschätzung Interpretation der Parameter Schritt 1: Aufstellen des SEMs Messmodell: Gleichung für eine Person n und eine Variable p Ynp = µp + · ⌘1n + · · · + · ⌘Qn + ✏np AAAHuXicpVXbbhMxEJ22QNpwa+ERIa2IkJCQogRxeUBI5aKKBypatWmLkira3Tip6d60dgphtZ/IB/AdvILE8axTkoZcgF3ZOx7PmTMej71eEkila7VvS8srly5fKa2ula9eu37j5vrGrQMV91NfNPw4iNMjz1UikJFoaKkDcZSkwg29QBx6p6/N/OGZSJWMo309SMRx6PYi2ZW+q6Fqr/fW1j60syjJnRdOK+y3E+eh0wqA77jtLKnnTsvvxNppCY1xPcrNtNGoMbvdcbvdwk4kSgYgMe7b65VatcaPMynUrVAh++zEGyt3qUUdismnPoUkKCINOSCXFN4m1alGCXTHlEGXQpI8LyinMrB9WAlYuNCeou9h1LTaCGPjUzHaB0uAlgLp0H20LfbowdqwCsgK3x9oX1jX+y+GadiM+xQ4F3hjWbxltGmIaAIzPTKTO5OlCLkzURkpga3meP0Zect4NYpZNJ2cxzbP3tiGC1t3kSGTb2UR5RmIFH2AGYkdEQswmHWfwvZ3Vmfbf6YBdHJmVpq0bzM5jHyYx2Hsb6ApatbEu22zd2ArSjIqg2T2TlmmPcxq9APkxOO62bLeM3wTxho/MfvIx/AZveeYcq45g09ZDrmPFmAIeG5Y85Pet+ndmPdwxL8Ebj6DGtH+mWFvjEFNXcEwny/hKcHXhb1gjtZ5pRYxLZ4jBV+53b3FWTxUwGIsHirr31ai565Ec+x/t9umMnt8T83blSO7x58Y7U4wGS5zhrt8miX8DEaiP5tZ8ymfHAHf5qYM7W3W4fWP+uvAxoz7GBXZKDgv6PG3qV/8t0wKB4+q9afVJ7uPK5uv7H9nle7QPXqAnD6jTXpLO9RARF/pO+7+n6XnJbd0UvpYmC4vWcxtGntK6hcJS5wh p1 pQ Strukturmodell: Gleichung für eine latente Variable ηq' und eine Person n ωq→ n = εq→ + bq→ 1 · ω1n + · · · + 0 · ωq→ n + · · · + bq→ Q · ωQn + ϑq→ n AAAETXiclVJdaxNBFL3brbaNVlMLivgyWEShEHZ9iL4IBT/wRWjAtMWmhN3NJB2yX+5MqmnYB/+If8lnf4GPPvlWxDN302pSgjphMnfOuffM2TsT5rHSxvO+Okvu8pWrK6trtWvX12/crG/c2tPZqIhkO8rirDgIAy1jlcq2USaWB3khgySM5X44fG75/RNZaJWlb804l0dJMEhVX0WBAdStf+pIE3Qn7x+mpXgmOsMgz3lbim0R2sAvRSfqZUZUiX5qGUY0Am+GZJU/WBZozQq0qpTTi4JufctreDzE5cCfBls7dz9vbre/i91sw3lHHepRRhGNKCFJKRnEMQWk8TsknzzKgR3RBFiBSDEvqaQaakfIksgIgA7xP8DucIqm2FtNzdURTokxC1QKeoD5ihVDZNtTJWKN9QzzlLHBwhMmrGwdjrGGUFxjxTfADR0j42+VyTTz3Mu/VObgx2BsB/R/VNp+GOrTU+6DwpfljNgORRc6L8AUwIbMCHrJmQNohLw/Qe9SrG14t/dzriC4Vz2sAa+SVdKpYgC9Aqu9N+tnsccIutafhtPf3Vmc34MjBVTP3fPHmZu29ZUfSR+YSVjdOp2A63OtQv6Yvff5y2KcXjJv3czjNbxzf/5VXw72Hjf8ZqPZwoNvUjVW6R7dp0d41U9oh17TLroZ0Tdn3bnt3HG/uD/cM/dnlbrkTGs2aWYsr/wCTfTwbQ== - 𝜅q': Intercept des latenten Faktors ηq' - bq'1, …, bq'q,…, bq'Q: Regressionsgewichte (auch: Pfadkoeffizienten) - 𝜁q'n: Residualterm SEM I: 528 Grundidee Modellschätzung Interpretation der Parameter Beispiel Gleichungen Messmodelle: Y1n = µ1 + 1 · ηOn + 0 · ηVn + ε1n Y2n = µ2 + λ2O · ηOn + 0 · ηVn + ε2n Y3n = µ3 + λ3O · ηOn + 0 · ηVn + ε3n Y4n = µ4 + 0 ∙ ηOn + 1 · ηVn + ε4n Y5n = µ5 + 0 ∙ ηOn + λ5V · ηVn + ε5n Y6n = µ6 + 0 ∙ ηOn + λ6V · ηVn + ε6n Gleichungen Strukturmodell: ηOn = κO + ζOn ηVn = κv + bVO · ηOn + ζVn SEM I: 529 Grundidee Modellschätzung Interpretation der Parameter Schritt 1: Aufstellen des SEMs Was muss a priori spezifiziert werden? - Messmodell (vgl. CFA): § Anzahl der latenten Faktoren § Zuordnung der Variablen zu den Faktoren § ggf. Zusammenhänge zwischen den Fehlern - Strukturmodell: Wie hängen latente Faktoren zusammen? die „händische“ Herleitung von Σ und der modell-implizierten Erwartungswerte ist umständlich (vgl. CFA I) die Matrixdarstellung der modell-implizierten Kovarianzmatrix des SEMs ist: Σ = Λ ∙ (I - B)-1 ∙ Ψ ∙ (I - B)-1T ∙ ΛT + Φ - B: die Matrix der Pfadkoeffizienten SEM I: 530 Grundidee Modellschätzung Interpretation der Parameter CFA vs. SEM Modellimplizierte Kovarianzmatrix der CFA: Σ = Λ ∙ Φ ∙ ΛT + Ψ vs. Modellimplizierte Kovarianzmatrix des SEMs: Σ = Λ ∙ (I - B)-1 ∙ Ψ ∙ (I - B)-1T ∙ ΛT + Φ d.h. das SEM „erklärt“ die Kovarianzen zwischen den Faktoren durch das Strukturmodell, dabei ist B die Matrix der Pfadkoeffizienten SEM I: 531 Grundidee Modellschätzung Interpretation der Parameter CFA vs. SEM Modellimplizierte Kovarianzmatrix der CFA: Σ = Λ ∙ Φ ∙ ΛT + Ψ vs. Modellimplizierte Kovarianzmatrix des SEMs: Σ = Λ ∙ (I - B)-1 ∙ Ψ ∙ (I - B)-1T ∙ ΛT + Φ d.h. das SEM „erklärt“ die Kovarianzen zwischen den Faktoren durch das Strukturmodell, dabei ist B die Matrix der Pfadkoeffizienten “Woher kommt ein Beispiel für B mit drei latenten Variablen: der Pfeil?” - Strukturmodell mit Matrix B: AAAEcHiclVNNb9NAEB23BlpTIC0CIXHAEIEqDpETpJQLUsWXuCAVibSV4ijyOut0FX/JdkpTyxJ/kz/AD+DMgbcTt5BUEbDRZsfvzbx9O2uLNFR54TjfjLV189r1Gxub1s2tW7fvNLZ3DvNkmvmy5ydhkh0LL5ehimWvUEUoj9NMepEI5ZGYvNH80anMcpXEn4tZKgeRN45VoHyvADRsfHX7lht5xYkIyteV/cpyhRyruBTAMnVWXZJOZT+zHZ6ua1tiWHbaGlria+4FczroLCZZroxHf6gPho2m03J42FeDdh00qR4HybYRkksjSsinKUUkKaYCcUge5fj1qU0OpcAGVALLECnmJVVkoXaKLIkMD+gE/2M89Ws0xrPWzLnaxy4hZoZKm55ivmdFgWy9q0ScY/2Jec7YeOUOJStrhzOsAoqbrPgReEEnyPhbZVRnXnj5l8oU/AyM7kD+H5W6HwUF9JL7oHCylBHdIf9S5y2YDNiEGZveceYYGoKfT9G7GGsP3vX9XCjY3KsRVo9XySpxrehBL8Oq7037We3Rh672l8Pp7+6szh/BkQKaL93z2cJN6/q5H0lfmIlYXTstwQVcq5A/Y+8BnyzE7hXz2s0yvvqG5qc81zn4FtrLb/7V4LDTandb3U+d5n63/io26CE9oV28+Xu0Tx/oAB336buxZdwz7q//MB+Yj8zH89Q1o665SwvDfP4Lq6nv3g==   AAAEiniclVNdb9NAEFwXA20okJZHXiwiKgRSsB0pUCGkShTEC1KRSFuprqKzc3FP8Zdsp5BE+SP8M/4LD8ytnUISRcBFzu3N7szN7dl+FqmitO0fxtYt8/adu9s7jXu79x88bO7tnxbpOA9kL0ijND/3RSEjlcheqcpInme5FLEfyTN/9E7nz65lXqg0+VJOMnkZizBRQxWIElC/+d3zZaiSmYhUmDyfNzxZir5rHby1vJHIMh2/sPz+zHXmlhcM0tLiCgeoN61qPa9idf5gdSpWZ52lUXcJdW+0OhBKBgsv/WbLbts8rPXAqYMW1eMk3TMi8mhAKQU0ppgkJVQijkhQgd8FOWRTBuySZsByRIrzkubUAHeMKokKAXSE/xCrixpNsNaaBbMD7BLhycG06CmeD6zoo1rvKhEXmH/imTIWbtxhxsra4QSzD8UdVvwEvKQrVPyNGdeVCy//wsyQnyCjO1D8B1P3o6QhveY+KJwsY0R3KLjROUYmBzbijEXvuTKEhs/ra/QuwdyDd30/CwWLezXALHiWrJLUigJ6OWZ9b9rPZo8BdLW/Ak5/d2dz/QCOFNBi5Z6/Ld205ld+JH3lTMzq2ukMuSFzFeon7H3IJ4uw+5zz2s0qvvmGqlNOdQ2+BWf1zV8PTt220213P7uto279VWzTY3pCz/Dmv6Ij+kgn6HhgkHFgvDRsc9d0zUPzTVW6ZdScR7Q0zONf/r73ng== ω2 = ε2 + b21 · ω1 + ϑ2 0 0 0 “Wohin läuft B = b21 0 0 der Pfeil?” ω3 = ε3 + b31 · ω1 + b32 · ω2 + ϑ3 b31 b32 0 SEM I: 532 Grundidee Modellschätzung Interpretation der Parameter Schritte 2 und 3 Schritt 2: Schätzung der Modellparameter (vgl. Sitzungen zur CFA) - Voraussetzung: die latenten Faktoren sind skaliert und das Modell ist identifiziert - die Skalierung der Faktoren erfolgt mit der Hybridmethode - Schätzung erfolgt i.d.R. mit der Maximum-Likelihood-Methode (d.h. FML wird minimiert) Schritt 3: Modellbewertung mit dem χ2-Test bzw. den anderen absoluten und relativen Fit-Indizes (vgl. Sitzungen zur CFA) - mögliche Ursachen schlechten Fits: (1) Fehlspezifikationen in den Messmodell (2) Fehlspezifikationen im Strukturmodell SEM I: 533 Grundidee Modellschätzung Interpretation der Parameter Schritt 4: Interpretation Intercept μp und Faktorladung λp eines Items: wie in der CFA! Intercept κq': vorhergesagte Ausprägung in ηq', wenn andere Faktoren Null sind - durch Verwendung der „Hybrid“-Skalierung ist κq' = 0, d.h. vorhergesagter Wert bei einer Ausprägung von 0 auf den anderen Prädiktoren wird auf 0 gesetzt! Pfadkoeffizient bq'q : erwartete Veränderung im latenten Faktor ηq', wenn man den Faktor ηq um eine Einheit erhöht (und ggf. die anderen latenten Faktoren konstant hält) SEM I: 534 Grundidee Modellschätzung Interpretation der Parameter Beispiele Zusammenhang zwischen Offenheit und Vorurteilsneigung ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1.81.74 1.86.78 ηO ηV bVO = -.248 SEM I: 535 Grundidee Modellschätzung Interpretation der Parameter Beispiele Zusammenhang zwischen Offenheit und Vorurteilsneigung ε1 ε2 ε3 ε4 ε5 ε6 Y1 Y2 Y3 Y4 Y5 Y6 1.81.74 1.86.78 ηO ηV bVO = -.248 Interpretation von bVO: Erhöht man die Offenheit um eine 1 Einheit, sinkt die vorhergesagte Vorurteilsneigung um 0.248. SEM I: 536 Grundidee Modellschätzung Interpretation der Parameter Schritte 4: Interpretation Intercept μp und Faktorladung λp eines Items: wie in der CFA! Intercept κq': Ausprägung in ηq', wenn andere Faktoren Null sind - durch Verwendung der „Hybrid“-Skalierung ist κq' = 0 Pfadkoeffizient bq'Q : erwartete Veränderung im latenten Faktor ηq', wenn man den Faktor ηQ um eine Einheit erhöht (ggf. kontrolliert für die anderen latenten Faktoren) für jeden latenten Faktor kann man darüber hinaus den direkten, den indirekten und den totalen Effekt auf einen anderen Faktor angeben (wenn mehrere Pfade zwischen den Variablen existieren) - zur Illustration benötigen wir ein komplexeres Beispiel… SEM I: 537 Grundidee Modellschätzung Interpretation der Parameter Beispiel Zusammenhang zwischen Offenheit, Vorurteils- neigung und Ängstlichkeit Offenheit Vorurteilsneigung Ängstlichkeit Person Y1 Y2 Y3 Y4 Y5 Y6 Y7 Y8 Y9 1 3 4 3 5 4 4 2 3 3 2 1 2 2 3 3 3 2 2 2.. 200 4 3 4 1 2 2 2 2 3 Item-Beispiele: Y1: „Ich bin fantasievoll.“ Y4: „Ausländer sollten sich nicht in Deutschland aufhalten.“ Y7: „Ich habe Angst vor der Zukunft.“ SEM I: 538 Grundidee Modellschätzung Interpretation der Parameter Beispiel Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V bVO ηO ηV bÄO bVÄ ηÄ 1 λ8Ä λ9Ä Y7 Y8 Y9 SEM I: 539 Grundidee Modellschätzung Interpretation der Parameter Beispiel Gleichungen Messmodelle: Y1n = µ1 + 1 · ⌘On + 0 · ⌘V n + 0 · ⌘Än + ✏1n AAAIJHicpVVNb9NAEJ1QICV8tXDkgNUKhFQpiqMCJ6QWUMWBqkVt00JdRbazDVb9Ja9TCJb/Dr8GcUEcuPBLOPB2vGmThiQGbHk9np333uzs2HZi35Npo/Gjcmnu8pWr1flrtes3bt66vbB4pyWjXuKKPTfyo+TAsaXwvVDspV7qi4M4EXbg+GLfOXmh5vdPRSK9KNxN+7E4Cuxu6B17rp3C1V74+radmWFuPHxmWEGvbRorhmlYbidKDUukdjvbwuSK0RjxtcL8omtpneMsEUvPBzGTWlYN9M1z+qYK8ZFdB5DmVl5Gacw3JtUspOr1eq29sNyoN/gwxg1TG8ukj+1oce4+WdShiFzqUUCCQkph+2STxHlIJjUohu+IMvgSWB7PC8qpBmwPUQIRNrwnGLt4OtTeEM+KUzLahYqPKwHSoAe4NpjRQbRSFbAl7r9wfWJf978UJmEzHhPgbOBVZHHWcE1ChGOYyZmp2qkqhaidykpZMWJTztedUreMVyNZJaX3Z7nNilexQenoY1RI1VtqRE2fk1AJRh8zHnZFlFBRaz9B7Hllp8d/pD583tTKHNKuruYg+0EtDZ37S3iKvlX5buoKtnRXeYzKYKn9k1ppB7Mpxj7q4nDvbGj2DPeYsYonYo58BJ/RFueUc98pfMJ2wGNYQsHnuUHfj7Nv0usR9mCI3wNutoIc8v5ZYWdEQU5cwaCe62CKcbcRL1jDOuvWIqfyNZLgyvXulVdx0AHlVBx01r+tJJ25kpRz/7vdVp3Z5W/VrF050Hv8gdH2mJLSUu/xMb/RHnj6Q9mfTu35hN8cAW71tQz0F63D6x/m6yBGPffwVFSj0Lzgxx/HvPh/GTdazbr5pP74zery2nP975mne7REj1DTp7RGr2ib9sitrFbeVdxKp/q5+qX6rfq9CL1U0Zi7NHJUf/4GW5+7NA== Y2n = µ2 + 2O · ⌘On + 0 · ⌘V n + 0 · ⌘Än + ✏2n... Gleichungen Strukturmodell: ⌘On = O + ⇣On AAAIF3icpVVLb9NAEJ5QICW8WjhywGrFQ0KqEsTjhNQCqjhQpaitW6muItvZBit+ybsppFZ+CL8GcUFcOfJfOPDteJMmTfMAbO16dma+b2Znx7aXhoFU1eqv0qWFy1eulhevVa7fuHnr9tLyHVsmncwXe34SJtmB50oRBrHYU4EKxUGaCTfyQrHvtd9o+/6JyGSQxLuqm4qjyG3FwXHguwqqxtI3Ryi3kdfjnvXwleW03TR1G3XrieWcDgyOUym8VjZG3LDuwdPTQh1ufjNR1hnfgINhAxJ7hMMuCOwL8dqgYwxbmGxADbLG0mp1rcqXNS7UjLBK5tpOlhfuk0NNSsinDkUkKCYFOSSXJO5DqlGVUuiOKIcugxSwXVCPKsB24CXg4ULbxtzC6tBoY6w1p2S0jyghRgakRQ8wNpnRg7eOKiBLPH9jnLKu9V8RJmFznjPgXOC1Z3FXMCYh4jHM5Mx07XSVYtROZ6WlFL6K8/Wn1C3n3UiOoujjILdZ/to3mtv7GBXS9ZYGUTH3JFSGOYQlwKmIOaLovbfhe1bZ6f6fqQtdMLUyh7RrqtnPvl9Ly+T+Fpqib3W+W6aCtumqgFE5JH1+0kTagVVh7qIuHvfOpmHP8UwZq3kS5uiN4HOqc0497juNz1iOeI7niBCyrd/34+xb9H6EPRriD4CbHUEOaS+OsDMSQU7cQb+eG2BK8XThLziGM+jWIqf5ayTB1TOnN38UDx0wXxQPnfVvO1Ezd6I49787bd2ZLf5WzTqVA3PGnxjtjkXSsfR7fMxvdACe7lD2J1N7PuM3R4Bbfy0j80Vr8v6H+Zrw0esOVkU1ipjn9Pjj1M7/X8YF++la7cXa8w/PVtdfm3/PIt2jFXqMmr6kdXpH27RHfulRaatkl/bLX8pfy9/LPwrXSyWDuUsjV/nnH23yuPE= ⌘Än = Ä + bÄO · ⌘On + ⇣Än ⌘V n = V + bV O · ⌘On + bV Ä · ⌘Än + ⇣V n SEM I: 540 Grundidee Modellschätzung Interpretation der Parameter Interpretation der Modellparameter direkter Effekt von ηq' bei Vorhersage von ηQ: Effekt der nicht über andere latente Faktoren vermittelt wird - Pfadkoeffizient der latenten Regression ηq' → ηQ indirekter Effekt von ηq' bei Vorhersage von ηQ : Effekte, die über andere latente Faktoren bzw. Variablen vermittelt werden - Produkt der Pfadkoeffizienten (!) totaler Effekt von ηq' bei Vorhersage von ηQ : Summe des direkten Effekts und der indirekten Effekte SEM I: 541 Grundidee Modellschätzung Interpretation der Parameter Beispiel Y1 Y2 Y3 Y4 Y5 Y6 1 λ2O λ3O 1 λ5V λ6V -.096 ηO ηV -.308.489 ηÄ Effekte ηO → ηV: 1 λ8Ä λ9Ä Direkter Effekt: -.096 Y7 Y8 Y9 Indirekter Effekt: -.308 ∙.489 = -.151 Totaler Effekt: -.096 -.151 = -.248 SEM I: 542 Grundidee Modellschätzung Interpretation der Parameter Schritte 4: Interpretation Intercept μp und Faktorladung λp eines Items: wie in der CFA! Intercept κq': Ausprägung in ηq', wenn andere Faktoren Null sind - durch Verwendung der „Hybrid“-Skalierung ist κq' = 0 Pfadkoeffizient bq'Q : erwartete Veränderung im latenten Faktor ηq', wenn man den Faktor ηQ um eine Einheit erhöht (ggf. kontrolliert für die anderen latenten Faktoren) für jeden latenten Faktor kann man darüber hinaus den direkten, den indirekten und den totalen Effekt auf einen anderen Faktor angeben (wenn sie existieren) - indirekte Effekte nennt man oft Mediationseffekte; diese Terminologie ist aber ungenau SEM I: 543 Grundidee Modellschätzung Interpretation der Parameter Zusammenfassung SEM = „CFA + Pfadmodell/ALM“ – Messmodelle: Zusammenhang zwischen Faktoren und manifesten Indikatoren – Strukturmodell: Pfadmodell zwischen latenten (und/oder) manifesten Variablen – endogene vs. exogene Variablen SEMs ermöglichen: - Berücksichtigung von Messfehler - Modellierung komplexerer Zusammenhänge als ALM (direkte vs. indirekte Effekte) - kausale Modellierung in bestimmten (engen) Grenzen (vgl. nächste und letzte Sitzung) SEM I: 544 Grundidee Modellschätzung Interpretation der Parameter Fragen SEM I: 545 Grundidee Modellschätzung Interpretation der Parameter Literatur für heute Eid, M., Gollwitzer, M., & Schmitt, M. (2017). Statistik und Forschungsmethoden (5. Aufl.). Beltz: Weinheim, Basel. Kap. 24 & 26 (Relevante Abschnitte) SEM I: 546 Grundidee Modellschätzung Interpretation der Parameter Vielen Dank für Ihre Workshop Aufmerksamkeit! R-Grundlagen 10.10.2016 Selbstest: Witz Workshopverstanden? R-Grundlagen 10.10.2016 Übungsaufgaben 1. In einer Untersuchung wurde der Zusammenhang zwischen Offenheit (η1), Positivität des Kontakts mit der Fremdgruppe (η2), Ängstlichkeit (η3) und Vorurteilen gegenüber der Fremdgruppe (η4) untersucht. Für die Pfadkoeffizienten zeigten sich die folgenden Ergebnisse: -0.50 a. Interpretieren Sie den Effekt von η2 auf η4. b. Bestimmen Sie den direkten, die indirekten und den totalen Effekt zwischen η1 und η4. 549 Übungsaufgaben 2. In einer Studie wurde das folgende Strukturgleichungsmodell an die Daten angepasst (der Einfachheit halber werden die Items und die Residualvarianzen der Items nicht dargestellt; auch die Residuen der endogenen Variablen werden nicht dargestellt): η2 η1 η3 η5 η4 a. Geben Sie für jede Variable die indirekten Effekte an. b. Wie lautet der totale indirekte Effekt zwischen η1 und η5? 550 Übungsaufgaben 3. Wir betrachten das SEM auf Folie-Nr. 535. Bestimmen Sie die Freiheitsgrade des Modells unter der Annahme, dass die Faktorladungen des Offenheit- Faktors auf den gleichen Wert festgesetzt werden. 4. Ist der χ2-Test zur Prüfung der Passung eines berechneten Strukturgleichungs- modells abhängig von der Stichprobengröße? (mit Begründung) 5. Wir betrachten noch einmal das SEM des zweiten Beispiels (Folie-Nr.: 539). a. Nennen Sie alle endogenen und alle exogenen Variablen des Modells. Handelt es sich um ein rekursives SEM? b. Für den χ2-Test zeigt sich das folgende Ergebnis: χ2 = 3.70, p =.12. Wird das Modell durch die Daten unterstützt? c. Angenommen, alle Fit-Indizes zeigen an, dass das Modell nicht an die Daten passt. Woran könnte die fehlende Passung des Modells liegen? 551

Use Quizgecko on...
Browser
Browser