Multivariate Verfahren 4.1 Faktorenanalyse PDF

Summary

This document provides an overview of factor analysis, a multivariate statistical technique used to identify underlying latent variables (factors) from observed data. It explores concepts like data reduction, factor extraction, and interpretation. The document covers various aspects of factor analysis.

Full Transcript

Wintersemester M I.2 Multivariate Verfahren 4.1 Datenreduktion – Faktorenanalyse Thomas Hering 1 Faktorenanalyse Themen Hintergrund Dur...

Wintersemester M I.2 Multivariate Verfahren 4.1 Datenreduktion – Faktorenanalyse Thomas Hering 1 Faktorenanalyse Themen Hintergrund Durchführung und Beispiel (1) Korrelationsmatrix, (2) Extraktion der Faktoren (Kommunalitätsproblem), (3) Faktorenanzahl (Extraktionsproblem), (4) Interpretation der Lösung (Rotationsproblem) (5) Faktorenwerte Zusammenfassung Zusammenfassung – Gleichungen 2 2 1 Wintersemester Faktorenanalyse Hintergrund (1) Problem: Psychologische Merkmale werden mit vielen Items gemessen (Test). Wird ein Merkmal mit vielen Items erhoben, ergeben sich statistische Überschneidungen -> Korrelation Ziel: 1.) Strukturierung -> Gruppen von Items werden identifiziert, die hoch korrelieren, Trennung von Items, die mit diesen weniger stark korrelieren. Gruppen -> Faktoren -> mathematisches Optimierungsproblem 2.) Datenreduktion -> werden Gruppenwerte ermittelt (bspw. Mittelwert oder Summenwert), sind Aussagen über den Zustand des Merkmalsträgers möglich. Gruppenwerte können anstelle der Einzelwerte verwendet werden. Datenreduktion bedeutet Informationsverlust 3 3 Faktorenanalyse Hintergrund (2) Beispiel: körperliches Wohlbefinden (Auszug) 8 Items, je 4 Belastbarkeit und Vitalität Erkennbare Itemgruppen die innerhalb der Gruppen eng korrelieren, mit Item anderer Gruppen jedoch weniger eng. 4 4 2 Wintersemester Faktorenanalyse Hintergrund (3) Verschiedene Verfahrensgruppen: 1.) in der Psychologie zur Testkonstruktion: Wie viele Dimensionen / Faktoren hat ein Merkmal? → explorative (erkundende) Faktorenanalyse (Hauptkomponenten- oder Hauptachsen-FA) 2.) Zur Überprüfung der inhaltlich/theoretisch begründeten Struktur eines psychologischen Merkmals (z.B. Burnout mit den Dimensionen Erschöpfung, Zynismus, Professionelle Effizienz) Zeigt sich die angenommene Struktur auch in den Daten? → konfirmatorische Faktorenanalyse (LISREL, AMOS, Lavaan) Voraussetzungen (s. Regressionsanalyse): Intervallskalenniveau, lineare Beziehung zwischen Items n ≥ 3 x Anzahl der Items, je größer, desto besser 5 5 Faktorenanalyse Hintergrund (4) Skizze der explorativen Faktorenanalyse am Beispiel von drei Items: Darstellung der Punktwolke in einem dreidimensionalen Koordinatensystem Punktwolke kann Kugel- (kein Zusammenhang), eine Zeppelin- (Zusammenhänge zwischen den drei Items) oder Vektorform (absoluter Zusammenhang) haben innerhalb der Punktwolke wird nach Geraden (Vektoren) gesucht, die diese am besten beschreiben. rechtwinklige (orthogonale) Anordnung, dann sind sie unkorreliert. max. Anzahl möglicher Vektoren entspricht Anzahl der Items nur einige dieser Vektoren sind sinnvolle Faktoren 6 6 3 Wintersemester Faktorenanalyse Hintergrund (5) I: 1. Faktor, größte Varianzaufklärung (Längsdurchquerung ) II: 2. Faktor, zweitgrößte Varianzaufklärung (vertikale Durchquerung) III: 3. Faktor, kleinste Varianzaufklärung (horizontale Durchquerung) 7 7 Faktorenanalyse Durchführung (1) 1. Inhaltliche Vorüberlegungen dazu, welche Struktur ein Gegenstand hat 2. Basis: Korrelationsmatrix der Items Wird ein Muster an Korrelationen erkennbar, die eine Faktorenanalyse rechtfertigen? -> Bartlett-Test oder inverse Korrelationsmatrix 3. Extraktion der Faktoren -> Kommunalitätsproblem Hauptachsen- oder Hauptkomponenten Faktorenanalyse 4. Faktorenanzahl? Eigenwertkriterium (Scree-Plot), Parallelanalyse 5. Interpretation der Lösung – Rotationsproblem orthogonal (rechtwinklig) oder schiefwinklig 6. Bestimmung der Faktorenwerte 8 8 4 Wintersemester Faktorenanalyse 2. Korrelationsmatrix (1) Bivariate Korrelationsanalyse aller Items / Variablen Augenscheinnahme, ob ein inhaltlich interpretierbare Korrelationsstruktur erkennbar wird (Auszug körperliches Wohlbefinden FEW 16, Kolip & Schmidt, 1999) liegt hier vor – ist diese Korrelationsstruktur geeignet für eine Faktorenanalyse? → Kaiser-Meyer-Olkin-Kriterium + Bartlett-Test 9 9 Faktorenanalyse 2. Korrelationsmatrix (2) Kaiser-Meyer-Olkin-Kriterium (0 bis 1) Ist die Korrelationsmatrix für eine Faktorenanalyse geeignet? Quelle: Backhaus, Erichson, Plinke & Weiber (2018), S. 379 Bartlett-Test (𝝌𝟐 -verteilte Testgröße) H0: die Korrelationsmatrix entspricht der Einheitsmatrix (Werte auf der Diagonalen 1, alle anderen Werte 0) HA: die Korrelationsmatrix unterscheidet sich von der Einheitsmatrix 10 10 5 Wintersemester Faktorenanalyse 2. Korrelationsmatrix (3) Am Beispiel (Auszug FEW 16, Kolip & Schmidt, 1999): Die Korrelationsmatrix ist sehr gut geeignet (KMO > 0.8) für eine Faktorenanalyse. Die Wahrscheinlichkeit für die gezeigte Abweichung von der Einheitsmatrix ist kleiner als 0.1%, wenn die Stichprobe aus einer Population entstammt, in der die Einheitsmatrix vorliegt. 11 11 Faktorenanalyse 3. Extraktion der Faktoren (1) Ergebnis der Faktorenanalyse ist eine Faktorladungsmatrix Begriffe Faktor: Gruppe hoch korrelierter Items / Variablen Faktorladung (-1 bis 1) 𝑎 (Ladung des Item j auf Faktor p): Korrelation des Items / der Variable mit extrahiertem Faktor (sollte in der rotierten Lösung > 0.5 sein) Kommunalität (h², 0 bis 1): Ausmaß, mit dem ein Item durch alle Faktoren erklärt wird – die Summe aller quadrierten Faktorenladung eines Items mit allen Faktoren (abhängig von der Stichprobengröße, mind. 0.6) ∑ 𝑎 Summe der quadrierten Faktorladung a des Items j auf Faktor p beginnend mit Faktor p = 1 bis Faktor q 12 12 6 Wintersemester Faktorenanalyse 3. Extraktion der Faktoren (2) Uniqueness (1 – h² , 0 bis 1): nicht durch Faktoren erklärte Varianz eines Items Eigenwert (0 bis max. Anzahl der Items): Faktor erklärt so viel Varianz, wie n Items, Summe der quadrierten Faktorenladungen jedes Faktors ∑ 𝑎 Summe der quadrierten Faktorladung a des Items j auf Faktor p beginnend mit Item j = 1 bis Item n Fundamentaltheorem der Faktorenanalyse: Aus den standardisierten Faktorwerten (𝑦 , Folie 16) der Person i auf Faktor p und Faktorladungen (𝑎 ) bei Item j und Faktor p lässt sich die Ausprägung des Items (𝑥 ) von Person i und Item j ermitteln: 𝑥 ∑ 𝑦 · 𝑎 bei einer Zweifaktorlösung: 𝑥 𝑦 ·𝑎 𝑦 ·𝑎 13 13 Faktorenanalyse 3. Extraktion der Faktoren (3) Kommunalität Item BL1 ∑ 𝑎 𝑎 𝑎 0.824 0.742 0.523 (durch die Faktoren werden 82.4% der Varianz des Items BL1 erklärt) (Summe von Faktor p = 1 bis Faktor q) ∑ 𝑎 𝑎 𝑎 ⋯ 𝑎 (Summe von Item j bis zum letzten Item n) 4.783 0.742 0.747 ⋯ 0.761 Eigenwert Faktor 1 (erklärt so viel Varianz, wie 4.783 / 8 Items = 59.8%) 14 14 7 Wintersemester Faktorenanalyse 3. Extraktion der Faktoren (4) verschiedene Methoden, je nach Fragestellung und Datenqualität explorative (erkundende) Verfahren Hauptkomponentenanalyse oder Hauptachsen-Faktorenanalyse Kommunalitätsproblem es soll eine Lösung gefunden werden, bei der die Items durch die extrahierten Faktoren am besten erklärt werden für diese Lösung werden die Kommunalitäten benötigt Kommunalitätsproblem –> Kommunalitäten sind vor erstem Schritt unbekannt in zwei Verfahren wird mit diesem Problem umgegangen: 1. Hauptkomponentenanalyse 2. Hauptachsenfaktorenanalyse 15 15 Faktorenanalyse 3. Extraktion der Faktoren (5) möglichst viel Varianz soll erklärt – Komponenten hoch ladenden Itemssollen gefunden werden Extraktion auch Faktoren mit einem Item möglich 1. Hauptkomponentenanalyse, Grundannahme: gesamte Varianz eines Items kann durch die Faktoren erklärt werden Anzahl der Faktoren = Anzahl der Items -> Kommunalität = 1 Anzahl der Faktoren < Anzahl der Items -> Kommunalität < 1 Rest: inkauf genommener unerklärter Rest Wert der Hauptkomponente p einer Person i ergibt sich aus der Summe der Produkte aus Faktorladungen 𝑎 (Item j auf Faktor p=) und Personenwert i des zugehörigen Items j der Items j bis k des Faktors Item 1 𝑥 𝑦 𝑎 ·𝑥 Komponente yip Item 2 𝑥 Item 3 𝑥 16 16 8 Wintersemester Faktorenanalyse möglichst viel Varianz soll erklärt – 3. Extraktion der Faktoren (6) dahinterliegende latente Konstrukte sollen aufgedeckt werden Faktoren mit einem Item werden Extraktion unterdrückt 2. Hauptachsenfaktorenanalyse Varianz eines Items setzt sich zusammen aus Kommunalität und einem unerklärten Rest -> Items werden durch die Faktoren nicht vollständig erklärt Gesucht werden latente Konstrukte, die Items möglichst gut erklären Es wird nicht die Komponente geschätzt, sondern die Items aus der Komponente Der Wert eines Items ergibt sich aus dem Wert des latenten Konstrukts 𝑦 einer Person i und der Faktorenladung 𝑎 des Items j eines Faktors p Item 1 𝑥 𝑦 ·𝑎 𝑒 latentes Item 2 für jedes Item Konstrukt yip Item 3 17 17 Faktorenanalyse 4. Anzahl der Faktoren (1) Extraktionsproblem: möglichst wenige Faktoren sollen einen möglichst großen Teil der Gesamtvarianz erklären Hinweise auf die Faktorenzahl liefern: Theorie (!) Kaiser- (Eigenwert) -kriterium (> 1) (auch per Screeplot) Faktorenzahl lässt sich aus der Eigenwerttabelle ablesen Faktorenzahl an dem Faktor, bei dem Eigenwert 1 übersteigt Im Beispiel repräsentieren zwei Faktoren die Daten am besten 18 18 9 Wintersemester Faktorenanalyse 4. Anzahl der Faktoren (2) Screeplot (Faktoren-Eigenwert-Diagramm) – geeignete Faktorenzahl links vom dem ersten „großen“ Knick (elbow) „elbow“ 19 19 Faktorenanalyse 4. Anzahl der Faktoren (3) Parallelanalyse (2 Kurven im Screeplot): 1. beobachtete Eigenwertkurve aus den Daten 2. Eigenwertkurve aus Zufallsdaten links des Schnittpunkts stehende Faktoren zeigen die geeignete Faktorenzahl Schnittpunkt der Kurven Eigenwertkurve aus Zufallsdaten 20 20 10 Wintersemester Faktorenanalyse 5. Interpretation der Lösung + Rotationsproblem (1) Faktorenladungsmatrix enthält die Ladungsstruktur (Korrelationen) zwischen Items und den jeweiligen Faktoren Kommunalität ∑ 𝑎 Faktorladung 𝑎 Eigenwerte ∑ 𝑎 21 21 Faktorenanalyse 5. Interpretation der Lösung + Rotationsproblem (2) Faktor 1 erklärt den größten Varianzanteil Im Koordinatensystem zeichnet Faktor 1 einen Vektor, der den Schwerpunkt der Punktwolken beider Faktoren zeigt (Abbildung 1 auf nächster Folie) würde man an den Geraden, die durch die Itempunkte laufen, mit je gleicher Kraft „ziehen“, würde Faktor 1 die Bewegungsrichtung zeigen Faktor 2 liegt im rechten Winkel (orthogonal) zu Faktor 1 -> Hauptkomponentenanalyse soll unkorrelierte Faktoren bilden 𝑟 cos∢𝑥𝑦, cos 90° 0 Rotation legt die Faktoren in die Punktwolken / Geraden – daraus ergibt sich eine rotierte Ladungsmatrix, die hohe Faktorenladungen bei den Items zeigen soll, die zu den jeweiligen Faktoren gehören (Abbildung 2, Folie 24) Aus der Rotation ergibt sich eine Faktorenladungsmatrix (Tabelle 2, Folie 24), in der Ladungen der Items (nur) auf ihren jeweiligen Faktoren groß sind -> Neben- Doppelladungen von > 0.3 sind problematisch 22 22 11 Wintersemester Faktorenanalyse 5. Interpretation der Lösung + Rotationsproblem (3) Abbildung 1: unrotierte Darstellung Abbildung 2: rotierte Darstellung 23 23 Faktorenanalyse 5. Interpretation der Lösung + Rotationsproblem (4) Tabelle 1: unrotierte Komponentenmatrix Tabelle 2: rotierte Komponentenmatrix 24 24 12 Wintersemester Faktorenanalyse 6. Bestimmung der Faktorenwerte (1) Auf Basis der Faktorenlösung wird der Faktorenwert 𝑦 ermittelt Summenwert: die Itemwerte 𝑥 aller Personen werden aufsummiert (sinnvoll, wenn alle Faktoren aus derselbe Anzahl Items gebildet werden): 𝑦 ∑ 𝑥 Wert des Faktors p ergibt sich aus der Summe der Itemwerte j aller Personen des Faktors p Mittelwert: die Itemwerte 𝑥 aller Personen werden aufsummiert und durch die Anzahl der Items j bis k eines Faktors dividiert (sinnvoll, wenn Faktoren aus unterschiedlicher Anzahl Items gebildet werden): 𝑦 ∑ 𝑥 weitere Möglichkeiten: Gewichtungsfaktoren berücksichtigen, logarithmieren, …, (inhaltliche Gründe) u.a. 25 25 Faktorenanalyse 6. Bestimmung der Faktorenwerte (3) Faktoren(mittel)werte des Beispiels 26 26 13 Wintersemester Faktorenanalyse Zusammenfassung (1) Hintergrund Psychologische Merkmale werden oft mit vielen Items / Merkmalen beschrieben Es ergeben sich statistische „Überschneidungen“ (Korrelationen) zwischen zwei oder mehreren Items FA: 1.) Aufdecken eines statistischen Musters / von Gruppen in den Daten (welche Items gehören statistisch zusammen?) 2.) Datenreduktion: mit wenigen zusammengefassten Gruppen lassen sich Aussagen über den Merkmalsträger treffen – Werte der Itemgruppen können anstelle der Einzelwerte verwendet werden Verfahren zur Erkundung der Struktur → explorative FA oder zur Überprüfung der Passung vorliegender Daten zu einer inhaltlich / theoretisch / empirisch beschriebenen und überprü en Struktur → konfirmatorische FA 27 27 Faktorenanalyse Zusammenfassung (2) Durchführung: 1.) inhaltliche Vorüberlegungen 2.) Muster in der Korrelationsmatrix – Gruppen von Items erkennbar? → KMO-Kriterium, Bartlett-Test 3.) Extraktion: Basis Kommunalitäten (erklärte Varianz der Items durch die extrahierten Faktoren) – diese sind vor der Analyse unbekannt -> Kommunalitätenproblem a) Hauptkomponentenanalyse: gesamte Varianz eines Items wird durch die Faktoren erklärt → Kommunalitäten werden zum Beginn auf 1 gesetzt Ziel: Faktoren erklären möglichst viel Varianz der Daten b) Hauptachsen-FA: Varianz eines Items lässt sich nur zum Teil aus den Faktoren erklären → Kommunalitäten werden zum Beginn < 1, Basis bspw. mi lere Korrelation aller Items Ziel: aufdecken latenter Strukturen in den Daten Kommunalitäten je nach Stichprobengröße mind. Jedoch 0.5 28 28 14 Wintersemester Faktorenanalyse Zusammenfassung (3) Durchführung: 4.) Anzahl der Faktoren → Eigenwertkriterium (> 1) oder Parallelanalyse 5.) in der Faktorenstruktur der Komponentenmatrix ist die Zugehörigkeit der Items nicht klar erkennbar – Faktor 1 zeigt im Koordinatensystem die mittlere Richtung aller Vektoren der Items – größte Varianzaufklärung → Rotationsproblem: durch Rotation werden die Faktoren rechtwinklig (orthogonal) oder schiefwinklig durch die Punktwolken / Vektoren der Items gelegt → ergibt ro erte Komponentenmatrix in der Items auf ihre Faktoren hoch laden, auf andere Faktoren jedoch nicht 6.) Faktorwerte: über Summenbildung oder durch den Gruppenmittelwert lassen sich Faktorenwerte bestimmen, die anstelle der Einzelitems zur Beschreibung der Merkmalsträger genutzt werden können 29 29 Faktorenanalyse Zusammenfassung – Gleichungen (1) Faktorenanalyse Faktorladung (-1 bis 1): 𝑎 (Ladung des Item j auf Faktor p) Kommunalität (h², 0 bis 1): ∑ 𝑎 Summe der quadrierten Faktorladung a des Items j auf Faktor p beginnend mit Faktor p = 1 bis Faktor q Eigenwert (0 bis max. Anzahl der Items): ∑ 𝑎 Summe der quadrierten Faktorladung a des Items j auf Faktor p beginnend mit Item j = 1 bis Item n (n = letztes von allen Items) Hauptkomponente 𝑦 ∑ 𝑎 ·𝑥 Wert der Hauptkomponente p einer Person i ergibt sich aus der Summe der Produkte aus Faktorladungen 𝑎 (Item j auf Faktor p=) und Personenwert i des zugehörigen Items j der Items j bis k des Faktors 30 30 15 Wintersemester Faktorenanalyse Zusammenfassung – Gleichungen (2) Fundamentaltheorem der Faktorenanalyse: aus Faktorwert (𝑦 ) der Person i auf Faktor p und Faktorladungen (𝑎 ) bei Item j und Faktor p lässt sich die Ausprägung des Items (𝑥 ) von Person i und Item j ermitteln: 𝑥 ∑ 𝑦 · 𝑎 bei einer Zweifaktorlösung: 𝑥 𝑦 ·𝑎 𝑦 ·𝑎 Faktorenwert Summenwert: die Itemwerte 𝑥 aller Personen werden aufsummiert (sinnvoll, wenn alle Faktoren aus derselbe Anzahl Items gebildet werden): 𝑦 ∑ 𝑥 Wert 𝑦 des Faktors p ergibt sich aus der Summe der Itemwerte j bis k eines Faktors p aller Personen Mittelwert: die Itemwerte 𝑥 aller Personen werden aufsummiert und durch die Anzahl der Items j bis k eines Faktors p dividiert (sinnvoll, wenn Faktoren aus unterschiedlicher Anzahl Items gebildet werden): 𝑦 ∑ 𝑥 31 31 Faktorenanalyse Exkurs: Korrelationsdarstellung in Vektordarstellung (1) Korrelationskoeffizienten lassen sich im Einheitskreis als Winkel darstellen, dabei gelten folgende Beziehungen: 𝑟 cos∢𝑥𝑦 und arccos 𝑟 ∢𝑥𝑦 Beispiel (Korrelationsmatrix mit umgerechneten Korrelationskoeffizienten): Unterhalb der Diagonale r, oberhalb der Diagonale arccos 𝑟 ∢𝑥𝑦 32 32 16 Wintersemester Faktorenanalyse Exkurs: Korrelationsdarstellung in Vektordarstellung (2) Faktor 2 BL1 – BL4 Faktor 1 VT1 – VT4 33 33 Faktorenanalyse Exkurs: Korrelationsdarstellung in Vektordarstellung (3) Faktor 2 BL1 – BL4 Faktor 1 VT1 – VT4 34 34 17

Use Quizgecko on...
Browser
Browser