Explorative und Konfirmatorische Faktorenanalyse

Name: Explorative und Konfirmatorische Faktorenanalyse
Uploaded: 2017-07-16T16:57:16+00:00
Duration: PTM22S12
Channel: Berlin Dung
Description: Explorative und Konfirmatorische Faktorenanalyse

Explorative und Konfirmatorische Faktorenanalyse
Seminar: Testkonstruktion Dozent: R. Leonhart Referentinnen: M. Albensöder, D. Greiff Albert-Ludwigs-Universität Freiburg Mittwoch,

Gliederung Exploratorische Faktorenanalyse (EFA)
Konfirmatorische Faktorenanalyse (CFA)

Exploratorische Faktorenanalyse
Wozu: Datenreduktion Rückführung von Zusammenhängen auf latente Variablen Komplexe Merkmalsbereiche homogen untergliedern Aufwand von Einzelanalysen sehr groß  Faktorenanalyse

Exploratorische Faktorenanalyse
„ Ein effektives Verfahren zur Beurteilung vieler einzelner Korrelationen stellt die FA dar, insbesondere dann, wenn man a priori keine Annahmen über die Struktur eines Konstruktes hat.“ (Bühner, S.151) Ordnung der Items nach korrelativer Ähnlichkeit Mitbestimmung der vorliegenden Stichprobe Reproduktion der Testwerte durch latente Variablen Zusammenhang von Item und Faktoren wird durch Ladungen bestimmt.

Exploratorische Faktorenanalyse Vorgehen:
Grundlegende Annahme: Modell mehrerer gemeinsamer Faktoren: Xim=fi1*am1+fi2*am2+fi3*am3….+fij*amj+….fiq*amq+ei Wobei: Xim = Wert einer Person i auf Item m fi1 = Faktorwert der Person i auf Faktor 1 am1 = Ladung des Items m auf Faktor 1 fij =Faktorwert der Person i auf Faktor j amj =Ladung des Items m auf Faktor j q = Anzahl der Faktoren ei = Fehlerkomponente, die durch Faktorenanzahl nicht erklärt werden kann  ohne die Fehlerkomponente: Komponentenmodell! „Eigenschaften, Merkmale oder Fähigkeiten einer Person können durch eine Kombination aus gewichteten Faktorwerten und einem Fehler beschrieben werden.“

Exploratorische Faktorenanalyse: Grundbegriffe der FA I
Zuordnung Variable zu Faktor: i.d.R. Zuweisung zu Faktor, auf dem höchste Ladung Ladung: bei orthogonaler Rotation entspricht die Ladung der Korrelation zwischen einem Item und einem Faktor die quadrierte Ladung daher bei orthogonaler Rotation gemeinsamer Varianzanteil zwischen Faktor und Variable Einfachstruktur: bezieht sich auf Struktur der Faktormatrix liegt vor, wenn Ladungen eines Items auf 1 Faktor sehr hoch und auf restlichen Faktoren sehr niedrig

Exploratorische Faktorenanalyse: Grundbegriffe der FA II
Kommunalität: die durch alle extrahierten Faktoren aufgeklärte Varianz eines Items (bei orthogonaler Rotation) ändert sich nicht durch Rotation- entspricht unrotierter Lösung, lediglich Varianzanteile auf den Faktoren ändern sich durch Rotation Je höher, desto besser durch Faktoren repräsentiert Mindestschätzung der Reliabilität Faktorwert: Wert einer Person auf einem Faktor. Mittelwert Faktor=0 nur exakt berechenbar bei PCA Unterscheidung Faktorwert und Summenwert

Exploratorische Faktorenanalyse: Grundbegriffe der FA III
Eigenwert: aufgeklärte Varianz eines Faktors über alle Items aufgeklärte Varianz gibt Wichtigkeit des Faktors wieder sinnvoll: aufgeklärte Varianz vor und nach der Rotation angeben Fehler: bezeichnet Messfehler eines Items Spezifität: systematische Varianz eines Items, die nicht durch extrahierte Faktoren erklärt wird Einzigartigkeit: Varianz des Items, dies mit keinem Testwert geteilt wird

Exploratorische Faktorenanalyse: Ladungsmatrix

Exploratorische Faktorenanalyse Methoden
Hauptachsenanalyse Maximum-Likelihood Analyse (ML) Hauptkomponentenanalyse (aber: nicht Methode im eigentlichen Sinn, dient nur zur Datenreduktion und Itembeschreibung

Exploratorische Faktorenanalyse: Geometrische Modelle
Veranschaulichungshilfe – was geschieht bei FA Wichtige Räume hierbei: * Personenraum: Die Achsen des Koordinaten- systems stellen hierbei n Versuchspersonen dar, die Punkte m Items * Faktorraum: Hierbei stellen die Achsen q Faktoren und die Punkte m Items dar. Die Items sind dabei mit der Vektorlänge von 1 normiert. Die q Faktoren bilden einen Unterraum des Personenraums!

Exploratorische Faktorenanalyse: Geometrische Modelle

Exploratorische Faktorenanalyse: Voraussetzung für die Berechnung
Linearität: Beeinflussbar durch: Ausreißerwerte Substanzielle Korrelationen Stichprobengröße und Itemanzahl  generell: Stabilität der Faktorlösung steigt mit Stichprobe ↑& Kommunalität / Reliabilität ↑

Exploratorische Faktorenanalyse: Welche Methode passt?
Hauptkomponentenanalyse (Principle Component Analysis-PCA): Ziel: Datenreduktion Ausgehend von der Annahme: Varianz eines Items wird vollständig durch Faktoren erklärt, weil Variablen frei von Messfehlern (Kommunalität wird auf 1 gesetzt) Nach Faktorenextraktion: Varianz = durch Faktoren erklärte V und Restvarianz Nur Aussagen über Verhältnisse in der Stichprobenkorrelationsmatrix Normalverteilung und Intervallskalenniveau sind keine Voraussetzung

Hauptachsenanalyse (Principle Axis Factor Analysis -PAF): Ziel: Rückführung von Zusammenhängen zwischen Items auf latente Variablen analysiert wird die Korrelationsmatrix zwischen den Variablen oder Items Kommunalitäten sind hier am Anfang die quadrierten multiplen Korrelationen – d.h. nur die Varianz, die Items gegenseitig auklären können. ist der PCA bei Schätzungen von Ladungen einer Grundgesamtheit überlegen es wird nur die Varianz faktorisiert, die durch alle anderen Variabeln vorhersagbar ist! Normalverteilung und Intervallskalenniveau sind keine Voraussetzung

Maximum-Likelihood FA (ML) Schätzung von Faktoren aus der beobachteten Stichproben Korrelationsmatrix, die möglichst viel Varianz in der Grundgesamtheit aufklären Daten unter Modellannahme betrachtet Modelltest χ2 –Test  entspricht Faktorenstruktur der Datenstruktur Durchführung mit ausreichend großer Stichprobe, da Populationsparameter geschätzt werden. alle eingehenden Variablen müssen multivariat-normalverteilt sein!

Fazit Methoden: Bei Normalverteilung und hohen Reliabilitäten und Kommunalitäten der Items kaum Unterschiede! Reliabilität gilt als guter Schätzer für die Kommunalitäten Bei einer Festsetzung der Kommunalität auf 1 (PCA) wird die Reliabilität überschätzt, bei quadrierten multiplen Korrelationen kommt es zu einer Mindestschätzung Ergebnisunterschiede bei explorativer und konfirmatorischer FA v.a. von Methodenwahl abhängig

Exploratorische Faktorenanalyse: Extraktionskriterien I
Problem: kein generell anerkanntes Abbruchkriterium während der Faktorenextraktion wichtig: inhaltliche Plausibilität Deshalb: Entwicklung von Methoden, durch die bestimmt werden kann, wie viele Faktoren zu berücksichtigen sind! Hypothetisches Modell: Bestimmt durch die Anzahl der Faktoren aus einer Theorie (a priori bekannt und vorgegeben)

Exploratorische Faktorenanalyse: Extraktionskriterien II
Eigenwert >1: Summe der quadrierten Ladungen über alle Items auf einem Faktor wichtig: inhaltliche Plausibilität Wichtigkeit eines Faktors Faktor soll zumindest so viel Varianz aufklären, wie eine einzige Variable Alle Faktoren, deren Eigenwert größer 1 sind bedeutsam Scree-Test nach Cattell: Suche nach einem bedeutsamen Eigenwertabfall Parallelanalyse nach Horn: Bildung von Eigenwerten aus normalverteilten Zufallsvariablen nach versch. Autoren beste Methode

Exploratorische Faktorenanalyse: Rotationstechniken I
es ändert sich nicht die Position des Items im Faktorraum sondern die Art, wie die Items durch die Faktoren beschrieben werden. i.d.R. soll eine eindeutige Beschreibung der Items durch Faktoren erzielt werden. daher zumeist Durchführung von Rotationen, die eine Einfachstruktur erzielen sollen. Fälle möglich, in denen sich die Technik aus den theoretischen Vorstellungen ergibt, z.B. bei a priori Annahmen

Exploratorische Faktorenanalyse: Rotationstechniken II
Orthogonale Rotationstechniken  führen zu unkorrelierten Faktoren Varimax Quartimax Equamax Oblique Rotationstechniken  führen zu korrelierten Faktoren Direct Oblimin Direct Quartimin Promax  Ausgabe 2er Matrizen: Mustermatrix u. Strukturmatrix

Exploratorische Faktorenanalyse: Rotationstechniken

Konfirmatorische Faktorenanalyse (CFA)
Weshalb CFA? Testung von theoretisch oder empirisch gut fundierter Modelle auf Modellgüte Basiert auf Weiterentwicklung der FA Erfassung latenter Variablen und Rückführung der Items (Indikatorvariablen) kausal möglich Analyse von Kovarianz und Korrelationsmatrizen Häufig Zusammenfassung mit Pfadanalysen zu „linearen Strukturgleichungsmodellen“ Im Gegensatz zur EFA keine Datenreduktion angestrebt, sondern nur Testung der Passung Basiert auf Weiterentwicklung der FA nach dem Modell gemeinsamer Faktoren Häufig Zusammenfassung mit Pfadanalysen zu „linearen Strukturgleichungsmodellen“ Pfadanalysen enthalten nur beobachtbare Variablen/Items CFA beinhalten auch nicht beobachtete/latente Variablen Im Gegensatz zur EFA keine Datenreduktion angestrebt, sondern nur Testung der Passung Ein Modell wird auf seine Übereinstimmung mit den Daten gestestet

Konfirmatorische Faktorenanalyse Unterschiede
CFA v.a. anzuwenden, wenn theoretisches Vorwissen über das zu testende Modell besteht nicht alle möglichen Ladungen (wie bei EFA) werden geschätzt, sondern nur die als relevant gesehenen Unterschied EFA – CFA: bei der EFA werden Ladungen auf dem eigenen als auch auf dem fremden Faktor zugelassen, bei der CFA nur auf einem Faktor! nicht alle möglichen Ladungen (wie bei EFA) werden geschätzt, sondern nur die als (theoretisch) relevant gesehenen

Konfirmatorische Faktorenanalyse Beispielvorgehen
Spezifizierung eines Modells Überprüfung der Nullhypothese mit Modelltest (S=K) Berechnung partieller Regressionsgewichte (Ladungen) und Korrelationen Modelle ohne latente Variable: Pfadanalyse Für Modelle ohne mit latenten Variable sehr kompliziert Grundgleichungen für Modell mit latenter Variable A= a11 * ξ + e B= a21 * ξ + e2 S = empirische Stichprobenkovarianz oder –korrelationsmatrix K = modelltheoretische Kovarianz oder –korrelationsmatrix des Modells --> Prüfung der Abweichungen zwischen S und K Berechnung partieller Regressionsgewichte (Ladungen) und Korrelationen Geben Zusammenhang zwischen latenten Variablen an und die Bedeutsamkeit der einzelnen Items für den jeweiligen Faktor Für Modelle mit latenten V. sehr kompliziert und iteratives Vorgehen erforderlich Für Modelle ohne latente Variablen nimmt man einfache Pfadanalyse A= a11 * ξ + e B= a21 * ξ + e2  Item A und B korrelieren miteinander, das wird auf die gemeinsame Variable ξ zurückgeführt a11 σA a: Ladungen e: Fehler σ: Fehlervarianz ξ: latente Variable Item A e1 ξ a21 σB Item B e2

Konfirmatorische Faktorenanalyse Schätzmethoden I
Es stehen unterschiedliche Verfahren zur Parameterschätzung zur Verfügung Maximum-Likelihood (ML) Wie wahrscheinlich ist das, was ich beobachte, wenn mein Modell gilt? Generalized Least Squares (GLS) Unweighted Least Squares (ULS)  Methoden minimieren die quadrierten Abweichungen zwischen beobachteter u. durch das Modell festgelegter Korrelations- o. Kovarianzmatrix Asymptotically Distribution-Free (ADF)  basierend auf einer speziellen Varianz-, Kovarianz u.GLS Schätzung Schätzmethoden: Versuch, die freien Parameter (Ladungen und Fehlervarianzen) so zu schätzen, dass sie möglichst gut der beobachteten Kovarianz- oder Korrelationsmatrix entsprechen Dazu wird eine gewisse Anzahl an Versuchen unternommen Maximum Likelihood (ML)  Likelihood Funktion beschreibt „die Wahrscheinlichkeit der beobachteten Testdaten unter der Bedingung des angenommenen Testmodells als Funktion der Modellparameter“ (Rost,1996)

Konfirmatorische Faktorenanalyse Schätzmethoden II
Auswahl der Schätzmethode abhängig von: Skalenqualität (ordinal – oder intervallskaliert) Art der Verteilung (normal vs. schief) Stichprobengröße Voraussetzung für ML und GLS multivariate Normalverteilung und Intervalldatenniveau auch bei geringer Stichprobengröße (N<100) möglich ADF nur bei extrem großen Stichproben, setzt aber formal keine Verteilungsannahmen voraus!!!

Konfirmatorische Faktorenanalyse Modelltestung I
Exakter Modell-Fit: χ² -Test mit folgenden Hypothesen: H0: Das Modell passt zur Datenstruktur (DS) H1: Das Modell weicht von der DS ab. Auswirkungen der Stichprobengröße Achtung: Annahme der Nullhypothese sprich nicht dafür, dass das Modell das „wahre Modell“ ist!! Je größer N, desto sensitiver wird derχ²-Test (kleinere Abweichungen führen zur Ablehnung von H0)

Konfirmatorische Faktorenanalyse Modelltestung II
Approximativer Modell-Fit: Fit Indizes Viele Fit-Indizes – können u.U. trotz großer Stichprobe stark variieren. Prüfen: Abweichung von einem Null-Model „Independence Modell“ „fully saturated „Modell Generell 2 Klassen von Fit-Indizes Absolute Fit-Indizes inkrementelle Fit-Indizes / komparative Fit-Indizes χ²-Test führt schnell zu Ablehnung von H0, deshalb benötigt man weitere Indizes zur Modelltestung Nullmodell: Alle Parameter sind auf 0 fixiert Independence Modell: Faktorladungen auf 1, Fehlervarianzen auf 0 gesetzt, alle Faktoren werden als unkorreliert angenommen Fully saturated Modell: repliziert exakt die Stichprobenkovarianz- bzw. Korrelationsmatrix Absolute Fit-Indizes Wie gut/schlecht reproduziert ein a-priori-Modell die Daten Wieviel Varianz der Gesamtvarianz wird durch das Modell erklärt inkrementelle Fit-Indizes / komparative Fit-Indizes Zeigen die proportionale Verbesserung der Anpassung gegenüber einem restriktiveren Modell (z.B. Nullmodell)

Konfirmatorische Faktorenanalyse Voraussetzungen
Kovarianzen oder Korrelationen Verteilungen Linearität Kollinearität Stichprobengröße Anzahl von Indikatoren pro latenter Variable Identifikation (unteridentifiziert, gerade identifiziert und überidentifiziert Verteilungen: für ML z.B. Normalverteilung nötig etc. Kollinearität = wenn zwei oder mehr Items sehr hoch miteinander korrelieren N = größer als bei explorativer FA (N= ) Anzahl von Indikatoren pro latenter Variable: Verhältnis von N zu Itemanzahl nicht kleiner als 5:1, besser 10:1 Mindestens 3 Items pro latente Variable Identifikation = lässt sich das Modell berechnen? Unteridentifiziert: mehr zu schätzende als bekannte Parameter es gibt unendlich viele Lösungen gerade identifiziert: zu schätzende Parameter = bekannte Parameter  es gibt nur 1 Lösung Überidentifiziert: mehr bekannte als zu schätzende Parameter  meist nur nährungsweise lösbar

Konfirmatorische Faktorenanalyse Testtheoretische Einbettung
CFA: Prüfung, ob Antworten oder Reaktionen von Personen in einer vorher spezifizierten Art einer latenten Variable zugeordnet werden können. Prüfung mit Signifikanztest und Modellgüteindizes Bedeutung für die Reliabilitätsberechnung Korrelierte Fehlervarianzen Minderungskorrigierte Korrelationen Zusammenfassung von Variablen oder Items Äquivalenz von Messungen Multi-Trait-Multi-Method-Ansatz Korrelierte Fehlervarianzen : Korrelation zw. Messfehler eines Tests x und eines Tests y = 0  CFA überprüft, ob diese Annahme verletzt ist Minderungskorrigierte Korrelationen Zusammenfassung von Variablen oder Items Äquivalenz von Messungen Multi-Trait-Multi-Method-Ansatz

Konfirmatorische Faktorenanalyse
Worauf muss ich besonders achten? genügend Items mit guten psychometrischen Eigenschaften gefährlich: sehr viele Pfade/Korrelationen/Kovarianzen sind anhand von Modifikationsindizes spezifiziert, so dass perfekter Modell-Fit – wenig aussagekräftig, wenn inhaltlich nicht gut begründbar Verteilungen vor Durchführung CFA inspizieren Interpretation mit mindestens 2 Fit-Indizes Guter Fit ergibt nur Aussage über die Modellübereinstimmung mit beobachteten Daten- sagt nichts über dessen Gültigkeit, außer Validitätskriterien fließen mit ein.

DANKE FÜR EURE AUFMERKSAMKEIT!

Explorative und Konfirmatorische Faktorenanalyse

Ähnliche Präsentationen

Präsentation zum Thema: "Explorative und Konfirmatorische Faktorenanalyse"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Explorative und Konfirmatorische Faktorenanalyse

Ähnliche Präsentationen

Präsentation zum Thema: "Explorative und Konfirmatorische Faktorenanalyse"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback