Explorative und Konfirmatorische Faktorenanalyse

Slides:

Advertisements

Ähnliche Präsentationen

Faktorenanalyse.

Advertisements

T - Test Prüfung des Mittelwerteunterschieds bei abhängigen und unabhängigen Stichproben.

Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.

Grundlagen, zentrale Begriffe & Einführung in die Faktorenanalyse

Theorie psychometrischer Tests, III

Forschungsstrategien Johannes Gutenberg Universität Mainz

Thema der Stunde I. Einführung in die Varianzanalyse:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Strukturgleichungsmodelle

Forschungsstatistik II

Forschungsstatistik II

Klassische Testtheorie

Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.

Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.

Seminar Lehrevaluation

A-Priori Kontraste Prüfung des Mittelwerteunterschieds von Faktorstufen bzw. Kombinationen von Faktorstufen: z.B.: oder.

Der Binomialtest Man habe einen wahren Anteil P.

Übung zur Vorlesung Theorien Psychometrischer Tests I

Hypothesen testen: Grundidee

K. Desch - Statistik und Datenanalyse SS05

Reliabilitätsanalysen

Latente Variablen – Kennwerte zur Beurteilung von Modellen

Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,

Wiederholung Faktorenanalyse

Strukturgleichungsmodelle

Statistische Methoden I SS 2005 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

Statistische Methoden II SS 2003 Vorlesung:Prof. Dr. Michael Schürmann Zeit:Freitag (Pause: ) Ort:Hörsaal Loefflerstraße Übungen.

III. Induktive Statistik

Maximum-Likelihood-Schätzer ( diskreter Fall) Likelihood-Funktion mit oder M-L-Schätzer.

Unser letztes Tutorium

Unser letztes Tutorium Output – das Modell gut11 gut12 gut21 gut22 gut31 gut32 state1 state2 state3 XI MF

Unser schönstes Tutorium Materialien unter:

Einführung in die Metaanalyse

Eigenschaften der OLS-Schätzer

Probleme der Modellspezifikation

Multikollinearität Wann spricht man von Multikollinearität?

Deutsch als Zweitsprache: Experimentelle Methoden WS 2013/2014

Ausgleichungsrechnung I

Ausgleichungsrechnung II

Regionalisierte Variablen und Kriging

Das Allgemeine Lineare Modell (ALM)

Statistik: Mehr zur Regression.

STATISIK LV Nr.: 0021 WS 2005/ November 2005.

Theorie psychometrischer Tests, IV

Multivariate Statistische Verfahren

Forschungsmethodik II, SS 2010 Vesna Pavlovski & Julia Pichlhöfer

Testtheorie (Vorlesung 7: ) Rekapitulation: Modellierungsansatz

setzt Linearität des Zusammenhangs voraus

2.5.2 Multivariate Monte Carlo-Simulation

Varianzanalyse und Eta²

Thema der Stunde I. Die Form der Stichprobenkennwerteverteilung

Die Faktorenanalyse.

Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

Faktorenanalyse Tamara Katschnig.

Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung

Geoinformationssysteme

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.

Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.

Außenhandelsbeziehungen zwischen China, USA, EU Makroökonometrie Vorlesung Dr. Oliver Bode.

Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Kapitel 2: Testtheorie / Testmodelle

Präsentation transkript:

Explorative und Konfirmatorische Faktorenanalyse Seminar: Testkonstruktion Dozent: R. Leonhart Referentinnen: M. Albensöder, D. Greiff Albert-Ludwigs-Universität Freiburg Mittwoch, 14.06.2006

Gliederung Exploratorische Faktorenanalyse (EFA) Konfirmatorische Faktorenanalyse (CFA)

Exploratorische Faktorenanalyse Wozu: Datenreduktion Rückführung von Zusammenhängen auf latente Variablen Komplexe Merkmalsbereiche homogen untergliedern Aufwand von Einzelanalysen sehr groß  Faktorenanalyse

Exploratorische Faktorenanalyse „ Ein effektives Verfahren zur Beurteilung vieler einzelner Korrelationen stellt die FA dar, insbesondere dann, wenn man a priori keine Annahmen über die Struktur eines Konstruktes hat.“ (Bühner, S.151) Ordnung der Items nach korrelativer Ähnlichkeit Mitbestimmung der vorliegenden Stichprobe Reproduktion der Testwerte durch latente Variablen Zusammenhang von Item und Faktoren wird durch Ladungen bestimmt.

Exploratorische Faktorenanalyse Vorgehen: Grundlegende Annahme: Modell mehrerer gemeinsamer Faktoren: Xim=fi1*am1+fi2*am2+fi3*am3….+fij*amj+….fiq*amq+ei Wobei: Xim = Wert einer Person i auf Item m fi1 = Faktorwert der Person i auf Faktor 1 am1 = Ladung des Items m auf Faktor 1 fij =Faktorwert der Person i auf Faktor j amj =Ladung des Items m auf Faktor j q = Anzahl der Faktoren ei = Fehlerkomponente, die durch Faktorenanzahl nicht erklärt werden kann  ohne die Fehlerkomponente: Komponentenmodell! „Eigenschaften, Merkmale oder Fähigkeiten einer Person können durch eine Kombination aus gewichteten Faktorwerten und einem Fehler beschrieben werden.“

Exploratorische Faktorenanalyse: Grundbegriffe der FA I Zuordnung Variable zu Faktor: i.d.R. Zuweisung zu Faktor, auf dem höchste Ladung Ladung: bei orthogonaler Rotation entspricht die Ladung der Korrelation zwischen einem Item und einem Faktor die quadrierte Ladung daher bei orthogonaler Rotation gemeinsamer Varianzanteil zwischen Faktor und Variable Einfachstruktur: bezieht sich auf Struktur der Faktormatrix liegt vor, wenn Ladungen eines Items auf 1 Faktor sehr hoch und auf restlichen Faktoren sehr niedrig

Exploratorische Faktorenanalyse: Grundbegriffe der FA II Kommunalität: die durch alle extrahierten Faktoren aufgeklärte Varianz eines Items (bei orthogonaler Rotation) ändert sich nicht durch Rotation- entspricht unrotierter Lösung, lediglich Varianzanteile auf den Faktoren ändern sich durch Rotation Je höher, desto besser durch Faktoren repräsentiert Mindestschätzung der Reliabilität Faktorwert: Wert einer Person auf einem Faktor. Mittelwert Faktor=0 nur exakt berechenbar bei PCA Unterscheidung Faktorwert und Summenwert

Exploratorische Faktorenanalyse: Grundbegriffe der FA III Eigenwert: aufgeklärte Varianz eines Faktors über alle Items aufgeklärte Varianz gibt Wichtigkeit des Faktors wieder sinnvoll: aufgeklärte Varianz vor und nach der Rotation angeben Fehler: bezeichnet Messfehler eines Items Spezifität: systematische Varianz eines Items, die nicht durch extrahierte Faktoren erklärt wird Einzigartigkeit: Varianz des Items, dies mit keinem Testwert geteilt wird

Exploratorische Faktorenanalyse: Ladungsmatrix

Exploratorische Faktorenanalyse Methoden Hauptachsenanalyse Maximum-Likelihood Analyse (ML) Hauptkomponentenanalyse (aber: nicht Methode im eigentlichen Sinn, dient nur zur Datenreduktion und Itembeschreibung

Exploratorische Faktorenanalyse: Geometrische Modelle Veranschaulichungshilfe – was geschieht bei FA Wichtige Räume hierbei: * Personenraum: Die Achsen des Koordinaten- systems stellen hierbei n Versuchspersonen dar, die Punkte m Items * Faktorraum: Hierbei stellen die Achsen q Faktoren und die Punkte m Items dar. Die Items sind dabei mit der Vektorlänge von 1 normiert. Die q Faktoren bilden einen Unterraum des Personenraums!

Exploratorische Faktorenanalyse: Geometrische Modelle

Exploratorische Faktorenanalyse: Voraussetzung für die Berechnung Linearität: Beeinflussbar durch: Ausreißerwerte Substanzielle Korrelationen Stichprobengröße und Itemanzahl  generell: Stabilität der Faktorlösung steigt mit Stichprobe ↑& Kommunalität / Reliabilität ↑

Exploratorische Faktorenanalyse: Welche Methode passt? Hauptkomponentenanalyse (Principle Component Analysis-PCA): Ziel: Datenreduktion Ausgehend von der Annahme: Varianz eines Items wird vollständig durch Faktoren erklärt, weil Variablen frei von Messfehlern (Kommunalität wird auf 1 gesetzt) Nach Faktorenextraktion: Varianz = durch Faktoren erklärte V und Restvarianz Nur Aussagen über Verhältnisse in der Stichprobenkorrelationsmatrix Normalverteilung und Intervallskalenniveau sind keine Voraussetzung

Exploratorische Faktorenanalyse: Welche Methode passt? Hauptachsenanalyse (Principle Axis Factor Analysis -PAF): Ziel: Rückführung von Zusammenhängen zwischen Items auf latente Variablen analysiert wird die Korrelationsmatrix zwischen den Variablen oder Items Kommunalitäten sind hier am Anfang die quadrierten multiplen Korrelationen – d.h. nur die Varianz, die Items gegenseitig auklären können. ist der PCA bei Schätzungen von Ladungen einer Grundgesamtheit überlegen es wird nur die Varianz faktorisiert, die durch alle anderen Variabeln vorhersagbar ist! Normalverteilung und Intervallskalenniveau sind keine Voraussetzung

Exploratorische Faktorenanalyse: Welche Methode passt? Maximum-Likelihood FA (ML) Schätzung von Faktoren aus der beobachteten Stichproben Korrelationsmatrix, die möglichst viel Varianz in der Grundgesamtheit aufklären Daten unter Modellannahme betrachtet Modelltest χ2 –Test  entspricht Faktorenstruktur der Datenstruktur Durchführung mit ausreichend großer Stichprobe, da Populationsparameter geschätzt werden. alle eingehenden Variablen müssen multivariat-normalverteilt sein!

Exploratorische Faktorenanalyse: Welche Methode passt? Fazit Methoden: Bei Normalverteilung und hohen Reliabilitäten und Kommunalitäten der Items kaum Unterschiede! Reliabilität gilt als guter Schätzer für die Kommunalitäten Bei einer Festsetzung der Kommunalität auf 1 (PCA) wird die Reliabilität überschätzt, bei quadrierten multiplen Korrelationen kommt es zu einer Mindestschätzung Ergebnisunterschiede bei explorativer und konfirmatorischer FA v.a. von Methodenwahl abhängig

Exploratorische Faktorenanalyse: Extraktionskriterien I Problem: kein generell anerkanntes Abbruchkriterium während der Faktorenextraktion wichtig: inhaltliche Plausibilität Deshalb: Entwicklung von Methoden, durch die bestimmt werden kann, wie viele Faktoren zu berücksichtigen sind! Hypothetisches Modell: Bestimmt durch die Anzahl der Faktoren aus einer Theorie (a priori bekannt und vorgegeben)

Exploratorische Faktorenanalyse: Extraktionskriterien II Eigenwert >1: Summe der quadrierten Ladungen über alle Items auf einem Faktor wichtig: inhaltliche Plausibilität Wichtigkeit eines Faktors Faktor soll zumindest so viel Varianz aufklären, wie eine einzige Variable Alle Faktoren, deren Eigenwert größer 1 sind bedeutsam Scree-Test nach Cattell: Suche nach einem bedeutsamen Eigenwertabfall Parallelanalyse nach Horn: Bildung von Eigenwerten aus normalverteilten Zufallsvariablen nach versch. Autoren beste Methode

Exploratorische Faktorenanalyse: Rotationstechniken I es ändert sich nicht die Position des Items im Faktorraum sondern die Art, wie die Items durch die Faktoren beschrieben werden. i.d.R. soll eine eindeutige Beschreibung der Items durch Faktoren erzielt werden. daher zumeist Durchführung von Rotationen, die eine Einfachstruktur erzielen sollen. Fälle möglich, in denen sich die Technik aus den theoretischen Vorstellungen ergibt, z.B. bei a priori Annahmen

Exploratorische Faktorenanalyse: Rotationstechniken II Orthogonale Rotationstechniken  führen zu unkorrelierten Faktoren Varimax Quartimax Equamax Oblique Rotationstechniken  führen zu korrelierten Faktoren Direct Oblimin Direct Quartimin Promax  Ausgabe 2er Matrizen: Mustermatrix u. Strukturmatrix

Exploratorische Faktorenanalyse: Rotationstechniken

Konfirmatorische Faktorenanalyse (CFA) Weshalb CFA? Testung von theoretisch oder empirisch gut fundierter Modelle auf Modellgüte Basiert auf Weiterentwicklung der FA Erfassung latenter Variablen und Rückführung der Items (Indikatorvariablen) kausal möglich Analyse von Kovarianz und Korrelationsmatrizen Häufig Zusammenfassung mit Pfadanalysen zu „linearen Strukturgleichungsmodellen“ Im Gegensatz zur EFA keine Datenreduktion angestrebt, sondern nur Testung der Passung Basiert auf Weiterentwicklung der FA nach dem Modell gemeinsamer Faktoren Häufig Zusammenfassung mit Pfadanalysen zu „linearen Strukturgleichungsmodellen“ Pfadanalysen enthalten nur beobachtbare Variablen/Items CFA beinhalten auch nicht beobachtete/latente Variablen Im Gegensatz zur EFA keine Datenreduktion angestrebt, sondern nur Testung der Passung Ein Modell wird auf seine Übereinstimmung mit den Daten gestestet

Konfirmatorische Faktorenanalyse Unterschiede CFA v.a. anzuwenden, wenn theoretisches Vorwissen über das zu testende Modell besteht nicht alle möglichen Ladungen (wie bei EFA) werden geschätzt, sondern nur die als relevant gesehenen Unterschied EFA – CFA: bei der EFA werden Ladungen auf dem eigenen als auch auf dem fremden Faktor zugelassen, bei der CFA nur auf einem Faktor! nicht alle möglichen Ladungen (wie bei EFA) werden geschätzt, sondern nur die als (theoretisch) relevant gesehenen

Konfirmatorische Faktorenanalyse Beispielvorgehen Spezifizierung eines Modells Überprüfung der Nullhypothese mit Modelltest (S=K) Berechnung partieller Regressionsgewichte (Ladungen) und Korrelationen Modelle ohne latente Variable: Pfadanalyse Für Modelle ohne mit latenten Variable sehr kompliziert Grundgleichungen für Modell mit latenter Variable A= a11 * ξ + e1 B= a21 * ξ + e2 S = empirische Stichprobenkovarianz oder –korrelationsmatrix K = modelltheoretische Kovarianz oder –korrelationsmatrix des Modells --> Prüfung der Abweichungen zwischen S und K Berechnung partieller Regressionsgewichte (Ladungen) und Korrelationen Geben Zusammenhang zwischen latenten Variablen an und die Bedeutsamkeit der einzelnen Items für den jeweiligen Faktor Für Modelle mit latenten V. sehr kompliziert und iteratives Vorgehen erforderlich Für Modelle ohne latente Variablen nimmt man einfache Pfadanalyse A= a11 * ξ + e1 B= a21 * ξ + e2  Item A und B korrelieren miteinander, das wird auf die gemeinsame Variable ξ zurückgeführt a11 σA a: Ladungen e: Fehler σ: Fehlervarianz ξ: latente Variable Item A e1 ξ a21 σB Item B e2

Konfirmatorische Faktorenanalyse Schätzmethoden I Es stehen unterschiedliche Verfahren zur Parameterschätzung zur Verfügung Maximum-Likelihood (ML) Wie wahrscheinlich ist das, was ich beobachte, wenn mein Modell gilt? Generalized Least Squares (GLS) Unweighted Least Squares (ULS)  Methoden minimieren die quadrierten Abweichungen zwischen beobachteter u. durch das Modell festgelegter Korrelations- o. Kovarianzmatrix Asymptotically Distribution-Free (ADF)  basierend auf einer speziellen Varianz-, Kovarianz u.GLS Schätzung Schätzmethoden: Versuch, die freien Parameter (Ladungen und Fehlervarianzen) so zu schätzen, dass sie möglichst gut der beobachteten Kovarianz- oder Korrelationsmatrix entsprechen Dazu wird eine gewisse Anzahl an Versuchen unternommen Maximum Likelihood (ML)  Likelihood Funktion beschreibt „die Wahrscheinlichkeit der beobachteten Testdaten unter der Bedingung des angenommenen Testmodells als Funktion der Modellparameter“ (Rost,1996)

Konfirmatorische Faktorenanalyse Schätzmethoden II Auswahl der Schätzmethode abhängig von: Skalenqualität (ordinal – oder intervallskaliert) Art der Verteilung (normal vs. schief) Stichprobengröße Voraussetzung für ML und GLS multivariate Normalverteilung und Intervalldatenniveau auch bei geringer Stichprobengröße (N<100) möglich ADF nur bei extrem großen Stichproben, setzt aber formal keine Verteilungsannahmen voraus!!!

Konfirmatorische Faktorenanalyse Modelltestung I Exakter Modell-Fit: χ² -Test mit folgenden Hypothesen: H0: Das Modell passt zur Datenstruktur (DS) H1: Das Modell weicht von der DS ab. Auswirkungen der Stichprobengröße Achtung: Annahme der Nullhypothese sprich nicht dafür, dass das Modell das „wahre Modell“ ist!! Je größer N, desto sensitiver wird derχ²-Test (kleinere Abweichungen führen zur Ablehnung von H0)

Konfirmatorische Faktorenanalyse Modelltestung II Approximativer Modell-Fit: Fit Indizes Viele Fit-Indizes – können u.U. trotz großer Stichprobe stark variieren. Prüfen: Abweichung von einem Null-Model „Independence Modell“ „fully saturated „Modell Generell 2 Klassen von Fit-Indizes Absolute Fit-Indizes inkrementelle Fit-Indizes / komparative Fit-Indizes χ²-Test führt schnell zu Ablehnung von H0, deshalb benötigt man weitere Indizes zur Modelltestung Nullmodell: Alle Parameter sind auf 0 fixiert Independence Modell: Faktorladungen auf 1, Fehlervarianzen auf 0 gesetzt, alle Faktoren werden als unkorreliert angenommen Fully saturated Modell: repliziert exakt die Stichprobenkovarianz- bzw. Korrelationsmatrix Absolute Fit-Indizes Wie gut/schlecht reproduziert ein a-priori-Modell die Daten Wieviel Varianz der Gesamtvarianz wird durch das Modell erklärt inkrementelle Fit-Indizes / komparative Fit-Indizes Zeigen die proportionale Verbesserung der Anpassung gegenüber einem restriktiveren Modell (z.B. Nullmodell)

Konfirmatorische Faktorenanalyse Voraussetzungen Kovarianzen oder Korrelationen Verteilungen Linearität Kollinearität Stichprobengröße Anzahl von Indikatoren pro latenter Variable Identifikation (unteridentifiziert, gerade identifiziert und überidentifiziert Verteilungen: für ML z.B. Normalverteilung nötig etc. Kollinearität = wenn zwei oder mehr Items sehr hoch miteinander korrelieren N = größer als bei explorativer FA (N=200-250) Anzahl von Indikatoren pro latenter Variable: Verhältnis von N zu Itemanzahl nicht kleiner als 5:1, besser 10:1 Mindestens 3 Items pro latente Variable Identifikation = lässt sich das Modell berechnen? Unteridentifiziert: mehr zu schätzende als bekannte Parameter es gibt unendlich viele Lösungen gerade identifiziert: zu schätzende Parameter = bekannte Parameter  es gibt nur 1 Lösung Überidentifiziert: mehr bekannte als zu schätzende Parameter  meist nur nährungsweise lösbar

Konfirmatorische Faktorenanalyse Testtheoretische Einbettung CFA: Prüfung, ob Antworten oder Reaktionen von Personen in einer vorher spezifizierten Art einer latenten Variable zugeordnet werden können. Prüfung mit Signifikanztest und Modellgüteindizes Bedeutung für die Reliabilitätsberechnung Korrelierte Fehlervarianzen Minderungskorrigierte Korrelationen Zusammenfassung von Variablen oder Items Äquivalenz von Messungen Multi-Trait-Multi-Method-Ansatz Korrelierte Fehlervarianzen : Korrelation zw. Messfehler eines Tests x und eines Tests y = 0  CFA überprüft, ob diese Annahme verletzt ist Minderungskorrigierte Korrelationen Zusammenfassung von Variablen oder Items Äquivalenz von Messungen Multi-Trait-Multi-Method-Ansatz

Konfirmatorische Faktorenanalyse Worauf muss ich besonders achten? genügend Items mit guten psychometrischen Eigenschaften gefährlich: sehr viele Pfade/Korrelationen/Kovarianzen sind anhand von Modifikationsindizes spezifiziert, so dass perfekter Modell-Fit – wenig aussagekräftig, wenn inhaltlich nicht gut begründbar Verteilungen vor Durchführung CFA inspizieren Interpretation mit mindestens 2 Fit-Indizes Guter Fit ergibt nur Aussage über die Modellübereinstimmung mit beobachteten Daten- sagt nichts über dessen Gültigkeit, außer Validitätskriterien fließen mit ein.

DANKE FÜR EURE AUFMERKSAMKEIT!