Faktorenanalyse.

Slides:



Advertisements
Ähnliche Präsentationen
Tutorat Statistik II im SS 09 ANCOVA & Faktorenanalyse
Advertisements

Die Faktorenanalyse Es werden zwei Arten unterschieden:
Heute 1.F – Test zur Varianzhomogenität 2.Bartlett-Test zur Varianzhomogenität 3.Chi – Quadrat Tests für Häufigkeiten 4.Chi – Quadrat Tests zur Verteilungsanpassung.
Grundlagen, zentrale Begriffe & Einführung in die Faktorenanalyse
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Einfaktorielle Varianzanalyse
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Forschungsstatistik II
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Seminar Lehrevaluation
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Mehrfachregressionen
Hypothesen testen: Grundidee
Struktur und Funktion von Biopolymeren Elmar Lang
Herzlich willkommen beim 1. Workshop der AG Methodik
Explorative und Konfirmatorische Faktorenanalyse
Effektgrößen, Kontraste & Post-hoc-Tests
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Wiederholung Faktorenanalyse
Strukturgleichungsmodelle
Konfidenzintervalle Intervallschätzung
Tutorium
Tutorium
Tutorium
Unser letztes Tutorium
Unser letztes Tutorium Output – das Modell gut11 gut12 gut21 gut22 gut31 gut32 state1 state2 state3 XI MF
Unser schönstes Tutorium Materialien unter:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Multikollinearität Wann spricht man von Multikollinearität?
Partielle Autokorrelation
Chi Quadrat Test Tamara Katschnig.
Faktorenanalyse Einführung Hauptachsen Voraussetzungen Berechnung
Die Faktorenanalyse.
Theoriereferat Indexes, Scales and Typologies The Logic of Sampling
Kapitel 10 Multikollinearität
Theorie psychometrischer Tests, IV
„Postmaterielle Werte“
Multivariate Statistische Verfahren
Empirische Sozialforschung am Beispiel der Limburger Nordstadt
Soziale Urteilsbildung Lozo, Soziale Urteilsbildung, AE Sozialpsychologie, SS 2004 Laienhafte Inferenzstrategien oder „the intuitive psychologist“ 2: Urteilsheuristiken.
setzt Linearität des Zusammenhangs voraus
Varianzanalyse und Eta²
Thema der Stunde Varianzanalyse mit Messwiederholung
Die Faktorenanalyse.
Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann
Faktorenanalyse Tamara Katschnig.
Geostatistik Kriging Sarah Böckmann.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Der Wiener Prozess und seltene Ereignisse
EIN NEUES ENSEMBLE- KLASSIFIKATIONSVERFAHREN Tim Schneider Rotation Forest.
Programmiersprachen II Fortsetzung Datenstrukturen Balancierte Bäume 3 Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
Univ.-Prof. Dr. L. Müller-HagedornSofia 2007 Marketing 1 Kapitel 4 Nach der Bearbeitung des 4. Kapitels sollten Sie in der Lage sein, q Kennzahlen aufzuzeigen,
Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Grafische Darstellung von Gruppenunterschieden.
Lineare Optimierung Nakkiye Günay, Jennifer Kalywas & Corina Unger Jetzt erkläre ich euch die einzelnen Schritte und gebe Tipps!
- Seite 1 TIME INTELLIGENCE ® by Titel.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Faktorenanalyse

explorative vs. konfirmatorische Faktorenanalyse Explorative FA dienen dem Auffinden von Faktoren in einem Datensatz. In vielen Iterationen (Schleifen) wird nach der besten Lösung gesucht. Konfirmatorische FA überprüfen, ob empirisch erhobene Daten ein bestehendes theoretisches Modell bestätigen oder verwerfen. Alternativ kann eine explorative FA an einer anderen Stichprobe „kreuzvalidiert“ werden.

Faktorenanalyse: Was und wozu? Der Begriff Faktorenanalyse umfasst eine Gruppe multivariater Analyseverfahren, mit denen zugrundeliegende gemeinsame Dimensionen von Variablenmengen (z.B. Fragebogenitems) untersucht werden. Die Faktorenanalyse führt zu einer Datenreduktion: Die Variation in einer Vielzahl von Variablen wird auf eine geringere Zahl von gemeinsamen Faktoren zurückgeführt.

Exploratorische Faktorenanalyse Bei einer exploratorischen Faktorenanalyse existieren im „Idealfall“ keine Annahmen darüber, wie viele Faktoren den Variablen zugrunde liegen und welche Struktur die Zusammenhänge zwischen den Variablen haben. In der Praxis ist das natürlich fast nie der Fall; z.B. vermuten wir vorab, dass unseren Fragebögen nur eine einzige latente Dimension zugrunde liegt.

Exploratorische Faktorenanalyse Im Rahmen der exploratorischen Faktorenanalyse gehen wir, der Natur der Methode entsprechend, trotzdem „naiv“ vor. Die Fragen, welche am Ende der Analyse beantwortet sein sollen, sind: Wie viele Faktoren sind angemessen, um die Zusammenhänge zwischen den untersuchten Variablen zu erklären? Welche der Faktoren beeinflussen welche meiner Variablen?

Faktorenanalyse im Bild Items: manifest (eckig) Faktoren: latent (rund)

Voraussetzungen der Faktorenanalyse intervallskalierte Variablen normalverteilte Variablen n pro Variable mindestens 3 substanzielle Korrelationen im Datensatz dichotome Variablen (0/1) mit Einschränkungen verwendbar

Wesentliche Konzepte der Faktorenanalyse: Faktor viele Variablen werden durch wenige Faktoren ersetzt ein Faktor enthält die Information mehrerer Variablen Faktor: theoretische Variable oder Konstrukt, das allen wechselseitig hoch korrelierenden Variablen zu Grundeliegt Ergebnis der Faktorenanalyse: wechselseitig voneinander unabhängige Faktoren, die die Zusammenhänge zwischen den Variablen beschreiben oder erklären

Wesentliche Konzepte der Faktorenanalyse: Faktorladung Korrelation einer Variablen mit einem Faktor Wertebereich: -1 bis +1 „Variable lädt hoch oder niedrig auf diesem Faktor“ über die Faktorladungen wird definiert, welche Variable zu welchem Faktor „gehört“ und damit auch, was jeder Faktor bedeutet

Wesentliche Konzepte der Faktorenanalyse: Kommunalität Die Kommunalität einer Variablen gibt an, in welchem Ausmaß die Varianz dieser Variablen durch die Faktoren erfasst / erklärt / aufgeklärt wird. Summe der quadrierten Ladungen einer Variablen über alle Faktoren Maximum: 1 (da die Gesamtvarianz jeder Variablen auf 1normiert ist)

wesentliche Konzepte der Faktorenanalyse: Faktorwert kennzeichnet die Position einer Person auf einem Faktor Wertebereich: standardisierte Werte mit M = 0, s = 1 (pro Faktor). Wie sehr weist eine Person die Eigenschaften des Faktors auf?

Wesentliche Konzepte der Faktorenanalyse: Eigenwert Faktor gibt an, wie viel von der Gesamtvarianz aller Variablen durch diesen Faktor erklärt wird Summe der quadrierten Ladungen aller Variablen auf diesem Faktor 0 - Max: (entspricht der Anzahl an Variablen)

Schematische Veranschaulichung der Beziehungen von Faktorladungen, Kommunalitäten und Eigenwerten anhand des Ladungsmusters von vier Variablen auf zwei Faktoren. Ladungsmatrix A

Fundamentaltheorem der Faktorenanalyse Ein beobachteter (standardisierter) Wert zij einer Person i in Variable j kann in eine Linearkombination aus den mit den Faktorladungen akj gewichteten Faktorwerten fik und einer Fehlerkomponente eij zerlegt werden. Gleichung für Person i: zij=aj fi +aj fi2+ajk fik+...+ajq fiq+eij zij = der Wert der Person i in der beobachteten Variablen j; ajk = Ladung der Variablen j auf Faktor k; fik= Faktorwert der Person i in Faktor k; eij = durch die Faktoren nicht erklärte Fehlerkomponente; q = Anzahl der Faktoren (k = 1, …, q)

Faktorenextraktion Die Faktorenextraktion erfolgt nach dem Kriterium, dass jeder Faktor sukzessiv so viel Varianz in den untersuchten Variablen erklärt wie möglich. Jeder neue Faktor erklärt dabei nur Varianz, die von den zuvor extrahierten Faktoren nicht erklärt wurde. Zur Faktorenextraktion stehen verschiedene Verfahren zur Verfügung. Die beiden bedeutendsten sind die Hauptkomponentenanalyse (principal components analysis, PCA) und die Hauptachsenanalyse (principal axes factor analysis, PFA). Beide Verfahren unterscheiden sich vor allem hinsichtlich der Annahmen bezüglich der durch die Faktoren in den Variablen erklärbaren Varianz.

Bestimmung der Faktorzahl I Kaiser-Guttman-Regel (Eigenwertkriterium) Alle Faktoren mit einem Eigenwert größer 1 werden aufgenommen. Somit erklärt ein Faktor immer mehr Varianz als eine ursprüngliche Variable.

Bestimmung der Faktorzahl II Kriterium der extrahierten Varianz Durch Vorüberlegungen kann festgelegt werden, wie groß der Anteil der extrahierten Varianz durch die aufgenommenen Faktoren sein soll.

3 Faktoren klären über 50% der Merkmals-varianz auf. Kaiser-Guttman Kriterium 10 Faktoren klären über 90% der Merkmalsvarianz auf. Eigenwerte

Bestimmung der Faktorzahl III Screeplot Über den „Knick“ im Verlauf der Eigenwerte wird entschieden, wie viele Faktoren extrahiert werden. Im Beispiel würde man sich für 2 Faktoren entscheiden.

Das Rotationsproblem Die Position der Faktoren ist zunächst nach Maximierung der Varianzaufklärung gewählt. Nach Bestimmung von Zahl (und Lage) der Faktoren ist eine Rotation um den Ursprung ohne Informationsverlust möglich. Ziel: Einfachstruktur, d.h. hohe Ladung der Faktoren auf einigen Variablen, niedrige auf den anderen.

Vor der Rotation Variablen sind nur schwer zuzuordnen

Nach der Rotation Problem der Zuordnung nur noch bei der Variablen Leistungsbereitschaft

Rotationsvarianten Orthogonale Rotation: Die Faktoren werden rechtwinklig rotiert. Vorteil: Faktoren sind voneinander unabhängig. Oblique Rotation: Die Faktoren werden schiefwinklig rotiert. Vorteil: Über die Faktoren kann eine Faktorenanalyse zweiter Ordnung berechnet werden.

Faktorenrotation Gebräuchliche orthogonale Rotationstechniken Varimax: Maximiert die Varianz der quadrierten Faktorladungen innerhalb der Faktoren. Varimax ist der am häufigsten verwendete orthogonale Rotationsalgorithmus. Quartimax: Maximiert die Summe der vierten Potenz aller Faktorladungen. Es wird angestrebt, einen Faktor mit vielen hohen und mittleren Ladungen sowie verbleibende Faktoren mit wenigen hohen und sonst niedrigen Ladungen zu erhalten. Dieses Verfahren kann angezeigt sein, wenn ein gemeinsamer Generalfaktor erwartet wird.

Faktorenrotation Gebräuchliche oblique Rotationstechniken Promax: Dieser Algorithmus startet mit einer orthogonalen Rotation und transformiert die Faktoren anschließend in eine oblique Lösung mit dem Ziel, die absoluten Werte der Primärladungen zu maximieren und die Sekundärladungen gegen Null gehen zu lassen Direct Oblimin: Ein Rotationsalgorithmus, der die simultane Optimierung eines orthogonalen und eines obliquen Rotationskriteriums anstrebt. Bei beiden obliquen Rotationsverfahren kann die Höhe der Faktorinterkorrelationen vom Benutzer beeinflusst werden.

Interpretation der Faktoren Die berechneten Faktoren müssen inhaltlich interpretiert werden. Die Faktorenanalyse bietet die Faktorladungen der Variablen an, kann Faktoren aber nicht benennen oder interpretieren.

Formen der FA „Kommunalitätsproblem“: Wie viel Varianz von jeder Variablen wird zu Beginn der FA aufgeklärt, also bevor die endgültige Lage der Faktoren bekannt ist? Wenn die Variable selbst als Faktor berücksichtigt wird: 100% h² = 1 Wenn nur die anderen Variablen berücksichtigt werden: weniger h² < 1 Bei der Hauptkomponentenanalyse (PCA = Principal Component Analysis) wird zu Beginn des Optimierungsprozesses eine Kommunalität von 1 angenommen. Bei der Hauptachsenanalyse wird zu Beginn des Optimierungsprozesses die Kommunalität für jede Variable geschätzt

Zusammenfassung Kommunalitäten: Summe der quadrierten Korrelationen einer Variable mit allen Faktoren; Prozentsatz der durch alle Faktoren beschriebenen Varianz einer Variablen Faktorladungen: Korrelation einer Variablen mit einem Faktor Faktorwerte: Kennzeichnet die Ausprägung eines Faktors für eine Person Eigenwert: Gesamtvarianz aller Variablen, die durch den Faktor aufgeklärt wird