Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

Slides:



Advertisements
Ähnliche Präsentationen
Faktorenanalyse.
Advertisements

Statistik-Tutorat SS 2009 Christina
Die Faktorenanalyse Es werden zwei Arten unterschieden:
Mittlere absolute Abweichung vom Mittelwert(1)
Berechnung des Korrelationskoeffizienten Vorbemerkung. Der Korrelationskoeffizient ist im Grunde ein Bruch aus 3 unvollständig berechneten statistischen.
Grundlagen, zentrale Begriffe & Einführung in die Faktorenanalyse
Theorie psychometrischer Tests, III
Thema der Stunde I. Einführung in die Varianzanalyse:
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II
Forschungsstatistik II
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Seminar Lehrevaluation
Mehrfachregressionen
Ein frohes und erfolgreiches Jahr
Schwierigkeitsgrad III 6 X - 7 = X
Reliabilitätsanalysen
Explorative und Konfirmatorische Faktorenanalyse
Aufgabe Der Zusammenhang zwischen einem traumatischen Erlebnis und der Entstehung einer PTBS wird von mehreren Variablen …………….: Copingstrategien, Kontrollüberzeigung,
Wiederholung Faktorenanalyse
Konzentrationsmaße (Gini-Koeffizient, Lorenz-Kurve) Konzentrationsmaße Kennwert für die wirtschaftliche Konzentration Typische Beispiele: Verteilung des.
Datenmatrix. Datentabelle für 2 Merkmale Kontingenztafel der absoluten Häufigkeiten.
Rechenregeln für Mittelwert, Varianz und Streuung.
Datenmatrix.
Korrelationskoeffizient nach Bravais-Pearson Eigenschaften X und Y unabhängig.
Datentabelle für 2 Merkmale
Streuungsparameter Median Mittlere Abweichung vom Median
Tutorium
Unser letztes Tutorium
Unser letztes Tutorium Output – das Modell gut11 gut12 gut21 gut22 gut31 gut32 state1 state2 state3 XI MF
(Gini-Koeffizient, Lorenz-Kurve)
Bestimmung der Regressionsgewichte in der multiplen Regression
Ausgleichungsrechnung I
Chi Quadrat Test Tamara Katschnig.
Faktorenanalyse Einführung Hauptachsen Voraussetzungen Berechnung
Die Faktorenanalyse.
Statistik: Mehr zur Regression.
Kapitel 10 Multikollinearität
Kapitel 16 Ökonometrische Modelle
Strategie der Modellbildung
„Postmaterielle Werte“
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Deskriptive Statistik
Scaffold 29S: Komplexe Zahlen
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
Testtheorie (Vorlesung 4: ) Wiederholung/Zusammenfassung
Stochastik ganz kurz Beispiel diskret Würfelwurf Beispiel stetig
setzt Linearität des Zusammenhangs voraus
Untersuchung von Zusammenhängen mittels Umfragen Siegfried Schumann
Varianzanalyse und Eta²
Die Faktorenanalyse.
Faktorenanalyse Tamara Katschnig.
Phi-Koeffizient: Alternative Berechnungsart
Deskriptive Statistik, Korrelationen, Mittelwertvergleiche, Graphiken
Auswertung analytischer Daten - Auswertungsziele.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Independent Component Analysis: Analyse natürlicher Bilder Friedrich Rau.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Überblick über das Dokument
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Wir lösen Bruchgleichungen, deren Nenner eine Variable enthalten
Fortgeschrittene statistische Methoden SS2020
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Methoden der Politikwissenschaft Faktorenanalyse Siegfried Schumann

Organisatorische Vorbemerkungen: Für Sozialwissenschaften meist irrelevant: Vorgeschaltete Mittelwertbildung (Hausfrauen-Urteile) Nicht behandelt: Eignung der Korrelationsmatrix Graphische Interpretation der Faktoren

Übersicht zur Faktorenanalyse (FA) 1. Korrelationsmatrix: 2. Grundgleichung der FA: Ladung · Score 3. Durch Einsetzen: Korrelationsmatrix der Faktoren „C“ Falls Faktoren unkorreliert: C = Einheitsmatrix: (Fundamentaltheorem d. FA) 4. Erweiterung: (spez. Varianz + Messfehler; wird festgelegt; Ladungen werden so gewählt, dass 1. Faktor max. Varianz erklärt) 5. Berechnung der Faktorwerte: Gleichung nicht immer lösbar; Ergebnis: Faktorscores Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

Vorarbeiten: Berechnung der Standardabweichung Anteil unges. Fettsäuren: AM = 2,83333 (S. 193) SD = 1,47196 (S. 199) Kaloriengehalt: AM = 4,16667 SD = 1,94079 Vitamingehalt: AM = 3,66667 SD = 1,36626 (Tabelle) Haltbarkeit: AM = 3,50000 SD = 1,87083 Preis: AM = 4,66667 SD = 2,06559 Vitamingehalt Haltbarkeit Preis (x-AM) (x-AM)2 -1,66667 2,77779 -2,50000 6,25000 -2,66667 7,11113 -0,66667 0,44445 -0,50000 0,25000 0,33333 0,11111 0,50000 2.33333 5,44443 -1,50000 2,25000 1,50000 2,33333 2,50000 SAQ: 9,33334 SAQ: 17,50000 SAQ: 21,33334 SD: 1,36626 SD: 1,87083 SD: 2,06559

Errechnung der Korrelationsmatrix aus z-Werten z-standardisierte Ausgangswerte transponierte Matrix Rama Sanella Becel Du darfst Holl. Butter Weihn. Butter AF Ka Vi Ha Pr -1,24550 -0,56614 0,79260 1,47196 0,11323 -1,63164 -1,21988 -1,33631 -1,29100 0,94463 0,42938 -0,60113 -0,08588 -0,48795 -0,26726 -0,32275 0,24397 1,70782 0,26726 0,16137 -0,80178 0,80178 1,33631 -0,80687 1,12962 Korrelationsmatrix AF Ka Vi Ha Pr AF (Anteil unges. Fetts.) 1,00000 0,71176 0,96134 0,10894 0,04385 Ka (Kaloriengehalt) 0,70397 0,13771 0,06652 Vi (Vitamingehalt) 0,07825 0,02362 Ha (Haltbarkeit) 0,98334 Pr (Preis) Zur Erinnerung:

Konstellation (Demonstrationsbeispiel nach Bortz): Untersucht werden 6 „Objekte“ (Personen): Karin, Heinz, Sonja, Kurt, Eva, Karl Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Testergebnisse): Bi: Bilderrätsel Ma: Mathematikaufgabe Pu: Puzzle Re: Reproduktions (Gedächtnis-) Aufgabe Kr: Kreuzworträtsel Es ergeben sich folgende korrelative Zusammenhänge (schematisch): F1: praktische Intelligenz F2: theoret. Intelligenz + F3 + F4 + F5 Bi Pu Re Ma Kr Vermutung: Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA sinnvoll!

Zur Grundgleichung der FA (Bortz-Beispiel) Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“) F1 + F2 + F3 + F4 + F5 Schritt für Schritt nacheinander – rein rechnerisch! Restriktion: jeweils maximale (Rest-)Varianzerklärung bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt! Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen F1 F2 F3 F4 F5 ∙ Bi Ma Pu Re Kr Ladungen: a Für die neuen Variablen (Faktoren) gilt: Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet. Faktorscore: p Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208) X(Bilderrätsel, Eva) = a(Bilderrätsel, F1) ∙ p(F1, Eva) + a(Bilderrätsel, F2) ∙ p(F2, Eva) + … + a(Bilderrätsel, F5) ∙ p(F5, Eva) X(Puzzle, Heinz) = a(Puzzle, F1) ∙ p(F1, Heinz) + a(Puzzle, F2) ∙ p(F2, Heinz) + … + a(Puzzle, F5) ∙ p(F5, Heinz) Nutzen der „Umrechnung“? Abbruchmöglichkeit! Beobachteter Wert ↔ Linearkombination mehrerer (errechneter) Faktoren

Konstellation (Backhaus u.a.): Untersucht werden 6 „Objekte“: Rama, Sanella, Becel, Du darfst, Holländische Butter, Weihnachtsbutter Die „Objekte“ haben Ausprägungen bei den „Merkmalen“ (Variablen): AF: Anteil ungesättigter Fettsäuren Ka: Kaloriengehalt Vi: Vitamingehalt Ha: Haltbarkeit Pr: Preis Es ergeben sich folgende korrelative Zusammenhänge (schematisch): F1: Gesundheit F2: Wirtschaftlichkeit + F3 + F4 + F5 AF Ka Vi Ha Pr Vermutung: Scheinkorrelation! Nur wenn diese Vermutung zutrifft, ist eine FA sinnvoll!

Zur Grundgleichung der FA (Backhaus u.a.) Bildung von 5 neuen orthogonalen Variablen (bei n = 5 „Merkmalen“) F1 + F2 + F3 + F4 + F5 Schritt für Schritt nacheinander – rein rechnerisch! Restriktion: jeweils maximale (Rest-)Varianzerklärung bei n = 5 Faktoren: gesamte Ausgangsvarianz erklärt! Korrelation der neuen Variablen (Faktoren) mit den ursprünglichen Variablen F1 F2 F3 F4 F5 ∙ AF Ka Vi Ha Pr Ladungen: a Für die neuen Variablen (Faktoren) gilt: Für jedes „Objekt“ wird eine Ausprägung auf jedem Faktor errechnet. Faktorscore: p Beispiele zum Fundamentaltheorem der Faktorenanalyse (S. 207 / 208) X(Kalorien, Becel) = a(Kalorien, F1) ∙ p(F1, Becel) + a(Kalorien, F2) ∙ p(F2, Becel) + … + a(Kalorien, F5) ∙ p(F5, Becel) X(Preis, Du darfst) = a(Preis, F1) ∙ p(F1, Du darfst) + a(Preis, F2) ∙ p(F2, Du darfst) + … + a(Preis, F5) ∙ p(F5, Du darfst) Nutzen der „Umrechnung“? Abbruchmöglichkeit!

Weitere Schritte der Faktorenanalyse I Kommunalitätenproblem R = A ∙ A´ + U Explizite Unterscheidung in gemeinsame Faktoren: A – spezifische Faktoren: U U beschreibt spezifische Varianz einer Variablen + Meßfehler Der Teil der Gesamtvarianz einer Variablen, der durch die Faktoren erklärt werden soll, muss festgelegt werden (Kommunalität) Schätzung der Kommunalitäten Gesamte Varianz soll erklärt werden → Hauptkomponentenanalyse (PC) Schätzung nach inhaltlichen Vorgaben → Hauptachsenanalyse (PAF) Kriterium oft: r2max mit anderer Variablen; multiples Bestimmtheitsmaß Bestimmung durch Iterationsprozeß → Hauptachsenanalyse (PAF) keine Eingriffsmöglichkeit; Kriterium: Konvergenz der Iterationen; Startwert oft: Multiples Bestimmtheitsmaß Items: keine Einzelrestvarianz! (spez. Varianz + Fehlervarianz) SPSS

Weitere Schritte der Faktorenanalyse II Festlegung der Zahl der zu extrahierenden Faktoren Kaiser-Kriterium Scree-Test Meist (oblique/rechtwinklige) Rotation der Faktoren (Varimax) „gleichwertige Lösungen“ Ziel meist: möglichst gute Annäherung an Einfachstruktur Gelegentlich: schiefwinklige Rotation eigentlich wäre jetzt neue FA nötig! Interpretation der Faktoren! erster Schritt: Ladungen!

Weitere Schritte der Faktorenanalyse III Bestimmung der Faktorwerte (Scores) Z = A ∙ P (Grundgleichung der FA; Z ist bekannt; A wurde bestimmt) Auflösung nach P: Z = A ∙ P │mult. von links mit inverser Matrix A-1 ∙ Z = A-1 ∙ A ∙ P │ A-1 ∙ A = E (Einheitsmatrix) A-1 ∙ Z = E ∙ P │ E ∙ P = P A-1 ∙ Z = P Problem: i.d.R. nicht quadratische Faktorenmuster A (Ziel: weniger Faktoren als Variablen!) → Matrix-Inversion nicht möglich! Lösung: Schätzverfahren (s. S. 232)

Beispiel: SPSS-Kommando FACTOR /VARIABLES fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8 fr10_9 fr10_10 fr10_11 z11.1 z11.3 /MISSING LISTWISE /ANALYSIS fr10_1 fr10_2 fr10_3 fr10_4 fr10_5 fr10_6 fr10_7 fr10_8 fr10_9 fr10_10 fr10_11 z11.1 z11.3 /PRINT UNIVARIATE CORRELATION EXTRACTION ROTATION /FORMAT SORT /PLOT EIGEN /CRITERIA MINEIGEN(1) ITERATE(25) /EXTRACTION PAF /CRITERIA ITERATE(25) /ROTATION VARIMAX /METHOD=CORRELATION .

Deskriptive Statistiken Mittelwert Standardabweichung Analyse N fr10_1 Institutionenvertrauen: Bundestag 4,85 2,397 1239 fr10_2 Institutionenvertrauen: Bundesverfassungsgericht 6,35 2,475 fr10_3 Institutionenvertrauen: Verwaltung 4,80 2,286 fr10_4 Institutionenvertrauen: Bundesregierung 4,31 2,529 fr10_5 Institutionenvertrauen: Gerichte 5,92 2,371 fr10_6 Institutionenvertrauen: Parteien 3,77 2,202 fr10_7 Institutionenvertrauen: Polizei 6,40 2,240 fr10_8 Institutionenvertrauen: Bundeswehr 6,04 2,264 fr10_9 Institutionenvertrauen: katholische Kirche 4,37 2,741 fr10_10 Institutionenvertrauen: evangelische Kirche 4,82 2,483 fr10_11 Institutionenvertrauen Gewerkschaften 4,26 2,327 z11.1 Vertrauen - Kirchen 4,61 2,875 z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände 3,94 2,370

Screeplot

Faktormatrix (unrotiert!) 1 2 3 fr10_1 Institutionenvertrauen: Bundestag ,769 -,303 ,186 fr10_3 Institutionenvertrauen: Verwaltung ,752 -,125 ,015 fr10_5 Institutionenvertrauen: Gerichte ,738 -,162 -,221 fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,709 -,214 -,178 fr10_6 Institutionenvertrauen: Parteien ,705 -,204 ,277 fr10_7 Institutionenvertrauen: Polizei ,703 ,007 -,536 fr10_4 Institutionenvertrauen: Bundesregierung ,688 -,342 ,360 fr10_10 Institutionenvertrauen: evangelische Kirche ,647 ,501 ,113 fr10_9 Institutionenvertrauen: katholische Kirche ,624 ,593 ,142 fr10_8 Institutionenvertrauen: Bundeswehr ,584 ,044 -,401 z11.1 Vertrauen - Kirchen ,498 ,496 ,115 fr10_11 Institutionenvertrauen: Gewerkschaften ,469 -,083 ,171 z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,372 ,119 ,010 Extraktionsmethode: Hauptachsen-Faktorenanalyse. 3 Faktoren extrahiert. Es werden 12 Iterationen benötigt.

Kommunalitäten Extraktion ,717 fr10_1 Institutionenvertrauen: Bundestag ,717 fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,581 fr10_3 Institutionenvertrauen: Verwaltung fr10_4 Institutionenvertrauen: Bundesregierung ,719 fr10_5 Institutionenvertrauen: Gerichte ,619 fr10_6 Institutionenvertrauen: Parteien ,616 fr10_7 Institutionenvertrauen: Polizei ,781 fr10_8 Institutionenvertrauen: Bundeswehr ,504 fr10_9 Institutionenvertrauen: katholische Kirche ,761 fr10_10 Institutionenvertrauen: evangelische Kirche ,683 fr10_11 Institutionenvertrauen: Gewerkschaften ,256 z11.1 Vertrauen - Kirchen ,508 z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,153 Extraktionsmethode: Hauptachsen-Faktorenanalyse.

Erklärte Gesamtvarianz – unrotiert / rotiert Faktor Summen von quadrierten Faktorladungen für Extraktion Rotierte Summe der quadrierten Ladungen Gesamt % der Varianz Kumulierte % 1 5,424 41,726 2,973 22,871 2 1,210 9,305 51,031 2,311 17,777 40,648 3 ,845 6,501 57,532 2,195 16,884 Extraktionsmethode: Hauptachsen-Faktorenanalyse. Eigenwerte

Rotierte Faktorenmatrix 1 2 3 fr10_4 Institutionenvertrauen: Bundesregierung ,828 ,132 ,127 fr10_1 Institutionenvertrauen: Bundestag ,769 ,315 ,161 fr10_6 Institutionenvertrauen: Parteien ,723 ,194 ,234 fr10_3 Institutionenvertrauen: Verwaltung ,574 ,426 ,265 fr10_11 Institutionenvertrauen: Gewerkschaften ,447 ,134 ,197 fr10_7 Institutionenvertrauen: Polizei ,180 ,835 ,228 fr10_8 Institutionenvertrauen: Bundeswehr ,153 ,653 ,232 fr10_5 Institutionenvertrauen: Gerichte ,459 ,615 ,173 fr10_2 Institutionenvertrauen: Bundesverfassungsgericht ,490 ,570 ,126 fr10_9 Institutionenvertrauen: katholische Kirche ,179 ,172 ,837 fr10_10 Institutionenvertrauen: evangelische Kirche ,218 ,764 z11.1 Vertrauen - Kirchen ,131 ,133 ,688 z11.3 Vertrauen - Wirtschafts-/Arbeitgeberverbände ,190 ,189 ,284 Extraktionsmethode: Hauptachsen-Faktorenanalyse. Rotationsmethode: Varimax mit Kaiser-Normalisierung. a Die Rotation ist in 5 Iterationen konvergiert.

Zusammenfassung der Ergebnisse erkl. Varianz = Eigenwerte : 13 Eigenwerte Ladung (unrotierte Lösung) Kommu- Ladung (rotierte Lösung) 1 2 3 nalität fr10_4 ,688 -,342 ,360 ,719 ,828 ,132 ,127 fr10_1 ,769 -,303 ,186 ,717 ,315 ,161 fr10_6 ,705 -,204 ,277 ,616 ,723 ,194 ,234 fr10_3 ,752 -,125 ,015 ,581 ,574 ,426 ,265 fr10_11 ,469 -,083 ,171 ,256 ,447 ,134 ,197 fr10_7 ,703 ,007 -,536 ,781 ,180 ,835 ,228 fr10_8 ,584 ,044 -,401 ,504 ,153 ,653 ,232 fr10_5 ,738 -,162 -,221 ,619 ,459 ,615 ,173 fr10_2 ,709 -,214 -,178 ,490 ,570 ,126 fr10_9 ,624 ,593 ,142 ,761 ,179 ,172 ,837 fr10_10 ,647 ,501 ,113 ,683 ,218 ,764 z11.1 ,498 ,496 ,115 ,508 ,131 ,133 z11.3 ,372 ,119 ,010 ,190 ,189 ,284 Σ Ladung2 5.424 1.210 0.845 Σ 7.479 2.973 2.311 2.195 %erkl. Var. 41.726 9.305 6.501 Σ 57.532 22.871 17.777 16.884 erklärte Varianz insgesamt: 57.532%

SPSS-Ergebnis für: PC, NFACTORS = 13 !

Vielen Dank für Ihre Aufmerksamkeit!