Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Perceptrons and the perceptron learning rule
Advertisements

Statistik-Tutorat SS 2009 Christina
Berg-Schlosser : VL : Vergleichende Politikwissenschaft Vergleichende Methoden Ausgangsbasis : Fälle: begrenzte Auswahl auf der Makro-Ebene, abhängig.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Thema der Stunde I. Einführung in die Varianzanalyse:
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Einfaktorielle Varianzanalyse
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-23.
Online-Evaluationssystems
Forschungsstatistik I
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Der Produkt-Moment- Korrelationskoeffizient Der Produkt-Moment Korrelationskoeffizient gibt Stärke und Richtung des linearen Zusammenhanges zweier Variablen.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Quantitative Methoden I
Herzlich willkommen beim 1. Workshop der AG Methodik
Nachholung der Vorlesung vom Freitag
Ab nächster Woche wird die Übungsgruppe Gruppe 2: Henrike Berg Di SR 222 wegen Personalmangel eingestellt.
Kolmogorov-Smirnov-Test. A. N. Kolmogorov Geboren in Tambov, Russland. Begründer der modernen Wahrscheinlichkeitstheorie.
Klausur am :00 bis 13:00 Hörsaal Loefflerstraße und Hörsaal Makarenkostraße.
Tutorium
Unser letztes Tutorium
Vorlesung: ANOVA I
Wiederholung: Einfache Regressionsgleichung
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Globale Interpolations- und Prädiktionsverfahren
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
Theorie psychometrischer Tests, IV
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Testtheorie (Vorlesung 4: ) Wiederholung/Zusammenfassung
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Reliabilität.
Testtheorie (Vorlesung 11: ) Wiederholung: Reliabilität
Testtheorie (Vorlesung 10: ) Wiederholung: Reliabilität
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Forschungsstrategien Johannes Gutenberg Universität Mainz
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Einführung in die Diskriminanzanalyse
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Statistische Verfahren
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Wiederholung und klausurtypische Fragen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung 23.10.2012 Günter Meinhardt Johannes Gutenberg Universität Mainz

Verfahrensdarstellung in Überblick Grundprinzip Einführung Was sind multivariate Analysemethoden? Vorlesung Verfahrensdarstellung in Überblick Grundprinzip wichtigsten mathematischen Beziehungen Anwendungsbeispielen Durchführung mit Excel und Statistica Übung/Tut Vermittlung von Hintergründen/Voraussetzungen Grundlagen der linearen Algebra Wiederholung / Durcharbeiten der Beispiele Aufgaben und Anwendungen auf verwandte Probleme Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Prüfung Klausur zum Abschluss des Moduls gemeinsam mit Testtheorie

Literatur Einführung Was sind multivariate Analysemethoden? a) b) c)

Multivariate Methoden Einführung Was sind multivariate Analysemethoden? Inhalte im WS 2012/13 Multivariate Methoden Vektoren / Matrizen Multivariate Distanz Faktorenanalyse Multidimensionale Skalierung Multivariates Testen Multivariate Klassifikation

Multivariate Analysemethoden Einführung Was sind multivariate Analysemethoden? Einteilung Multivariate Analysemethoden Latente Variable Faktorenanalyse Diskriminanzanalyse MDS Kanonische Korrelation LISREL Konkrete Variable Multiple/Logistische Regression T2 / MANOVA Conjoint Measurement Kanonische Korrelation

Multidimensionale Skalierung Verfahren Latente Variable Latente Variable Multidimensionale Skalierung Problem: Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum) Möglichkeiten: Multidimensionale Skalierung Faktorenanalyse

Faktor / MDS Latente Variable Demo - Beispiel mit Excel und Statistica Einführung Was sind multivariate Analysemethoden? Latente Variable Faktor / MDS Demo - Beispiel mit Excel und Statistica

Einführung Was sind multivariate Analysemethoden? Multivariates Testen Grundüberlegungen zum Unterschied des Testens mit einer AV und mehreren AVs Grundprinzip und Beispiel anhand einer 2 Vars – 2 Groups Diskriminanzanalyse

Herzinfarktpatienten Mittelwertsprüfung bei mehreren Variablen Beispiel Lebenszufriedenheit Arbeit Privatsphäre X1: Gehalt X4: Ehe X2: Entscheidungsfreiheit X5: Freunde/Beziehungen X3: Qualität der Kommunikation X6: Sexualität 10 Variablen Person Aktivität X7: Lebensansprüche X9: Hobbies X8: Sinnhaftigkeit X10: Sport/Fitness 2 Gruppen Gesunde Herzinfarktpatienten

Frage Teststrategie Probleme Ausweg Multivariate Mittelwertsvergleiche - Einzeltestungen Frage Unterscheiden sich Gesunde und Patienten im Variablen-komplex Lebenszufriedenheit? Teststrategie Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t- Test. Wenn irgend einer der Tests signifikant wird, sehen wir die Gruppen als verschieden an. Probleme Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft. Unterstellte Unabhängigkeit: Man behandelt die einzelnen Skalen als unabhängig voneinander. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als Variablenkomplex mit Binnenstruktur behandelt. Mangelnde Teststärke: Man nutzt nicht die Korrelations- struktur der Variablen für einen leistungsfähigen Test. Ausweg Verwendung eines multivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in eine statistische Prüfgrösse einfliessen lässt.

Hotelling‘s T2 MANOVA Diskriminanz- Analyse Multivariate Mittelwertsvergleiche - Verfahren Variablen-komplex Multivariates Testkonstrukt Multivariate Distanz (Mahalanobisdistanz) Optimale Linearkombination (Linear Discriminant Function) Multivariate Quadratsummen (SSCP-Matrizen-Zerlegung) Verfahren Hotelling‘s T2 MANOVA Diskriminanz- Analyse Alle Verfahren entscheiden über den Gruppenunterschied im gesamten Variablenkomplex mit einem statistischen Test

Grundprinzip (2 Gruppen) Kriterium der Optimierung Multivariates Testen - Diskriminanzanalyse Grundprinzip (2 Gruppen) Für die m Variablen finde eine Linearkombination zu einer neuen Variable so dass diese die Gruppen c1 und c2 optimal trennt. Kriterium der Optimierung Das Optimierungskriterium für die Wahl der bj lautet Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.

2D-Beispiel 2 Gruppen 2 Variablen Anforderung 2D Beispiel Diskriminanzanalyse 2D-Beispiel Man möchte trennen 2 Gruppen Stechmücken c1 Blindmücken c2 anhand von 2 Variablen Fühlerlänge x1 Flügellänge x2 Anforderung Maximale Gruppentrennung (Mittelwerte) Minimale Klassifikationsfehler (Fall-Klassifikation)

Regression Stechmücke Regression Blindmücke 2D Beispiel Diskriminanzanalyse Variablenraum Regression Stechmücke Blindmücke Stechmücke 1.40 1.20 Regression Blindmücke 1.00 x2 0.80 (Flügelänge) 0.60 0.40 0.20 0.00 0.00 0.10 0.20 0.30 x1 0.40 0.50 0.60 0.70 (Fühlerlänge) Ausgangslage Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2). In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).

Variablenraum Problem 2D Beispiel Diskriminanzanalyse x2 x1 Blindmücke Stechmücke Bestes Kriterium auf x2 Bestes Kriterium auf x1 x1 Problem Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2). Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1 und X2 offenbar nicht.

Variablenraum Lösung 2D Beispiel Diskriminanzanalyse x2 x1 Blindmücke Stechmücke 1.40 Kriteriumsfunktion 1.20 1.00 x2 0.80 (Flügelänge) 0.60 0.40 0.20 0.00 0.00 0.10 0.20 0.30 x1 0.40 0.50 0.60 0.70 (Fühlerlänge) Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2). Somit folgt die Klassifikationsfunktion

a a Einfache Lösung x2 Zentrierung & Rotation ! x1 2D Beispiel Diskriminanzanalyse Einfache Lösung Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel a drehen ! x2 Zentrierung & Rotation ! a x1 a Die Varianz zwischen den Gruppen wird auf der Achse x‘1 maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.

z-Standard 2D Beispiel Diskriminanzanalyse standardisiert z2 z1 3.00 2.00 1.00 z2 0.00 -1.00 -2.00 -3.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 z1

z-Standard Diskriminanz- funktion 2D Beispiel Diskriminanzanalyse Koordinaten rotiert um a = 46° (clockwise) 3.00 2.00 1.00 z‘2 0.00 -1.00 -2.00 -3.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 z‘1 Diskriminanz- funktion Die neue x- Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßt sich ein Kriterium zur optimalen Trennung beider Gruppen finden. Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:

y: Linear- kombination Koeffizienten von y 2D Beispiel Diskriminanzanalyse y: Linear- kombination y (Diskriminanzfunktion) Kriterium y0 blind stech Da gilt mit und Koeffizienten von y Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel a zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems. [Excel-Beispiel]

z2 Rotation zur y - Funktion z1 Klassifikation 2D Beispiel Diskriminanzanalyse z2 Rotation zur y - Funktion y (Diskriminanzfunktion) Kriterium y0 blind stech z1 y (Diskriminanzfunktion) Klassifikation Case-Classification durch einfachen Vergleich mit dem Kriterium y0. Prüfung des Gruppenunterschieds mit einem einfachen t - Test auf y.