Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Maschinelles Lernen   Metriken für Nearest Neighbour-Verfahren Lineare Diskriminanzfunktionen.
Advertisements

Berg-Schlosser : VL : Vergleichende Politikwissenschaft Vergleichende Methoden Ausgangsbasis : Fälle: begrenzte Auswahl auf der Makro-Ebene, abhängig.
Theorie psychometrischer Tests, III
Forschungsstrategien Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden und Multivariates Testen Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2006/2007 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Einfaktorielle Varianzanalyse
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Online-Evaluationssystems
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-26.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Das Allgemeine lineare Modell (ALM) - Varianz als Schlüsselkonzept
Herzlich willkommen beim 1. Workshop der AG Methodik
Tutorium
Tutorium
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Globale Interpolations- und Prädiktionsverfahren
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Multivariate Verfahren der Statistik bei der quantitativen Textanalyse
Theorie psychometrischer Tests, IV
„Postmaterielle Werte“
Multivariate Statistische Verfahren
Theorie psychometrischer Tests, II
Multivariate Statistische Verfahren
Multivariate Statistische Verfahren
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Testtheorie (Vorlesung 4: ) Wiederholung/Zusammenfassung
Varianzanalyse Teststatistik: F – Test -> vergleich zweier Varianzen -> Grundlage der Varianzanalyse Welche „Varianzen“ werden miteinander verglichen?
Reliabilität.
Forschungsstrategien Johannes Gutenberg Universität Mainz
Die klassischen Methoden der historisch-vergleichenden Forschung Universität Zürich Soziologisches Institut Seminar: Methoden des internationalen Vergleichs.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Einführung in die Diskriminanzanalyse
Reliabilität.
Kapitel 7 Lernziele Nach der Bearbeitung des 7. Kapitels sollten Sie in der Lage sein, einen systematischen Überblick über a) preispolitische Aktionsmöglichkeiten.
Multivariate Statistische Verfahren
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Allgemeines Lineares Modell: Y=a + b*X
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstrategien Johannes Gutenberg Universität Mainz
Foliensammlung Multivariate Analysemethoden 15. Auflage
Kapitel 2: Testtheorie / Testmodelle
Wiederholung und klausurtypische Fragen
Fortgeschrittene Statistische Methoden Cordula Hunt
ANOVA für unabhängige Daten.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Fortgeschrittene statistische Methoden SS2020
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung Günter Meinhardt Johannes Gutenberg Universität Mainz

Verfahrensdarstellung in Überblick Grundprinzip Einführung Was sind multivariate Analysemethoden? Vorlesung Verfahrensdarstellung in Überblick Grundprinzip wichtigsten mathematischen Beziehungen Anwendungsbeispielen Durchführung mit Excel und Statistica Übung/Tut Vermittlung von Hintergründen/Voraussetzungen Grundlagen (Vektoren/Matrizen) Wiederholung / Durcharbeiten der Beispiele Aufgaben und Anwendungen auf verwandte Probleme Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Prüfung Klausur zum Abschluss des Moduls gemeinsam mit Testtheorie

Literatur Einführung Was sind multivariate Analysemethoden? a) b) c)

Grundlagen Inhalte im SS 2017 Vektoren / Matrizen Multivariate Distanz Einführung Was sind multivariate Analysemethoden? Inhalte im SS 2017 Grundlagen Vektoren / Matrizen Eigenwertzerlegung Multivariate Distanz

Verfahren Inhalte im SS 2017 MDS Multiple Regression Faktorenanalyse Einführung Was sind multivariate Analysemethoden? Inhalte im SS 2017 Verfahren MDS Multiple Regression Faktorenanalyse Kanonische Korrelation Diskrimimanzanalyse Multivariate Klassifikation Statistisches Entscheiden

Multivariate Analysemethoden Einführung Was sind multivariate Analysemethoden? Einteilung Multivariate Analysemethoden Latente Variable Faktorenanalyse Diskriminanzanalyse MDS Strukturgleichungen Kanonische Korrelation Konkrete Variable Multiple/Logistische Regression T2 / MANOVA Conjoint Measurement Kanonische Korrelation

Multidimensionale Skalierung Verfahren Latente Variable Latente Variable Multidimensionale Skalierung Problem: Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum) Möglichkeiten: Multidimensionale Skalierung Faktorenanalyse

Faktor / MDS Latente Variable Demo - Beispiel mit Excel und Statistica Einführung Was sind multivariate Analysemethoden? Latente Variable Faktor / MDS Demo - Beispiel mit Excel und Statistica

Einführung Was sind multivariate Analysemethoden? Multivariates Testen Grundüberlegungen zum Unterschied des Testens mit einer AV und mehreren AVs Grundprinzip und Beispiel anhand einer 2 Vars – 2 Groups Diskriminanzanalyse

Herzinfarktpatienten Mittelwertsprüfung bei mehreren Variablen Beispiel Lebenszufriedenheit Arbeit Privatsphäre X1: Gehalt X4: Ehe X2: Entscheidungsfreiheit X5: Freunde/Beziehungen X3: Qualität der Kommunikation X6: Sexualität 10 Variablen Person Aktivität X7: Lebensansprüche X9: Hobbies X8: Sinnhaftigkeit X10: Sport/Fitness 2 Gruppen Gesunde Herzinfarktpatienten

Frage Teststrategie Probleme Ausweg Multivariate Mittelwertsvergleiche - Einzeltestungen Frage Unterscheiden sich Gesunde und Patienten im Variablen-komplex Lebenszufriedenheit? Teststrategie Wir testen auf jeder der 10 Skalen den Gruppenunterschied mit einem t- Test. Wenn irgend einer der Tests signifikant wird, sehen wir die Gruppen als verschieden an. Probleme Multiples Testen: Dieselbe Hypothese wird 10 mal geprüft. Unterstellte Unabhängigkeit: Man behandelt die einzelnen Skalen als unabhängig voneinander. Fehlendes Konstrukt: Lebenszufriendenheit wird nicht als Variablenkomplex mit Binnenstruktur behandelt. Mangelnde Teststärke: Man nutzt nicht die Korrelations- struktur der Variablen für einen leistungsfähigen Test. Ausweg Verwendung eines multivariaten Tests, der die Information aller 10 Variablen und ihrer Korrelationsstruktur in eine statistische Prüfgrösse einfliessen lässt.

Hotelling‘s T2 MANOVA Diskriminanz- Analyse Multivariate Mittelwertsvergleiche - Verfahren Variablen-komplex Multivariates Testkonstrukt Multivariate Distanz (Mahalanobisdistanz) Optimale Linearkombination (Linear Discriminant Function) Multivariate Quadratsummen (SSCP-Matrizen-Zerlegung) Verfahren Hotelling‘s T2 MANOVA Diskriminanz- Analyse Alle Verfahren entscheiden über den Gruppenunterschied im gesamten Variablenkomplex mit einem statistischen Test

Grundprinzip (2 Gruppen) Kriterium der Optimierung Multivariates Testen - Diskriminanzanalyse Grundprinzip (2 Gruppen) Für die m Variablen finde eine Linearkombination zu einer neuen Variable so dass diese die Gruppen c1 und c2 optimal trennt. Kriterium der Optimierung Das Optimierungskriterium für die Wahl der bj lautet Die der bj sind so zu wählen, dass auf der neuen Variable y die Streuung zwischen den Gruppen zu der Streuung innerhalb der Gruppen ein maximales Verhältnis hat.

2D-Beispiel 2 Gruppen 2 Variablen Anforderung 2D Beispiel Diskriminanzanalyse 2D-Beispiel Man möchte trennen 2 Gruppen Stechmücken c1 Blindmücken c2 anhand von 2 Variablen Fühlerlänge x1 Flügellänge x2 Anforderung Maximale Gruppentrennung (Mittelwerte) Minimale Klassifikationsfehler (Fall-Klassifikation)

Regression Stechmücke Regression Blindmücke 2D Beispiel Diskriminanzanalyse Variablenraum Regression Stechmücke Blindmücke Stechmücke 1.40 1.20 Regression Blindmücke 1.00 x2 0.80 (Flügelänge) 0.60 0.40 0.20 0.00 0.00 0.10 0.20 0.30 x1 0.40 0.50 0.60 0.70 (Fühlerlänge) Ausgangslage Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2). In beiden Gruppen existiert eine Korrelation der Variablen Fühlerlänge (X1) und Flügellänge (X2).

Variablenraum Problem 2D Beispiel Diskriminanzanalyse x2 x1 Blindmücke Stechmücke Bestes Kriterium auf x2 Bestes Kriterium auf x1 x1 Problem Klassifiziere anhand von Fühlerlänge (X1) und Flügellänge (X2) möglichst eindeutig in Stechmücke (c1) und Blindmücke (c2). Das geht mit einem Kriteriumswert auf jeder einzelnen Variable X1 und X2 offenbar nicht.

Variablenraum Lösung 2D Beispiel Diskriminanzanalyse x2 x1 Blindmücke Stechmücke 1.40 Kriteriumsfunktion 1.20 1.00 x2 0.80 (Flügelänge) 0.60 0.40 0.20 0.00 0.00 0.10 0.20 0.30 x1 0.40 0.50 0.60 0.70 (Fühlerlänge) Lösung Eine lineare Kriteriumsfunktion teilt den Variablenraum in 2 Gebiete: Oberhalb Stechmücke (c1), unterhalb Blindmücke (c2). Somit folgt die Klassifikationsfunktion

a a Einfache Lösung x2 Zentrierung & Rotation ! x1 2D Beispiel Diskriminanzanalyse Einfache Lösung Zuerst die Daten im Nullpunkt zentrieren und dann um den optimalen Winkel a drehen ! x2 Zentrierung & Rotation ! a x1 a Die Varianz zwischen den Gruppen wird auf der Achse x‘1 maximiert, und x‘2 steht senkrecht x‘1. Eine Parallele zu x‘2 liefert das optimale Trennkriterium.

z-Standard 2D Beispiel Diskriminanzanalyse standardisiert z2 z1 3.00 2.00 1.00 z2 0.00 -1.00 -2.00 -3.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 z1

z-Standard Diskriminanz- funktion 2D Beispiel Diskriminanzanalyse Koordinaten rotiert um a = 46° (clockwise) 3.00 2.00 1.00 z‘2 0.00 -1.00 -2.00 -3.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 z‘1 Diskriminanz- funktion Die neue x- Achse z1‘ ist die Diskriminanzfunktion y. Auf ihr läßt sich ein Kriterium zur optimalen Trennung beider Gruppen finden. Da eine Drehoperation auf die Diskriminanzfunktion geführt hat, ist sie darstellbar als eine Linearkombination der alten Koordinaten:

y: Linear- kombination Koeffizienten von y 2D Beispiel Diskriminanzanalyse y: Linear- kombination y (Diskriminanzfunktion) Kriterium y0 blind stech Da gilt mit und Koeffizienten von y Das Auffinden der Koeffizienten b1 und b2 ist also identisch mit dem Problem, den optimalen Drehwinkel a zu bestimmen. Hierfür braucht man ein Kriterium der gewünschten maximalen Trennung, und die Lösung des dahinter stehenden Maximierungsproblems. [Excel-Beispiel]

z2 Rotation zur y - Funktion z1 Klassifikation 2D Beispiel Diskriminanzanalyse z2 Rotation zur y - Funktion y (Diskriminanzfunktion) Kriterium y0 blind stech z1 y (Diskriminanzfunktion) Klassifikation Case-Classification durch einfachen Vergleich mit dem Kriterium y0. Prüfung des Gruppenunterschieds mit einem einfachen t - Test auf y.