Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Simulationsansätze in der BWL: Erstellung eines eigenen Projekts
Advertisements

Vorlesung Programmieren II
Kosmologie mit Supernovae 1a
Grundlagen, zentrale Begriffe & Einführung in die Faktorenanalyse
Theorie psychometrischer Tests, III
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multidimensionale Skalierung (..., Shepard, 1962, ...)
Forschungsstatistik II
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-24.
Forschungsstatistik II
Messung in Einheiten der Standardabweichung
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Herzlich willkommen beim 1. Workshop der AG Methodik
Präsentation der Ergebnisse von Clusteranalysen
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Tutorium
Unser letztes Tutorium
Unser letztes Tutorium Output – das Modell gut11 gut12 gut21 gut22 gut31 gut32 state1 state2 state3 XI MF
Eigenschaften der OLS-Schätzer
Daten auswerten Boxplots
Abschlussvortrag zur Studienarbeit
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Theorie psychometrischer Tests, IV
Theorie psychometrischer Tests, II
Multivariate Statistische Verfahren
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Lernen durch Vergleiche
Analyse von Deliktsähnlichkeiten auf der Basis von Individualdaten
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
Möglichkeiten der Visualisierung
Entscheidungstheorie für Unentschlossene Indecision Theory.
Testtheorie (Vorlesung 7: ) Rekapitulation: Modellierungsansatz
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Sebastian Loose DPF – A Perceptual Distance Function for Image Retrieval Proseminar SS 2005 Distanzen und Ähnlichkeitsmaße im Hochdimensionalem.
setzt Linearität des Zusammenhangs voraus
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Testtheorie (Vorlesung 12: ) Wiederholung: Reliabilität
Forschungsstrategien Johannes Gutenberg Universität Mainz
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.
Johannes Winterhalter Regressionsanalyse1 Regressionsanalyse – Was bedeutet das? Einfachster Fall: Wir haben zwei Variablen. Von der einen wissen wir,
Methoden der Psychologie
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Statistische Verfahren
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Den Bus erkunden ….
KURVENDISKUSSION Diskussion von Polynomfunktionen
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Kapitel 2: Testtheorie / Testmodelle
Di 13. Dez :15-19:45 h Einladung an alle Studierenden
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.
ReduSoft Ltd. Kurzbeschreibungen zu einigen Modulen, die im Programm MathProf 5.0 unter dem Themenbereich Algebra implementiert sind. Matrizen.
Foliensammlung Multivariate Analysemethoden 15. Auflage
Konfidenzintervalle und Tests auf Normalverteilung
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung Thema: Multidimensionale Skalierung (MDS) Günter Meinhardt Johannes Gutenberg Universität Mainz

Multidimensionale Skalierung Verfahren Multidimensionale Skalierung Thema Multidimensionale Skalierung Problem: Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum) Möglichkeiten: Multidimensionale Skalierung Faktorenanalyse

Faktorenanalyse Vorgehen MDS Vorgehen Verfahren MDS - Faktorenanalyse Man lässt Personen Eigenschaftsausprägungen von Objekten einschätzen (Item-Schätzskalen). Man faktorisiert die Skalen und betrachtet die Koordinaten der Objekte auf den neuen (unabhängigen) Dimensionen (= latenter Wahrnehmungsraum). MDS Vorgehen Man lässt nur die Ähnlichkeit der Objekte beurteilen (ohne den direkten Bezug auf konkrete Eigenschaften) und probiert die Anordnung („Konfiguration“) der Objekte in einem latenten Raum derart, dass die Ähnlichkeitsurteile möglichst gut repro- duziert werden.

Faktorenanalyse Latente Variable Verfahren MDS - Faktorenanalyse Man möchte Objekte (Personen) in einem Raum latenter Dimensionen (Fähigkeiten, Traits) anordnen. Gegeben ist ein Set von Beobachtungen (Messvariablen) Problem: Finde latente Variablen r £ p, so dass jede Variable xk eine Linearkombination der wl ist: Beispiel: Das Abschneiden im Abitur mit Deutsch, Mathe, Physik, Latein und Geographie wird erklärt aus latenten Variablen Memory, Induction, Perceptual Speed, Space, Verbal Comprehension.

Multidimensionale Skalierung Verfahren MDS - Faktorenanalyse Multidimensionale Skalierung Latente Variable Man möchte Objekte (Personen) in einem Raum latenter Dimensionen anordnen. Gegeben ist ein Set von Beobachtungen über die (sensorischen) Distanzen der Objekte: (Distanzmatrix) Problem: Finde latente Variablen r £ n, so dass die Distanzen zwischen den Objekten auf den Koordinaten reproduziert werden. Beispiel: Man lässt Filmschauspieler paarweise nach Ähnlichkeit/Unähnlichkeit bewerten. Die MDS soll den latenten Wahrnehmungsraum liefern, auf dem die Schauspieler angeordnet werden können, so dass die Ähnlichkeitsurteile reproduziert werden.

Multidimensionale Skalierung Verfahren MDS - Faktorenanalyse Multidimensionale Skalierung Faktorenanalyse Demo - Beispiel mit Excel und Statistica

MDS Lösung ist von weiteren Parametern abhängig Verfahren MDS MDS Vorteile relevante Eigenschaften dürfen unbekannt sein (keine Verzerrung durch Vorauswahl) kann bereits bei Rangdaten eingesetzt werden (Ergeb- nisse sind mit metrischer MDS quasi identisch) Nachteile Aggregation über Personen ist problematisch (Bezug auf verschiedene latente Dimensionen beim Urteil) Großer Interpretationsfreiraum beim Untersucher bei der inhaltlichen Benennung der Dimensionen (vage) MDS- Lösung ist nicht algorithmisch (Keine Garantie die beste Lösung gefunden zu haben) MDS Lösung ist von weiteren Parametern abhängig (Distanzmodell, Anzahl der Dimensionen) Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Distanzen von Städten in km Verfahren MDS MDS Städte- Beispiel Distanzen von Städten in km Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Rangreihe der Distanzen von Städten Verfahren MDS MDS Städte- Beispiel Rangreihe der Distanzen von Städten Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Städte- Beispiel Verfahren MDS MDS - Konfiguration Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

MDS – Konfiguration nach Rotation und Spiegelung Verfahren MDS MDS – Konfiguration nach Rotation und Spiegelung Städte- Beispiel Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Bestimmung der Dimensionalität Bestimmung der Metrik Verfahren MDS MDS Anwendung Die MDS ist ein exploratives Verfahren und nicht zur strengen Hypothesenprüfung geeignet Probleme Auffinden der Konfiguration (relative Lage der Objekte zueinander im Wahrnehmungsraum, wenn nur die Distanzen bekannt sind Bestimmung der Dimensionalität Bestimmung der Metrik Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Kommentar Die Konfiguration ist unabhängig von Rotation und Spiegelung Es finden fast nur nichtmetrische MDS Prozeduren Verwendung (Kruskal)

1. Messung von Ähnlichkeiten Verfahren MDS MDS Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen

Ties (Rangbindungen), Reliabilität der Ränge Verfahren MDS - 1. Messung von Ähnlichkeiten Methoden Rangreihungsmethode Ankerpunktmethode Ratingverfahren Rangreihe Es werden „n über 2“ Paare geordnet von „unähnlichstes Paar“ zu „ähnlichstes Paar“ (bei grossem n kaum möglich) Ankerpunkt Jedes Objekt ist einmal Vergleichsobjekt (Anker) für alle anderen Objekte. Es werden soviele Rangreihen wie Objekte erstellt. Man erhält eine asymmetrische quadra-trische Distanzmatrix, die in eine symmetrische überführt werden kann. Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Rating Man bildet ale möglichen Paare und lässt diese, randomisiert dargeboten, auf einer Ratingskala nach Ähnlichkeit bewerten. Probleme: Ties (Rangbindungen), Reliabilität der Ränge

Euklidische Metrik p = 2 Objektdistanz Verfahren MDS - 2. Distanzmodell Euklidische Metrik p = 2 0.00 1.00 2.00 3.00 4.00 k b l a Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Objektdistanz

Euklidische Metrik: Abstand der Objekte ist die Länge der Verfahren MDS - 2. Distanzmodell Minkowski-Metriken p = 2 Euklidische Metrik: Abstand der Objekte ist die Länge der Verbindungslinie. p = 1 City-Block Metrik: Abstand der Objekte ist die Summe der einzelnen Koordinatendistanzen p = ¥ Supremum Metrik: Abstand der Objekte ist die größte der auftretenden Koordinatendistanzen Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Wahlkriterium Metrik muss nach inhaltlichen Gesichtspunkten gewählt Sein, Abstände werden in diesem Sinne interpretiert.

Verfahren MDS - 3. Konfiguration ermitteln Ausgehend von den Unähnlichkeiten u ist ein möglichst niedrig dimensionierter Raum zu finden, in dem die Distanzen d möglichst der Monotoniebeziehung p = 2 genügen. Shephard Diagramm Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Start-Konfiguration Verfahren MDS - 3. Konfiguration ermitteln Konfiguration ermitteln Unähnlichkeiten u Koordinaten x1, x2 6 4 5 Butter 1 2 Becel 3 Homa Rama x1 x2 1 Rama 3 2 2 Homa 2 7 3 Becel 1 3 Start-Konfiguration 4 Butter 10 4 3; 2 2; 7 1; 3 10; 4 1 2 3 4 5 6 7 8 9 10 11 12 X1 X2 Homa 2 Rama 1 Butter 4 Becel 3 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Start-Konfiguration Gütemaß ”Stress” Verfahren MDS - 3. Konfiguration ermitteln Konfiguration ermitteln Shephard - Diagramm 10 Distance d(k,l) Disparity d(k,l) ^ 9 8 7 6 d(k,l) 5 Start-Konfiguration 4 3 2 1 1 2 3 4 5 6 7 Dissimilarity u(k,l) Abweichung von Distanz d und Disparität Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Gütemaß ”Stress”

Konfiguration ermitteln Iterative Optimierung Verfahren MDS - 3. Konfiguration ermitteln Wahrnehmungsraum Konfiguration ermitteln 8 Homa 2 Rama 1 Butter 4 Becel 3 Alte Koordinaten 7 Neue Koordinaten ^ 6 Iterative Optimierung 5 X2 4 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 X1 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Iterative Optimierung Gütemaß ”Stress” Verfahren MDS - 3. Konfiguration ermitteln Wahrnehmungsraum Konfiguration ermitteln 8 7 Homa 2 Neue Koordinaten Shephard Diagramm Stress berechnen 6 Iterative Optimierung 5 X2 4 Butter 4 Becel 3 3 2 Rama 1 1 1 2 3 4 5 6 7 8 9 10 11 12 X1 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Für jeden Iterationsschritt wird Stress bewertet. Iterationen so lange, bis Stress sich nicht mehr vermindert. (Stress ist Führungsfunktion für nichtlineare Optimierung.) Gütemaß ”Stress”

Je mehr Dimensionen, desto geringer wird Stress Verfahren MDS - 4. Dimensionen - Interpretation Anzahl Je mehr Dimensionen, desto geringer wird Stress Lösungen mit einer geringeren Anzahl von Dimensi- onen sind einfacher zu interpretieren Stress darf nicht 0 werden (uneindeutige Lösung) Trade-Off von Stress und Interpretierbarkeit Regeln An Interpretierbarkeit orientieren, ggf. Achsen rotieren Stress soll niedrig sein – Anhaltswerte nach Kruskal Die Daten sollen einen gewissen Verdichtungsgrad Q haben, Q soll möglichst groß sein (Tabelle) Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Trade-Off Durch Erhöhung der Anzahl der Dimensionen wird trivialerweise eine Repräsentierbarkeit erreicht. Gleichzeitig strebt aber die Datenver-dichtung gegen 1. Erhöhung der Anzahl der Objekte n führt zu besserer Verdichtung, aber auch zu schlechterer Urteilspräzision.

Trade-Off von hohem Q- Wert & niedrigem Stress-Wert Verfahren MDS - 4. Dimensionen - Interpretation Verdichtung Q m = Anzahl Dimensionen Q - Tabelle Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Trade-Off Trade-Off von hohem Q- Wert & niedrigem Stress-Wert

Werte zwischen gut und ausgezeichnet ergeben einen Verfahren MDS - 4. Dimensionen - Interpretation Stressmaße Stress-Güte Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Richtwert Werte zwischen gut und ausgezeichnet ergeben einen relativ glatten Anstieg im Shephard Diagramm

Über die Ähnlichkeitsdaten wird aggregiert Verfahren MDS - 5. Aggregation Anzahl Die MDS als klassisches Verfahren dient der Ermittlung der Konfiguration einer Person. Aggregationen werden durchgeführt: Über die Ähnlichkeitsdaten wird aggregiert Über die Konfigurationen wird aggregiert Über spezielle Rechenverfahren werden MDS Analysen über die Ähnlichkeitsdaten mehrerer Personen (replicated MDS) durchgeführt Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Diskussion Vor-und Nachteile der Techniken abwägen