Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Slides:



Advertisements
Ähnliche Präsentationen
Simulationsansätze in der BWL: Erstellung eines eigenen Projekts
Advertisements

Der k-d-Baum Richard Göbel.
• • • • • 3.2 Die projektive Erweiterung des E³
Julia Antoniuk Jessica Gottschalk Susana de Miguel
3. Kapitel: Komplexität und Komplexitätsklassen
Genetische Algorithmen für die Variogrammanpassung
Grundlagen, zentrale Begriffe & Einführung in die Faktorenanalyse
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Methoden der Psychologie Multivariate Analysemethoden Günter Meinhardt Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Forschungsstatistik I
Multidimensionale Skalierung (..., Shepard, 1962, ...)
Forschungsstatistik II
Messung in Einheiten der Standardabweichung
Law of comparative judgement
Forschungsstatistik I
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2004/2005 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik I Prof. Dr. G. Meinhardt WS 2005/2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz.
Forschungsstatistik II Prof. Dr. G. Meinhardt SS 2006 Fachbereich Sozialwissenschaften, Psychologisches Institut Johannes Gutenberg Universität Mainz KLW-18.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 4 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Genetische Algorithmen
Herzlich willkommen beim 1. Workshop der AG Methodik
Präsentation der Ergebnisse von Clusteranalysen
Latente Variablen – Kennwerte zur Beurteilung von Modellen
Strukturgleichungsmodelle
Tutorium
Unser letztes Tutorium
Clusteranalyse von Maria Eickhold und Tobias Töpfer.
Eigenschaften der OLS-Schätzer
Multikollinearität Wann spricht man von Multikollinearität?
Daten auswerten Boxplots
Abschlussvortrag zur Studienarbeit
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/
Kapitel 18 Dynamische Modelle: Schätzen der Parameter
1 Stichprobenverfahren zur Qualitätssicherung Hilfestellung der Statistik in der Wirtschaftsprüfung.
Theorie psychometrischer Tests, II
Multivariate Statistische Verfahren
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Lernen durch Vergleiche
Analyse von Deliktsähnlichkeiten auf der Basis von Individualdaten
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
Möglichkeiten der Visualisierung
Testtheorie (Vorlesung 7: ) Rekapitulation: Modellierungsansatz
Methoden der Sozialwissenschaften
Theorie, Anwendungen, Verallgemeinerungen
setzt Linearität des Zusammenhangs voraus
Faktorenanalyse Tamara Katschnig.
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
Testtheorie (Vorlesung 13: ) Wiederholung: Richtigstellung
Testtheorie (Vorlesung 14: ) Testtheorie allgemein:  Ziele und Inhalte der Testtheorie:  Beurteilung der Eigenschaften von Tests  Speziell: Güte.
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Statistische Verfahren
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz Vorlesung 14.11.2006 Günter Meinhardt Johannes Gutenberg Universität Mainz Why worry? There must be sunshine after rain. (Mark Knopfler)

Multidimensionale Skalierung Verfahren Multidimensionale Skalierung Thema Multidimensionale Skalierung Problem: Positionierung von Messobjekten in einem latenten Raum (hier: Wahrnehmungsraum) Möglichkeiten: Multidimensionale Skalierung Faktorenanalyse

Faktorenanalyse Vorgehen MDS Vorgehen Verfahren MDS - Faktorenanalyse Man lässt Personen Eigenschaftsausprägungen von Objekten einschätzen (Item-Schätzskalen). Man faktorisiert die Skalen und betrachtet die Koordinaten der Objekte auf den neuen (unabhängigen) Dimensionen (= latenter Wahrnehmungsraum). MDS Vorgehen Man lässt nur die Ähnlichkeit der Objekte beurteilen (ohne den direkten Bezug auf konkrete Eigenschaften) und probiert die Anordnung („Konfiguration“) der Objekte in einem latenten Raum derart, dass die Ähnlichkeitsurteile möglichst gut repro- duziert werden.

Faktorenanalyse Latente Variable Verfahren MDS - Faktorenanalyse Man möchte Objekte (Personen) in einem Raum latenter Dimensionen (Fähigkeiten, Traits) anordnen. Gegeben ist ein Set von Beobachtungen (Messvariablen) Problem: Finde latente Variablen r £ p, so dass jede Variable xk eine Linearkombination der wl ist: Beispiel: Das Abschneiden im Abitur mit Deutsch, Mathe, Physik, Latein und Geographie wird erklärt aus latenten Variablen Memory, Induction, Perceptual Speed, Space, Verbal Comprehension.

Multidimensionale Skalierung Verfahren MDS - Faktorenanalyse Multidimensionale Skalierung Latente Variable Man möchte Objekte (Personen) in einem Raum latenter Dimensionen anordnen. Gegeben ist ein Set von Beobachtungen über die (sensorischen) Distanzen der Objekte: (Distanzmatrix) Problem: Finde latente Variablen r £ n, so dass die Distanzen zwischen den Objekten auf den Koordinaten reproduziert werden. Beispiel: Man lässt Filmschauspieler paarweise nach Ähnlichkeit/Unähnlichkeit bewerten. Die MDS soll den latenten Wahrnehmungsraum liefern, auf dem die Schauspieler angeordnet werden können, so dass die Ähnlichkeitsurteile reproduziert werden.

Multidimensionale Skalierung Verfahren MDS - Faktorenanalyse Multidimensionale Skalierung Faktorenanalyse Demo - Beispiel mit Excel und Statistica

MDS Lösung ist von weiteren Parametern abhängig Verfahren MDS MDS Vorteile relevante Eigenschaften dürfen unbekannt sein (keine Verzerrung durch Vorauswahl) kann bereits bei Rangdaten eingesetzt werden (Ergeb- nisse sind mit metrischer MDS quasi identisch) Nachteile Aggregation über Personen ist problematisch (Bezug verschiedene latente Dimensionen beim Urteil) Großer Interpretationsfreiraum beim Untersucher bei der inhaltlichen Benennung der Dimensionen (vage) MDS- Lösung ist nicht algorithmisch (Keine Garantie die beste Lösung gefunden zu haben) MDS Lösung ist von weiteren Parametern abhängig (Distanzmodell, Anzahl der Dimensionen) Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Distanzen von Städten in km Verfahren MDS MDS Städte- Beispiel Distanzen von Städten in km Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Rangreihe der Distanzen von Städten Verfahren MDS MDS Städte- Beispiel Rangreihe der Distanzen von Städten Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Städte- Beispiel Verfahren MDS MDS - Konfiguration Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

MDS – Konfiguration nach Rotation und Spiegelung Verfahren MDS MDS – Konfiguration nach Rotation und Spiegelung Städte- Beispiel Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Bestimmung der Dimensionalität Bestimmung der Metrik Verfahren MDS MDS Anwendung Die MDS ist ein exploratives Verfahren und nicht zur strengen Hypothesenprüfung geeignet Probleme Auffinden der Konfiguration (relative Lage der Objekte zueinander im Wahrnehmungsraum, wenn nur die Distanzen bekannt sind Bestimmung der Dimensionalität Bestimmung der Metrik Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Kommentar Die Konfiguration ist unabhängig von Rotation und Spiegelung Es finden fast nur nichtmetrische MDS Prozeduren Verwendung (Kruskal)

1. Messung von Ähnlichkeiten Verfahren MDS MDS Ablauf 1. Messung von Ähnlichkeiten 2. Wahl des Distanzmodells 3. Ermittlung der Konfiguration Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) 4. Zahl und Interpretation der Dimensionen 5. Aggregation von Personen

Ties (Rangbindungen), Reliabilität der Ränge Verfahren MDS - 1. Messung von Ähnlichkeiten Methoden Rangreihungsmethode Ankerpunktmethode Ratingverfahren Rangreihe Es werden „n über 2“ Paare geordnet von „unähnlichstes Paar“ zu „ähnlichstes Paar“ (bei grossem n kaum möglich) Ankerpunkt Jedes Objekt ist einmal Vergleichsobjekt (Anker) für alle anderen Objekte. Es werden soviele Rangreihen wie Objekte erstellt. Man erhält eine asymmetrische quadra-trische Distanzmatrix, die in eine symmetrische überführt werden kann. Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Rating Man bildet ale möglichen Paare und lässt diese, randomisiert dargeboten, auf einer Ratingskala nach Ähnlichkeit bewerten. Probleme: Ties (Rangbindungen), Reliabilität der Ränge

Euklidische Metrik p = 2 Objektdistanz Verfahren MDS - 2. Distanzmodell Euklidische Metrik p = 2 0.00 1.00 2.00 3.00 4.00 k b l a Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Objektdistanz

Euklidische Metrik: Abstand der Objekte ist die Länge der Verfahren MDS - 2. Distanzmodell Minkowski-Metriken p = 2 Euklidische Metrik: Abstand der Objekte ist die Länge der Verbindungslinie. p = 1 City-Block Metrik: Abstand der Objekte ist die Summe der einzelnen Koordinatendistanzen p = ¥ Supremum Metrik: Abstand der Objekte ist die größte der auftretenden Koordinatendistanzen Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Wahlkriterium Metrik muss nach inhaltlichen Gesichtspunkten gewählt Sein, Abstände werden in diesem Sinne interpretiert.

Verfahren MDS - 3. Konfiguration ermitteln Ausgehend von den Unähnlichkeiten u ist ein möglichst niedrig dimensionierter Raum zu finden, in dem die Distanzen d möglichst der Monotoniebeziehung p = 2 genügen. Shephard Diagramm Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Start-Konfiguration Verfahren MDS - 3. Konfiguration ermitteln Konfiguration ermitteln Unähnlichkeiten u Koordinaten x1, x2 6 4 5 Butter 1 2 Becel 3 Homa Rama x1 x2 1 Rama 3 2 2 Homa 2 7 3 Becel 1 3 Start-Konfiguration 4 Butter 10 4 3; 2 2; 7 1; 3 10; 4 1 2 3 4 5 6 7 8 9 10 11 12 X1 X2 Homa 2 Rama 1 Butter 4 Becel 3 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Start-Konfiguration Gütemaß ”Stress” Verfahren MDS - 3. Konfiguration ermitteln Konfiguration ermitteln Shephard - Diagramm 10 Distance d(k,l) Disparity d(k,l) ^ 9 8 7 6 d(k,l) 5 Start-Konfiguration 4 3 2 1 1 2 3 4 5 6 7 Dissimilarity u(k,l) Abweichung von Distanz d und Disparität Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Gütemaß ”Stress”

Konfiguration ermitteln Iterative Optimierung Verfahren MDS - 3. Konfiguration ermitteln Wahrnehmungsraum Konfiguration ermitteln 8 Homa 2 Rama 1 Butter 4 Becel 3 Alte Koordinaten 7 Neue Koordinaten ^ 6 Iterative Optimierung 5 X2 4 3 2 1 1 2 3 4 5 6 7 8 9 10 11 12 X1 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität)

Konfiguration ermitteln Iterative Optimierung Gütemaß ”Stress” Verfahren MDS - 3. Konfiguration ermitteln Wahrnehmungsraum Konfiguration ermitteln 8 7 Homa 2 Neue Koordinaten Shephard Diagramm Stress berechnen 6 Iterative Optimierung 5 X2 4 Butter 4 Becel 3 3 2 Rama 1 1 1 2 3 4 5 6 7 8 9 10 11 12 X1 Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Für jeden Iterationsschritt wird Stress bewertet. Iterationen so lange, bis Stress sich nicht mehr vermindert. (Stress ist Führungsfunktion für nichtlineare Optimierung.) Gütemaß ”Stress”

Je mehr Dimensionen, desto geringer wird Stress Verfahren MDS - 4. Dimensionen - Interpretation Anzahl Je mehr Dimensionen, desto geringer wird Stress Lösungen mit einer geringeren Anzahl von Dimensi- onen sind einfacher zu interpretieren Stress darf nicht 0 werden (uneindeutige Lösung) Trade-Off von Stress und Interpretierbarkeit Regeln An Interpretierbarkeit orientieren, ggf. Achsen rotieren Stress soll niedrig sein – Anhaltswerte nach Kruskal Die Daten sollen einen gewissen Verdichtungsgrad Q haben, Q soll möglichst groß sein (Tabelle) Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Trade-Off Durch Erhöhung der Anzahl der Dimensionen wird trivialerweise eine Repräsentierbarkeit erreicht. Gleichzeitig strebt aber die Datenver-dichtung gegen 1. Erhöhung der Anzahl der Objekte n führt zu besserer Verdichtung, aber auch zu schlechterer Urteilspräzision.

Trade-Off von hohem Q- Wert & niedrigem Stress-Wert Verfahren MDS - 4. Dimensionen - Interpretation Verdichtung Q Q - Tabelle Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Trade-Off Trade-Off von hohem Q- Wert & niedrigem Stress-Wert

Werte zwischen gut und ausgezeichnet ergeben einen Verfahren MDS - 4. Dimensionen - Interpretation Stressmaße Stress-Güte Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Richtwert Werte zwischen gut und ausgezeichnet ergeben einen relativ glatten Anstieg im Shephard Diagramm

Über die Ähnlichkeitsdaten wird aggregiert Verfahren MDS - 5. Aggregation Anzahl Die MDS als klassisches Verfahren dient der Ermittlung der Konfiguration einer Person. Aggregationen werden durchgeführt: Über die Ähnlichkeitsdaten wird aggregiert Über die Konfigurationen wird aggregiert Über spezielle Rechenverfahren werden MDS Analysen über die Ähnlichkeitsdaten mehrerer Personen (replicated MDS) durchgeführt Film einblenden. Dann nach Ortho-Test: Fahle-Folie einblenden (Stimulus-Spezifität) und sagen, dass auch die Beurteilung der Länge oder der Luminanz der Linien nicht möglich ist, wenn man nicht darauf geachtet hat (Task-Spezifität) Diskussion Vor-und Nachteile der Techniken abwägen