Multidimensionale Skalierung (..., Shepard, 1962, ...)

Slides:



Advertisements
Ähnliche Präsentationen
3. 3D-Betrachtungstransformationen
Advertisements

Vom graphischen Differenzieren
Streuungsmaß 3: absolute Abweichung vom Mittelwert
Aggregatzustände.
Die Beschreibung von Bewegungen
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 5.3 Karhunen-Loeve-Transformation Minimalität und Orthogonalität innerhalb.
Multivariate Datenanalyse Datum: Betreuer: Dr. Bellmann Quellen: Multivariate Statistik, Hartung/Elpelt 1989 Stochastik für Ingenieure und Naturwissenschaftler,
Virtuelle Linsenbilder (Lupe)
Sequentielle Liste - Array
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Drehmoment Drehmomentschlüssel r=0,4m F=50N r=0,2m F=100N Achtung:
Klicke Dich mit der linken Maustaste durch das Übungsprogramm!
Klicke Dich mit der linken Maustaste durch das Übungsprogramm! Ein Übungsprogramm der IGS - Hamm/Sieg © IGS-Hamm/Sieg 2007 Dietmar Schumacher Zeichnerische.
Eine kleine Einführung in echte und falsche Metriken, Normen,
Entscheidungstheorie für Unentschlossene Indecision Theory.
Handlungsziele Seminar: Motivationsdiagnostik Leiter: Joachim Wutke
Gliederung Tabellarische und grafische Darstellung von Rohwerten mittels Histogramme und Polygone Statistische Kennwertbeschreibung mittels Tendenz- und.
Law of comparative judgement
Computerkurs: Quantitative Auswertung biochemischer Experimente Guten Morgen.
Patrick Rössler Methoden der Datenerhebung und -auswertung Vorlesung BA Kommunikationswissenschaft (G21) 1.
Mehrfachregressionen
Funktionen.
Quantitative Methoden I
Seminar „Kernmodelle und ihre experimentelle Überprüfung“
Herzlich willkommen beim 1. Workshop der AG Methodik
Präsentation der Ergebnisse von Clusteranalysen
TEILCHENPHYSIK FÜR FORTGESCHRITTENE Vorlesung am 30. Mai 2006
Das elektrische Feld.
Cranking Modell – Zustände im rotierenden Potential 1 Bisher wurde Rotation als kollektives Phänomen behandelt, dass unabhängig von der Einteilchenbewegung.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Diskrete Wahrscheinlichkeitsmodelle
Vorlesung: Biometrie für Studierende der Veterinärmedizin
§24 Affine Koordinatensysteme
Ausgleichungsrechnung II
Sterne Teil 1 Warum ist das so? Die Sterne am nächtlichen Himmel
Mohammad Es ist einfach geboren zu werden, aber es ist ganz schwierig Mensch zu sein.
Aufgabenzettel V Statistik I
Regionalisierte Variablen und Kriging
Zeichnen linearer Funktionen
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Wahrscheinlichkeitsrechnung
„Tiefen der Unschärfe“
Lineare Funktionen und ihre Schaubilder, die Geraden
Auswertung der Umfrage
Stress ?.
Kinematik I Lernziele:
Vorwissen: Begriff der Steigung Geradengleichung Polynomfunktionen Monotonie und Extremwerte In den ersten Beispielen werden dieses Wissen allerdings wiederholt.
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Sonne Erde Tag 2010.
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Foliensammlung Multivariate Analysemethoden 13. Auflage
Die Mit einem Fernrohr können wir ferne Dinge größer sehen Das Fernrohr tut so, als wären ferne Dinge einfach näher.
15. Das elektrische Feld Ein Feld ist ein Raum, in dem jedem Punkt ein bestimmter Wert einer physikalischen Größe zugeordnet wird.
Vom graphischen Differenzieren
Gravitation regiert die Welt
Kreieren eines Thermometer Diagramms
1 Das Thermometer Von Irina Michailenko.
Mechanik II Lösungen.
2.4.2 Median Wiederholung (Kap. 2: Beschreibende Statistik)
Reaktionszeitbestimmung „10 Euro“ Schmäh Ein Lineal wird zwischen Zeigefinger und Daumen einer Person gehalten und dann losgelassen.
Geoinformationssysteme
Probleme empirischer Forschung
Einsatz digitaler Medien im Mathematikunterricht.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Grafische Darstellung von Gruppenunterschieden.
Massenspektroskopie Michael Haas Theorie Aufbau Auswertung.
Virtuelle Linsenbilder (Lupe)
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
 Präsentation transkript:

Multidimensionale Skalierung (..., Shepard, 1962, ...) Christian Kaernbach

Explorative MDS N Items N ∙ (N–1) / 2 Paare weil sie interessant sind weil der Raum, in dem sie liegen, interessant ist N ∙ (N–1) / 2 Paare für (idealerweise) jedes Paar ordinale Daten erheben: „Fechnerskalierung“: Präferenz erheben Unterstellung einer eindimensionalen Präferenzskala Präferenz nahe 50/50: sehr ähnlich Präferenz eindeutig (100/0 oder 0/100): sehr unähnlich Richtung der Präferenz unerheblich Ähnlichkeit (mehrere Dimensionen möglich) oder Unähnlichkeit (mehrere Dimensionen möglich)

Shepard-Diagramm Wählen einer multidimensionalen „Konfiguration“ jedem Item wird ein Ort in einem m-dimensionalen (typischerweise euklidischen) Raum zugeordnet Für jedes Itempaar gibt es nun zwei Werte: experimentell erhobene Unähnlichkeit Abstand in der Konfiguration Forderung: je unähnlicher, desto weiter entfernt. (schwach) monoton linear (evtl.: durch Ursprung) insbesondere bei Gefahr einer „Entartung“ (Clusterbildung, stufenförmige Shepard-Funktion) kumulativ normal (positiv beschleunigt) häufig bei eindimensionaler Fechnerskalierung, law of comparative judgment, LCJ Anforderung „monoton“ führt (bei großen N) oft zu einer positiv beschleunigen Funktion (LCJ) Präferenz

Stress Abweichung der tatsächlichen Shepard-Daten von der Anforderung S =  ( i<j (aij – f(uij))² / i<j aij² ) Konfiguration gleichmäßig strecken oder stauchen, drehen, spiegeln, verschieben: S bleibt gleich Konfiguration so ändern, daß Stress minimiert wird Alternativen RSQ, R²: quadrierte Korrelation von Abstand zu Unähnlichkeit maximieren ...

Kriterium absolute Kriterien in S (0.1 ausreichend, 0.05 gut, 0,025 exzellent) sind fragwürdig abhängig von Itemzahl und Dimensionszahl je höher die Dimensionszahl, desto mehr Items werden benötigt Scree plot (scree = Halde) keine Verbesserung durch Hinzunahme einer Dimension bei realen Daten fast immer weitere Verbesserung simulated data Number of assumed dimensions Stress

Kriterium absolute Kriterien in S (0.1 ausreichend, 0.05 gut, 0,025 exzellent) sind fragwürdig abhängig von Itemzahl und Dimensionszahl je höher die Dimensionszahl, desto mehr Items werden benötigt Scree plot (scree = Halde) keine Verbesserung durch Hinzunahme einer Dimension bei realen Daten fast immer weitere Verbesserung Vergleich mit Zufallsdaten randomisierte Ähnlichkeit p  0.001 p  0.005 p > 0.1 classroom data basic emotions after Plutchik

Interpretation der Konfiguration explorativ (post-hoc) potentielle Dimensionen aus der Konfiguration erschließen konfirmatorisch (post-hoc oder vorab angenommen) Einzeldaten pro Item zu unterstellten Dimensionen z. B. Rating-Werte zu diesen Dimensionen oder bestimmte soziologische/physikalische/... Parameter der Items Achslagen für unterstellte Dimensionen anhand der Daten festlegen (s. nächste Folie) Beste Achsen auswählen Achsen sollten  orthogonal aufeinander stehen und hoch korrelieren

Korrelationen und Koordinaten Einzeldaten pro Item zu unterstellten Dimensionen Achsen willkürlich in die Konfiguration legen Korrelation der Einzeldaten mit Itemposition entlang der Achse (orthogonale Projektion auf Achse) Achse drehen bis maximale Korrelation erreicht ist „Achse der besten Korrelation“  Basis des Koordinatensystems Koordinatenbasis steht orthogonal auf jeweils anderen Achsen andere Dimensionen sind „Störvariablen“ für zu korrelierende Dimension Achsen bester Korrelation Orthogonalitätsprinzip Koordinatenbasis