Eine kleine Einführung in echte und falsche Metriken, Normen,

Slides:



Advertisements
Ähnliche Präsentationen
Christian Scheideler SS 2009
Advertisements

Polynomial Root Isolation
3. 3D-Betrachtungstransformationen
Statistische Aspekte der PSG
Maschinelles Lernen   Metriken für Nearest Neighbour-Verfahren Lineare Diskriminanzfunktionen.
Prof. Dr. W. Conen 15. November 2004
7. Natürliche Binärbäume
Suche in Texten (Stringsuche )
Finale Semantik und beobachtbares Verhalten
Modellierung und Schätzung von Variogrammen
Ein Modellansatz zur Beschreibung von Vagheiten
Theorie psychometrischer Tests, III
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Multidimensionale Skalierung (..., Shepard, 1962, ...)
Forschungsstatistik I
TESTS. Worum es geht Man möchte testen, ob eine bestimmte Annahme (Hypothese) über Parameter der Realität entspricht oder nicht. Beobachtung (Stichprobe)
Klausurtermin (laut Prüfungsamt) Probeklausur Freitag, 13. Juni 2003 statt Vorlesung.
Didaktik der Geometrie (1)
Folie 1 Kapitel II. Vom Raumbegriff zu algebraischen Strukturen Neubeginn: Herleitung des Begriffs Vektorraum aus intuitiven Vorstellungen über den Raumbegriff.
§14 Basis und Dimension (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.
Folie 1 § 30 Erste Anwendungen (30.2) Rangberechnung: Zur Rangberechnung wird man häufig die elementaren Umformungen verwenden. (30.1) Cramersche Regel:
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
§14 Basis und Dimension  (14.1) Definition: V sei wieder ein K-Vektorraum. Eine Menge B von Vektoren aus V heißt Basis von V, wenn B ist Erzeugendensystem.
§11 Skalarprodukt. Euklidische Räume
Tutorium Willkommen zurück, in der wunderbaren Welt der Statistik Teil II.
Tutorium
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Vorlesung: Biometrie für Studierende der Veterinärmedizin
Wahrscheinlichkeitsrechnung
§10 Vektorraum. Definition und Beispiele
Effiziente Algorithmen
§24 Affine Koordinatensysteme
Ausgleichungsrechnung I
Ausgleichungsrechnung II
Überblick Statistik Deskriptive Statistik=beschreibende Statistik
Vektoren Grundbegriffe für das Information Retrieval
Regionalisierte Variablen und Kriging
Zeichnen linearer Funktionen
Effiziente Algorithmen
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
§23 Basiswechsel und allgemeine lineare Gruppe
§3 Allgemeine lineare Gleichungssysteme
Einführung in die Programmierung Wintersemester 2013/14 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Fuzzymengen – Was ist das?
Kapitel 10 Multikollinearität
Was soll und kann eine fachdidaktische Vorlesung leisten? Maximilian Selinka.
Kapitel 19 Kointegration
Wiederholung: Definition einer Funktion
Lineare Funktionen und ihre Schaubilder, die Geraden
Mathematik: anschaulich + leicht verständlich = einprägsam
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Multivariate Statistische Verfahren
Fundamente der Computational Intelligence (Vorlesung) Prof. Dr. Günter Rudolph Fachbereich Informatik Lehrstuhl für Algorithm Engineering Wintersemester.
Stetige Kleinste-Quadrate-Approximation
Statistik – Regression - Korrelation
Neuer Abschnitt: Modellierung des Raumes
Nichtlineare Optimierung
setzt Linearität des Zusammenhangs voraus
Didaktik der Geometrie (7)
Didaktik der Geometrie (11) Vorlesung im Sommersemester 2004 Prof. Dr. Kristina Reiss Lehrstuhl für Didaktik der Mathematik Universität Augsburg.
Wann ist eine Funktion (über den natürlichen Zahlen) berechenbar?
Datenaustausch und Interoperabilität
Version vom Max-Flow in Orientierten Matroiden Winfried Hochstättler & Robert Nickel Fernuniversität in Hagen Lehrstuhl für Diskrete Mathematik.
Institut für Informationssysteme Technische Universität Braunschweig Institut für Informationssysteme Technische Universität Braunschweig Verdrängung von.
Methoden der Psychologie
Kapitel I. Vorspann zum Begriff Vektorraum
 Präsentation transkript:

Eine kleine Einführung in echte und falsche Metriken, Normen, Eine kleine Einführung in echte und falsche Metriken, Normen, und ihre potentielle Anwendung in der Psychologie der Bedeutung und der Kreativität Christian Kaernbach

Euklidische Metrik – der Normalfall Gegeben zwei Punkte [x1, y1] und [x2, y2] Abstandsvektor [x2 – x1, y2 – y1] = [x, y] Abstand = Länge des Abstandsvektors: d =  (x² + y²) Beispiel: Punkt 1: [-7,3 3,5] Punkt 2: [-4,3 7,5] Abstandsvektor [3 4] Abstand:  (3² + 4²) =  25 = 5

Definition Metrik Eine Metrik ist eine Funktion, die zwei Elementen eines Raumes einen „Abstand“ d  0 zuweist, so daß gilt: d (p, p) = 0 (identische Punkte haben den Abstand 0) d (p, q) = 0  p = q (nichtidentische Punkte haben nicht Abstand 0) d (p, q) = d (q, p) (Symmetrie) d (p, q)  d (p, u) + d (u, q) (Dreiecksungleichung: Umwege lohnen nicht) In einem Vektorraum mit ⇨ „Norm“ (Vektoren besitzen wohldefinierte Länge) gibt es immer eine Metrik: d (p, q) = || p – q || (siehe Euklidische Metrik) Metrik ohne Norm: z. B. diskrete Metrik d (p, q) = 0 für p = q d (p, q) = 1 für p  q q u p

Definition Norm Eine Norm ist eine Funktion, die einem Element v eines Vektorraumes eine „Länge“ || v ||  0 zuweist, so daß gilt: || v || = 0  v = 0 (Definitheit) nichtdefinit: Halbnorm ||  ∙ v || = || ∙ || v || (Homogenität) Verallgemeinerung der Symmetrie || v + w ||  || v || + || w || (Dreiecksungleichung) Beispiel: Euklidische Norm || v || =  ( vi²) verallgemeinert: p-Norm || v || = ( |vi|p) 1/p (p  1) p = 1: Betragssummennorm, Manhattan-Metrik || v || =  |vi| p = 2: Euklidische Norm/Metrik p = : Maximumsnorm, || v || = max(|vi|)

legale p-Normen Konturenplots || v || = ( |vi|p) 1/p mit p  1 Kontur = Menge aller Vektoren mit || v || = c c = 1: „ Einheits kreis “ (grün) c = 0: „Nullmenge“ (grau) p = 1 p = 2 p = 10 Betragssummennorm Manhattan-Metrik Euklidische Norm/Metrik geht in Richtung Maximumsnorm

geht in Richtung „Minimumsnorm“ illegale p-Normen Konturenplots || v || = ( |vi|p) 1/p mit p < 1 Kontur = Menge aller Vektoren mit || v || = c c = 1: „ Einheits kreis “ (grün) c = 0: „Nullmenge“ (grau) p = 0.5 p = -2 p = -10 geht in Richtung „Minimumsnorm“ auch illegale p-Normen sind homogen p < 1: „Norm“ verletzt Dreiecksungleichung p < 0: „Norm“ verletzt Definitheit (|| v || = 0  v = 0) illegale Halbnorm

Schnitt Mathematik Psychologie

Semantische Räume Aktivierungsausbreitung im Langzeitgedächtnis: Perlmutter & Anderson (unveröffentlicht) Hund - K Zocker - K „Katze“ „Karte“ Knochen - F Knochen - F „Fleisch“ „Fleisch“ ... RZ: 1.41 s RZ: 1.53 s 120 ms Priming Effekt Hund Knochen Katze Fleisch Zocker Karte

Multidimensionale Skalierung Hund Knochen Katze Fleisch Zocker Karte Multidimensionale Skalierung Semantische Ähnlichkeitsurteile führen zur Schätzung einer Konfiguration der Begriffe in einem mehrdimensionalen Raum Beispiel: Konfiguration von 8 Emotionsbegriffen in einer Ebene A Abscheu D Billigung G Erwartung J Freude M Furcht P Traurigkeit T Überraschung W Wut Vorausgesetzt wird: Es gibt einen mehrdimensionalen semantischen Raum mit euklidischer Metrik. Gefragt wird höchstens: Was bedeuten die Achsen? Wie hoch-dimensional ist der semantische Raum? Erregung positiv negativ

Multidimensionale Skalierung Hund Knochen Katze Fleisch Zocker Karte Multidimensionale Skalierung Abhängigkeit des Stresses (Abweichungsmaß) für verschiedene angenommene Dimensionszahlen von der tatsächlichen Dimensionalität 20 items 30 Wiederholungen Scharparameter: tatsächliche Dimensionalität, 1.0 1.1 1.2 ... 4.8 4.9 5.0 Dimensionalität von 1.2 Streß angenommene Dimensionszahl

Assoziationen Fragestellungen: Ist es sinnvoll, zwischen Begriffen (z. B. Knotenpunkten im Gedächtnismodel) „Abstände“ definieren zu wollen? Sollten diese „Abstände“ die Dreiecksungleichung erfüllen? Intuitives Gegenargument: Bei Assoziationen helfen „Eselsbrücken“, d. h. Umwege können Abkürzungen sein. Was verbindet Wurst mit Gruppe? Der „Abstand“ von Assoziationen könnte durch den kürzesten „Partialabstand“ (Material, Funktion, ...) bestimmt sein („Minimumsnorm“). Ist es mathematisch sinnvoll / für die Modellbildung hilfreich / für die Empirie fruchtbar, „Abstände“ zwischen Begriffen mit illegalen Normen zu beschreiben?

Gedächtnismodelle Klassisches Netzwerkmodell Zocker Katze Hund parallel distributed processing, PDP, neuronale Netzwerke Ähnlichkeiten von Zuständen werden über Korrelationen definiert Hund Knochen Katze Fleisch Zocker Karte

Korrelationen Fragestellungen: Sind die bei neuronalen Netzwerken zur Beschreibung der Ähnlichkeit zweier Zustände verwendeten Korrelationen besser geeignet als „Abstände“ zur Beschreibung der Beziehungen von semantischen Begriffen? Wie würde man Korrelationen in Abstände übersetzen? Negative Korrelationen würden in positive übersetzt. c (A, A) = 1  aus Korrelation 1 mach Abstand d1 = 0  Halbmetrik Maximaler Abstand d0 wenn c (A, B) = 0 Wenn die Dreiecksungleichung gelten soll, c(a...b,c...d) = 0, muß d0 endlich sein: d0  2∙d0,5 c(a...b,a...d) = c(a...d,c...d) = 0,5 Korrelationsmetrik entspricht a...d Metrik auf Halbkugeloberfläche. a...b c...d

Fazit Hund Knochen Katze Fleisch Zocker Karte Eine an Korrelationen orientierte Metrik erhält die Dreiecksungleichung. Bei dieser Metrik gibt es einen maximalen Abstand. Können wir mit der Vorstellung eines maximalen Abstands von Assoziationen leben? Lokal kann sie durch eine euklidische Metrik angenähert werden. MDS verwandter Begriffe wäre sinnvoll und möglich. Eselsbrücken scheinen die Dreiecksungleichung zu verletzen. Aufgabe: Experimentelle Überprüfung der Dreiecksungleichung... ... aber wie?

Ausblick Hund Knochen Katze Fleisch Zocker Karte Aufgabe: Experimentelle Überprüfung der Dreiecksungleichung... ... aber wie? Man kann nicht irgendein Assoziationsmaß A Ratings Priming Koinzidenz in Texten [Google]) direkt auf die Dreiecksungleichung testen, weil A mit d nicht linear zusammenhängen muß Sei d die Euklidische Metrik. Dann ist A = d² keine Metrik. Sei d (a, b) = d (b, c) = 1, d (a, c) = 2. Es gilt 1 + 1  2, aber nicht 1² + 1²  2². Multidimensionale Skalierung läßt beliebigen Funktionszusammenhang zwischen A und d zu. Wenn man nur Monotonität fordert, wird A = f (d) rekonstruiert. Wenn die Dreiecksungleichung nicht gilt, sollte man das am Streß erkennen.

Probleme Hund Knochen Katze Fleisch Zocker Karte Aufgabe: Experimentelle Überprüfung der Dreiecksungleichung... Multidimensionale Skalierung läßt beliebigen Funktionszusammenhang zwischen A und d zu. Wenn man nur Monotonität fordert, wird A = f (d) rekonstruiert. Wenn die Dreiecksungleichung nicht gilt, sollte man das am Streß erkennen...??? Monotone MDS birgt das Risiko der Entartung Simulationen mit Daten, die aus illegalen p-Normen erzeugt werden führen vermutlich zu erhöhten Streß-Werten. So weit so gut... Einfluß von Rauschen (Datenfehlern) verwechselbar mit Streß wegen Verletzung der Dreiecksungleichung? Einfluß von gekrümmten Topologien möglicherweise erkennbar an der Streßverteilung: sollte eher Streß bei hohen Abständen ergeben als bei niedrigen. Sensitivität der MDS-Methode für Verletzungen der zugrundeliegenden Annahmen

confused Danke