Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 6 Distanzfunktionen 6.1 Eigenschaften und Klassifikation 6.2 Distanzfunktionen.

Ähnliche Präsentationen


Präsentation zum Thema: "ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 6 Distanzfunktionen 6.1 Eigenschaften und Klassifikation 6.2 Distanzfunktionen."—  Präsentation transkript:

1 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de1 6 Distanzfunktionen 6.1 Eigenschaften und Klassifikation 6.2 Distanzfunktionen auf Punkten - Minkowski-Distanzfunktion L m - Gewichtete Minkowski- Distanzfunktion L m w - Quadratische Distanzfunktion d q - Quadratische Pseudo-Distanzfunktion - Dynamical-Partial-Semi- Pseudo-Distanzfunktion - Chi-Quadrat-Semi-Pseudo- Distanzfunktion

2 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de2 6.1 Eigenschaften und Klassifikationen Abbildung Feature-Werte zweier Medien-Objekte auf nichtnegative, reelle Zahl Distanzwert 0 bedeutet maximale Ähnlichkeit Invarianz einer Distanzfunktion also Unabhängigkeit bzgl. Operation Translation Skalierung Rotation

3 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de3 Formale Eigenschaften einer Distanzfunktion binäre Funktion mit und Selbstidentität (Si): Positivität (Pos): Symmetrie (Sym): Dreiecksungleichung (Dreieck):

4 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de4 Klassifikation anhand Erfüllung der Eigenschaften

5 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de5 Beispiele von Distanzfunktionen absoluter Betrag der Differenz zweier reeller Zahlen euklidsche Distanzfunktion auf Punkten der Menge

6 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de6 Beispiel einer Pseudo-Distanzfunktion indiskrete Pseudo-Distanzfunktion, die jedem Elementepaar aus den Wert 0 zuweist: (Funktion ist praktisch sinnlos)

7 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de7 Beispiel einer Semi-Distanzfunktion Semi-Distanzfunktion auf der Menge {a, b, c}: Die Dreiecksungleichung ist nicht garantiert:

8 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de8 Weitere Eigenschaften von Distanzfunktionen folgende Eigenschaften werden an konkreten Funktionen getestet: Invarianz bzgl. Translation anhand Translationsobjekt T: Skalierung anhand Skalar S: Rotation anhand Rotationsobjekt R: d(S*o 1,S*o 2 ) Fehler im Buch

9 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de9 Darstellung des Einheitskreises: alle Punkte, für die gilt ( ist Zentrum) Weitere Eigenschaften von Distanzfunktionen (2) Nicht jeder Einheitskreis besitzt Kreisform!

10 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de10 Distanzeigenschaften im Einheitskreis verschiedene Eigenschaften sind graphisch aus Einheitskreis erkennbar: Selbstidentität: Zentrum liegt auf Kreis mit Radius 0. Positivität: Alle Punkte ungleich Zentrum liegen außerhalb des Kreises mit dem Radius 0

11 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de11 Distanzeigenschaften im Einheitskreis (2) Translationsinvarianz: Einheitskreis ändert Form nicht, wenn Zentrum verschoben wird Symmetrie: bei Translationsinvarianz und Symmetrie teilt Zentrum jede Diagonale zwischen zwei Randpunkten in genau zwei gleich lange Teile Rotationsinvarianz: Einheitskreis ist bzgl. Zentrum rotationssymmetrisch

12 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de12 6.2 Distanzfunktion auf Punkten Datentyp: array [1..n] (real) Minkowski-Distanzfunktion L m Gewichtete Minkowski-Distanzfunktion L m w Quadratische Distanzfunktion d q Quadratische Pseudo-Distanzfunktion Dynamical-Partial-Semi-Pseudo-Distanzfunktion Chi-Quadrat-Semi-Pseudo-Distanzfunktion

13 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de13 Minkowski-Distanzfunktion am häufigsten eingesetzte Distanzfunktion auf Punkten mit : Sonderfall bei :

14 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de14 Translationsinvarianz T sein ein -dimensionaler Vektor, der durch die Differenzberechnung aus der Formel verschwindet: aber keine Skalierungs- oder Rotationsinvarianz

15 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de15 Einheitskreise

16 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de16 Holdersche Ungleichung es gilt immer: also: Einheitskreis mit niedrigem -Wert liegt innerhalb Einheitskreises mit höherem -Wert

17 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de17 Sonderfall euklidsche Distanzfunktion (m=2) entspricht Länge der Geraden durch beide Punkte Einheitskreis ist kreisförmig Rotationsinvarianz ist erfüllt, da Orthonormalmatrix Matrizenschreibweise:

18 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de18 Berechnung von Reihenfolgen anhand Minkowski-Dist.-fkt. Achtung: unterschiedliche -Werte erzeugen unterschiedliche Reihenfolgen! Beispiel: Abstände dieser Punkte vom Koordinaten-ursprung :

19 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de19 Gewichtete Minkowski-Distanzfunktion achsenparallele Stauchung und Streckung durch Gewichte : Forderung:

20 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de20 Einheitskreis w 1 =0,5, w 2 =1 Translationsinvarianz keine Skalierungsinvarianz keine Rotationsinvarianz

21 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de21 Quadratische Distanzfunktion Matrizenschreibweise: A im -dimensionalen Raum ist symmetrische, positiv definite Matrix

22 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de22 Matrix A Einheitsmatrix : identisch mit Diagonalmatrix: entspricht (Gewichte korrespondieren zu Diagonalelementen) ansonsten: nichtuniforme Skalierung, Rotation, Spiegelung der Punkte

23 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de23 Symmetrische positiv definierte Matrix A es gilt immer: (Eigenwertzerlegung): ist orthonormale Matrix (Rotation anhand Eigenvektoren) ist Diagonalmatrix (Skalierung anhand Eigenwerten)

24 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de24 Berechnung der Distanz mittels auf transformierten Punkten oft relativ schnell realisierbar Symmetrische positiv definierte Matrix A (2)

25 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de25 Invarianzen Translationsinvarianz keine Skalierungsinvarianz keine Rotationsinvarianz

26 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de26 Beispielmatrix

27 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de27 Einheitskreis des Beispiels

28 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de28 Mahalanobis-Distanzfunktion Einsatz der quadratischen Distanzfunktion, wenn Distanzberechnung Kombination unterschiedlicher Dimensionen erfordert Grundlage kann Kovarianzmatrix auf Dimensionen sein Mahalanobis-Distanzfunktion

29 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de29 Quadratische Pseudo-Distanzfunktion Aufgabe der Forderung nach Positiv-Definitheit für A Ziel: unsymmetrische Translationsinvarianz bzgl. Vektoren des Vektorraums : Konstruktion der Matrix A aus geeigneter Orthogonalbasis und Diagonalmatrix

30 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de30 den -Vektoren entsprechende Diagonalwerte von L auf Null setzen seien mit die durch auf Null gesetzten -Spaltenvektoren, dann gilt für Linearkombinationen hiervon: Quadratische Pseudo-Distanzfunktion (2)

31 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de31 Nachweis der Translationsinvarianz Der entscheidende Schritt: laut Def ist dieser Term 0

32 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de32 Beispiel Quadratische Pseudo-Distanzfunktion Konstruktion Translationsinvarianz im Winkel von 40 Grad:

33 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de33 Beispiel Quadratische Pseudo-Distanzfunktion (2) Die Kombination dieser Matrizen ergibt die gewünschte Matrix A:

34 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de34 Einheitskreis des Beispiels

35 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de35 Dynamical-Partial-Semi-Pseudo-Distanzfunktion folgende Beobachtungen Chang/Wu03 bzgl. Unähnlichkeit im hochdimensionalen Raum: ähnliche Objekte liegen meist nur in wenigen Dimensionen nebeneinander Ähnlichkeit kann häufig nicht an bestimmten Dimensionen festgemacht werden

36 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de36 Dynamical-Partial-Semi-Pseudo-Distanzfunktion Problem mit Minkowski-Distanzfunktion: alle Dimensionen werden berücksichtigt Berücksichtigung einer dynamischen Untermenge der Dimensionen

37 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de37 Dynamic-Partial-Semi-Pseudo-Distanzfunktion (2) und seien zwei Punkte im -dimensionalen Raum und der Abstand in Dimension nur die kleinsten Abstände werden berücksichtigt:

38 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de38 Eigenschaften Selbstidentität und Symmetrie sind erfüllt Verletzung der Positivität und Dreiecksungleichung

39 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de39 Einheitskreis zweidimensionaler Raum und

40 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de40 Chi-Quadrat-Semi-Pseudo-Distanzfunktion Abstand zwischen Histogrammen mit absoluten Häufigkeiten ursprünglich in Statistik entwickelt Untersuchung von Abhängigkeit zwischen Zufallsvariablen basiert auf Nullhypothese: Häufigkeitsverteilungen sind gleich also Differenz zwischen erwarteten und tatsächlichen Häufigkeiten beträgt 0

41 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de41 Chi-Quadrat-Semi-Pseudo-Distanzfunktion (2) erwartete Häufigkeiten:

42 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de42 Beispiel Test, ob Grippedoppelimpfung Grippe verhindern kann Befragung verschiedener Personen über Auftreten von Grippe und Impfungen erwartete Werte sind in Klammern notiert

43 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de43 Berechnung der erwarteten Häufigkeiten wenn kein Zusammenhang zwischen Impfung und Gruppe, dann Wert jeder Zelle abschätzbar

44 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de44 Berechnung der erwarteten Häufigkeiten / Wahrscheinlichkeiten Beispiel Grippe(=j=1)/keine Impfung (=i=1); vgl. keine Impfung p 1 mit Doppelimpfung p 2 Häufigkeit für Grippe ist 24+13 = 37 =p 1 [j]+p 2 [j] Wahrsch. für keine Impfung ist 313 = p i [1]+p i [2] = n a=1 p i [a] Multiplizierte Häufigkeit für Grippe/keine Impfung ist 37*313 ~ Zähler Nenner: 24+289+13+565 =313+565=878 erwartete Häufigkeit: 37*313 / 878 = 13,19 Erwartete Wahrscheinlichkeit: p i [j] = 13,19 / 878 ^ Bemerkung: die Rechnung im Buch berücksichtigt die drei (!) Zufallsvariablen: 1.Keine Impfung 2.Eine Impfung 3.Doppelimpfung

45 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de45 Eigenschaften Selbstidentität und Symmetrie sind erfüllt Rotationsinvarianz keine Positivität keine Dreiecksungleichung

46 ISWeb - Information Systems & Semantic Web Marcin Grzegorzek marcin@uni-koblenz.de46 Einheitskreis Abstand 0,1 um (1; 0,5)


Herunterladen ppt "ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 6 Distanzfunktionen 6.1 Eigenschaften und Klassifikation 6.2 Distanzfunktionen."

Ähnliche Präsentationen


Google-Anzeigen