Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße 05.11.2015.

Ähnliche Präsentationen


Präsentation zum Thema: "Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße 05.11.2015."—  Präsentation transkript:

1 Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße

2 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 2 Distanzmaße für nicht-kardinalskalierte Daten für Skalenniveaus nominalskaliert: Ausprägungen sind unterscheidbar (Farben) ordinalskaliert: einfache Rangfolge der Ausprägung (Schulnoten) messen Abstand zwischen zwei Objekten Distanzen werden hier durch Ähnlichkeiten gemessen hierdurch ist eine Clusterung von Daten möglich

3 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 3 Hamming-Distanz benannt nach dem Mathematiker Richard Wesley Hamming vergleicht zwei gleichlange Vektoren miteinander Hamming-Distanz ist dabei die Summe der Unterschiede zweier Vektoren

4 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 4 Hamming-Distanz Anwendung Fehlererkennung bei Code-Übermittlung Einigung auf Code-Wörter Hamming-Distanz ist ausschlaggebend für Erkennung und Korrektur von Fehlern Iris-Scanner-Algorithmus Clustering von z.B. Kunden

5 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 5 Ulam-Distanz misst den Unterschied zweier ordinal strukturierter Vektoren, indem sie die minimalste Anzahl an Lösch-, Verschiebe- und Einfüge-Operationen zählt, die dazu nötig sind den einen in den anderen Vektor zu überführen. Ablauf der Operationen für einen Durchgang 1.Lösche oder schneide ein Element aus, welches nicht mit seinem zugehörigen Element übereinstimmt. 2.Verschiebe die restlichen Elemente, um die Lücke zu entfernen. 3.Verschiebe die Elemente, um eine Lücke für das neue entsprechende Element zu schaffen. 4.Füge das neue oder ausgeschnittene Element ein.

6 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 6 Ulam-Distanz Anwendung Rechtschreibprüfung Genetik Clustering von Tickets

7 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 7 Ulam-Distanz Anwendung

8 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 8 Ulam-Distanz Anwendung

9 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 9 Hamming-Distanz vs. Ulam-Metrik EigenschaftHammingUlam VektorenlängeVektoren müssen gleiche Länge haben Vektoren können unterschiedlich lang sein Skalenniveauordinal- und nominalskalierte Daten OperationsaufwandniedrigHoch Mögliche Elementegesamtes Alphabet

10 Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 10 Literatur Christoph Beierle, Gabriele Kern-Isberner; Methoden wissensbasierter Systeme: Grundlagen Algorithmen Anwendungen; Springer-Verlag 2013; Seite 180 f.. Moses Charikar, Robert Krauthgamer; Embedding the Ulam metric into l1; erschienen in THEORY OF COMPUTING, Volume 2; THEORY OF COMPUTING 2006; Seite 208 ff.. Teknomo Kardi; Online: tutorial/Similarity/HammingDistance.html ; Zugriff Teknomo Kardi; Online: tutorial/Similarity/UlamDistance.html ; Zugriff


Herunterladen ppt "Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße 05.11.2015."

Ähnliche Präsentationen


Google-Anzeigen