Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße 05.11.2015.

Slides:



Advertisements
Ähnliche Präsentationen
1 Workshop: Grundlagen des IT-Projektmanagements - Version /2004Modul: Aufwand – Ergänzung FP Copyright: Dr. Klaus Röber Modul Ergänzungen zur.
Advertisements

Informatik II: Algorithmen und Datenstrukturen SS 2013
Motivation Bisher: Codes mit möglichst kurzer Codelänge.
Dr. Brigitte Mathiak Kapitel 10 Physische Datenorganisation.
Universität Dortmund, Lehrstuhl Informatik 1 EINI II Einführung in die Informatik für Naturwissenschaftler und Ingenieure.
FH-Hof Der B-Baum Richard Göbel. FH-Hof Wahl des Verzweigungsgrad Verzweigungsgrad kann größer als 2 sein v Nachfolger für einen Knoten v-1 Werte in einem.
Strukturlösung mit Hilfe der Patterson-Funktion
Prioritätswarteschlangen
Messen „Messen ist die Bestimmung der Ausprägung einer
Grundlagen der Geometrie
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Gliederung Motivation / Grundlagen Sortierverfahren
Nutzung und Bedeutung von Business Intelligence und Business Intelligence Methoden und -Werkzeugen Durch die Analyse des BI mit dem Fokus der Managementunterstützung.
Sortierverfahren Richard Göbel.
Sortierverfahren Richard Göbel.
Einführung Richard Göbel.
Bilder und Rasterdaten
Baumstrukturen Richard Göbel.
Fehlererkennende Codes
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (23 – Sortieren vorsortierter Daten) Prof. Th. Ottmann.
Sortieren vorsortierter Daten
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Reguläre Sprachen Karin Haenelt.
© Karin Haenelt 2006, Äquivalenzen Reg.Ausdrücke, Reg.Sprachen, EA ( ) 1 Reguläre Sprachen Karin Haenelt.
Demoprogramm: Clustering Eine graphische Demonstration verschiedener Clusteringalgorithmen anhand des Clusterings von Punkten im zweidimensionalen Raum.
Quantitative Methoden I
PG 487 Methoden der Computational Intelligence in der Bioinformatik
Diskurs Fragebögen Auswertung.
Inhalt Einführung Problemstellung / Ziele Definitionen
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
Vorlesung Gestaltung von soziotechnischen Informationssystemen - RequirementsEngineering und Contextual Design- Thomas Herrmann, Lehrstuhl Informations-
Clusteranalyse von Maria Eickhold und Tobias Töpfer.
Chair of Software Engineering Einführung in die Programmierung Prof. Dr. Bertrand Meyer Lecture 13: (Container-)Datenstrukturen.
Algorithmen Gruppe 4.
Einführung in die Programmierung
Chair of Software Engineering Einführung in die Programmierung Prof. Dr. Bertrand Meyer Lecture 13: (Container-)Datenstrukturen.
Diskrete Mathematik II
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
§3 Allgemeine lineare Gleichungssysteme
Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Textfelder, Grafiken,... Schreibe als Untertitel:
Die Struktur von Untersuchungen
Lineare Algebra Außerdem bieten Determinanten
1 Kap. 2 - Aufbau von Prozessoren ComputerarchitekturBéat HirsbrunnerS Oktober Primäre Speicher Fehlerkorrekturcodes.
Ein Überblick über verschiedene Verfahren
ICT – Modul Textverarbeitung
Statistische Methoden in der Wirtschafts- und Sozialgeographie
Statistik Statistik I Seminar + Blockveranstaltung Statistik I
Arbeiten mit Grafiken – Übungen für Fortgeschrittene Folge den Anweisungen auf den Folien!
Veranstaltung 4.
Die Clusteranalyse Zielsetzung Datenreduktion: Zusammenfassung einer Vielzahl von Objekten oder Variablen zu Gruppen mit möglichst ähnlichem Informationsgehalt.
1 Erstellung eines Lebenslaufes
ANLEITUNG LEERE VORLAGE
Messen Zuordnung von Zahlen zu Objekten/Ereignissen gemäß Regeln
Erklärungen zum Bau der Kiste
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Datenstrukturen für den Algorithmus von.
Grundlagen der Geometrie
Mathematik für BiologInnen WS 05
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
Algorithmen und Datenstrukturen Prof. Dr. Ralf Möller Universität zu Lübeck Institut für Informationssysteme Stefan Werner (Übungen) sowie viele Tutoren.
Strategy Pattern Teachlet Autor: Sven Wende Replay durch Stephan Schwake Konzepte objektorientierter Programmiersprachen, SS 2006.
X. Übungsblatt – Aufgabe X Das Bild zeigt ein Diagramm, dass die Nachbarschafsbeziehungen für einen Code mit 3 Binärstellen darstellt. a)Welche Hamming-Distanz.
CL Tree MW 31.1 Business Intelligence Wintersemester 2015 / 2016 Stanislav Prokupetz.
Eine besondere Leitidee
Christoph Wirtz | Seminarvortrag EBC | Lehrstuhl für Gebäude- und Raumklimatechnik Ein Tool zum automatisierten Erstellen von Conversion Scripts.
Clusteranalyse Wege und Arten Entstanden im Rahmen der Seminararbeit für WS09/10 Betreuer: Prof. Jobst Hoffmann Dr. Tim Hiddemann Aachen, Januar 2010.
Exkurs: Chi-quadrat und Modellgüte 1. ist ein Distanzmaß, welches die Distanz zwischen Modellvorhersage und Daten misst.  Je kleiner desto besser ist.
Remote Method Invocation
 Präsentation transkript:

Lehrstuhl für Wirtschaftsinformatik Univ.-Prof. Dr. Johannes Ruhland Referent: Vogel, Stephan Business Intelligence Distanzmaße

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 2 Distanzmaße für nicht-kardinalskalierte Daten für Skalenniveaus nominalskaliert: Ausprägungen sind unterscheidbar (Farben) ordinalskaliert: einfache Rangfolge der Ausprägung (Schulnoten) messen Abstand zwischen zwei Objekten Distanzen werden hier durch Ähnlichkeiten gemessen hierdurch ist eine Clusterung von Daten möglich

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 3 Hamming-Distanz benannt nach dem Mathematiker Richard Wesley Hamming vergleicht zwei gleichlange Vektoren miteinander Hamming-Distanz ist dabei die Summe der Unterschiede zweier Vektoren

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 4 Hamming-Distanz Anwendung Fehlererkennung bei Code-Übermittlung Einigung auf Code-Wörter Hamming-Distanz ist ausschlaggebend für Erkennung und Korrektur von Fehlern Iris-Scanner-Algorithmus Clustering von z.B. Kunden

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 5 Ulam-Distanz misst den Unterschied zweier ordinal strukturierter Vektoren, indem sie die minimalste Anzahl an Lösch-, Verschiebe- und Einfüge-Operationen zählt, die dazu nötig sind den einen in den anderen Vektor zu überführen. Ablauf der Operationen für einen Durchgang 1.Lösche oder schneide ein Element aus, welches nicht mit seinem zugehörigen Element übereinstimmt. 2.Verschiebe die restlichen Elemente, um die Lücke zu entfernen. 3.Verschiebe die Elemente, um eine Lücke für das neue entsprechende Element zu schaffen. 4.Füge das neue oder ausgeschnittene Element ein.

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 6 Ulam-Distanz Anwendung Rechtschreibprüfung Genetik Clustering von Tickets

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 7 Ulam-Distanz Anwendung

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 8 Ulam-Distanz Anwendung

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 9 Hamming-Distanz vs. Ulam-Metrik EigenschaftHammingUlam VektorenlängeVektoren müssen gleiche Länge haben Vektoren können unterschiedlich lang sein Skalenniveauordinal- und nominalskalierte Daten OperationsaufwandniedrigHoch Mögliche Elementegesamtes Alphabet

Vertiefungsmodul Daten-, Informations-, Wissensmanagement Folie 10 Literatur Christoph Beierle, Gabriele Kern-Isberner; Methoden wissensbasierter Systeme: Grundlagen Algorithmen Anwendungen; Springer-Verlag 2013; Seite 180 f.. Moses Charikar, Robert Krauthgamer; Embedding the Ulam metric into l1; erschienen in THEORY OF COMPUTING, Volume 2; THEORY OF COMPUTING 2006; Seite 208 ff.. Teknomo Kardi; Online: tutorial/Similarity/HammingDistance.html ; Zugriff Teknomo Kardi; Online: tutorial/Similarity/UlamDistance.html ; Zugriff