Der Ähnlichkeitsbegriff und die Suche nach Information

Slides:



Advertisements
Ähnliche Präsentationen
Algorithmen und Datenstrukturen
Advertisements

Arbeitsablauf basierte Grid Anwendungen
Netzwerke in der Informationstechnik
Regina Mirvis, Senior Consultant
PC-Senioren Ludwigsburg
Eine dynamische Menge, die diese Operationen unterstützt,
Vorlesung Programmieren II
Erkundung eines Berufs
Frame-Logik Eine Einführung Andreas Glausch.
Verben 1 Verben 2 Modal s 1 Präsens Modal 2 Imperfekt Translate!
Beim 1 beim 2 Modal s 1 Präsens Modal 2 Imperfekt Translate!
Finale Semantik und beobachtbares Verhalten
Ich habe nie gelernt, Aufgaben zu lösen
Design Patterns- Entwurfsmuster
Auswertung der Interviews
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
On a Buzzword: Hierachical Structure David Parnas.
Universität Stuttgart Institut für Kernenergetik und Energiesysteme Was ist Refactoring? Bevor man die Integration angeht, mag es angebracht sein, den.
Kapitel 1 Das Schubfachprinzip
Datenbankentwurf mit Hilfe des ER-Modells entwickeln
Prof. Dr. T. Kudraß1 Relationenkalkül. Prof. Dr. T. Kudraß2 Relationenkalkül Zwei Ausprägungen: Tupelrelationenkalkül (TRK) und Domänenrelationenkalkül.
Rigi und Web2Rsf vorgestellt von Tobias Weigand. Inhalt Ziel von Web2Rsf und Rigi Vorstellung des Parsers Web2Rsf Vorstellung des Werkzeugs Rigi Analyse.
Algorithmische Geometrie
Was sind Histogramme? (1)
Qualitätskriterien zur Beurteilung von Dokumentationen
Fortgeschrittene Methoden der Wissensorganisation
Dijkstras Suche nach kürzesten Wegen Prof. Dr. Wolfram FH Gelsenkirchen MGI Version 0.9.
Die Simulation von Planetenbewegungen
UML Begleitdokumentation des Projekts
Grundbegriffe der Schulgeometrie
Theoretische Grundlagen der Pragmalinguistik II (Bühler; Grice)
Imperative Practice Write all commands for each verb given on notebook paper. Turn in today with the worksheet.
Rebound-Effekte und Psychologische Handlungsmodelle
Reboundeffekte aus psychologischer Sicht: Theoretische Einbettung
Michael Haverbeck System Engineer
Don`t make me think! A Common Sense Approach to Web Usability
Management, Führung & Kommunikation
Deutsch 1 Review for Chapter 4 Deutsch 1 Review for Chapter 4.
Geniesse, was du erreicht hast und strebe weiter die Höchstnote an
Beschreib Köln!. Beschreib Köln! Köln liegt in Nordwestdeutschland und befindet sich am Rhein in der Nähe von Bonn. Köln ist eine sehr groβe Stadt und.
Theorien, Methoden, Modelle und Praxis
Universität zu Köln Institut für Historisch-Kulturwissenschaftliche Informationsverarbeitung Prof. Dr. M. Thaller AM1: Re-usable Content in 3D und Simulationssystemen.
Effiziente Algorithmen Hartmut Klauck Universität Frankfurt SS
§3 Allgemeine lineare Gleichungssysteme
Einführung in die Informatik für Naturwissenschaftler und Ingenieure
Einführung in die Programmierung Wintersemester 2013/14 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
You need to use your mouse to see this presentation © Heidi Behrens.
Die Struktur von Untersuchungen
Erfindervon Fuzzy Logic
Unterhaltung und Freizeit
Engineering tools for the NEO engineer
Geschichte eines Japanischen Gartens 日本庭園.
qualitativ und quantitativ qualitative Korpusanalyse quantitative Korpusanalyse.
Workshop FamConnector – Aktivitäten auf der Plattform: Malen & Zeichnen und Lernen.
Auswertung Evaluation Evaluierung You havent defined it until you say how you will measure it Umfrage Formulare langweilig Muss müde Ende Schublade Kontrolle.
Management, Führung & Kommunikation
Lernzyklus Lerntypen MacherInnen EntdeckerInnen DenkerInnen
Grammatikalische Begriffe im Unterricht
Die Fragen Wörter Wer? Was? Wann?.
 SAP AG 2002, Title of Presentation, Speaker Name / 1 Business Software eingeführt! Wie geht es weiter? 3. Auf was kommt es nach der Einführung einer.
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
Dieser Vortrag wird gesponsort von:
Die Zeit zurück drehen? Autoplay Michael Hirte Amazing Grace.
Geoinformationssysteme
Der Konjunktiv II.
Best of Consulting Project Excellence 2012 Projektexterne Kunden über das Beratungsunternehmen.
Gleichungen, Ungleichungen, Unbekannte, Variable – Auffassungen angehender Lehrkräfte Franz Embacher Fakultät für Mathematik der Universität Wien Vortrag.
Erstelle deinen Avatar von Doktor-Conversion. Inhalt Was ist ein Avatar?...…………………………………………………………….. Was ist ein B-Vatar? ……………………………………… ………
Auffassung zur Wissenschaft Ziele: Sie beziehen die Informationen von der Internetseite "Understanding Science" auf Psychologie. Entwicklungsimpuls zu.
Igor Vaynerman ISMOD-V ÜbungSS061 ISMOD-V Übung 3 Igor Vaynerman 8 Juni 2006.
 Präsentation transkript:

Der Ähnlichkeitsbegriff und die Suche nach Information Michael M. Richter Department of Computer Science University of Calgary

Warum sind wir an Informationen interessiert? Informationen haben einen Zweck ist: Handlungen überhaupt auszuführen besser auszuführen. Der Handlungsbegriff wird sehr allgemein gefasst: Handlungen verändern etwas: Die Umwelt Das Bewusstsein etc. Es bleibt die Frage: Was heisst besser?

Was heisst „Besser“? Handlungen und Prozesse haben ein Ziel, das mehr oder weniger erreicht werden kann. Ökonomisch-Mathematische Theorie: Nutzentheorie. Historische Wurzeln: Daniel Bernoulli (1730, erste Begriffe) v.Neumann – Morgenstern (1944, mathematische Theorie) Savage, Aumann (nach 1950, Formalisierung subjektiver Sichtweisen. Ein Ziel heisst besser erreicht, wenn der Nutzen steigt. Informationen sind dazu da, Handlungen so auszuführen dass der Nutzen steigt.

Kontext Der Kontext ist im Prinzip alles das was für den Prozess relevant sein kann und ist deshalb oft subjektiv. Der Kontext definiert das Ziel und die Nützlichkeit einer Ressource. Der Kontext ist oft nur ungenau bekannt: Man erhält also kein klares mathematisch definiertes Problem.

Nutzenoptimierung v.Neumann-Morgenstern: Optimiere den erwarteten Nutzen! Voraussetzung: Die Nutzenfunktion liegt präzise vor Das ist ein Problem bei subjektiven teilweise unbekannten vagen Nutzenfunktionen

Wissen und Nutzen Wissen hat deshalb einen Wert, wir können es kaufen verkaufen Das ist keine Erkenntnis unserer Zeit! Wir kennen das seit Jahrhunderten, z.B. die britische Regierung verhielt sich zur Kolonialzeit so. Konsequenz: Wissensmanagement!

Das Retrievalproblem Informationen sammeln kann jeder Aber wenige können benötigte Informationen finden. Situation: Ich möchte eine Aktion ausführen Ich frage also: Bitte helfen Sie mir mit den nötigen Informationen! Da machen wir uns mal auf die Suche! Aber wie?

Zwei Arten von Suche Logik orientierte Suche: Wir suchen die home page einer bestimmten Konferenz Das ist ein 0-1 Problem, entweder erhalten wir die home page oder nicht. Die Antwort muss exakt sein. Approximation orientierte Suche: Wir suchen die Telefonnummer einer Person welche gut über das Physikstudium in der Schweiz Bescheid weis. Hier ist die Antwort weniger klar. Auch mag eine ideale Person gar nicht existieren.

Approximation, Abstand und Ähnlichkeit Approximation benötigt Abstandsfunktionen. Dual dazu: Ähnlichkeitsmasse. Traditionell: Numerik Heute auch: Symbolische Bereiche Das erlaubt die Anwendung der Methode des nächsten Nachbarn

Was heisst “ähnlich”? (1) Es gibt kaum einen Begriff über den so unterschiedliche Meinungen bestehen. In der Umgangssprache meint man meist “ähnlich aussehen”. Aber der Begriff wird auch in vielen Disziplinen verwendet: Philosophie Kunst, Design Machinelles Lernen Pattern Recognition Fallbasiertes und analoges Schließen E- commerce

Was heisst “ähnlich”?(2) Ähnlichkeit hat mit der Gleichheit gemeinsam, dass es sich auf unterschiedliche Aspekte beziehen kann: Größe, Form, Farbe Herkunft, etc. Ähnlichkeit ist oft subjektiv: Eine Person mag zwei Autos ähnlich finden, eine andere nicht. Das liegt an den unterschiedlichen Interessen und ist oft auch durch Emotionen beeinflusst.

Ähnlichkeit als eine Relation Drei Möglichkeiten: i) binäres Prädikat: “x und y sind ähnlich” ii) binäres Unterschiedsprädikat: “x und y sind unähnlich” iii) Ordnungsrelation: “x ist mindestens so ähnlich zu y wie zu z” Optimalität: Wenn y am ähnlichsten zu x heisst es nächster Nachbar von x. Notation : NN(x,y)

Ähnlichkeitsmaße Ein Ähnlichkeitsmaß bringt einen quantitativen Aspekt. In seiner abstrakten Form hat das Maß zwei Argumente von zwei beliebigen Mengen F (genannt Fragen) A (Genannt Antworten): Ein Ähnlichkeitsmaß ist eine Abbildung sim: F x A [0,1] (reelles Intervall) .

Ein allgemeines Ähnlichkeitsmaß Gegeben: Zwei Objektbeschreibungen C1, C2 mit p Attributen A1, ..., Ap Intention: simj : Ähnlichkeit für Attribut j (lokales Maß) wj : beschreibt die Relevanz von Attribut j für das Problem Lokal – Global Prinzip

Beispiele Frage benötigte Information Erwünschtes Produkt Intendierte Funktionalität Symptome Antwort Dokument Erhältliches Produkt geeignetes Produkt Therapie, Reparatur

Semantik, Spezifikation, Korrektheit Die Semantik der Ähnlichkeit ist der Nutzen der Antwort. Die Nutzenfunktion dient als Spezifikation für das Maß. Korrektheit: Nutzen der Antwort = Spezifizierter Nutzen Nutzenprinzip: Maximum des (erwarteten) Nutzens Ähnlichkeitsprinzip: Nächster Nachbar

Dokument und Inhalt Orientierung Dokumentorientierung : Man ist nur am Titel und Schlüsselwörtern interessiert. Das reicht of aus: Lufthansafahrplan Leipziger Veranstaltungskalender Juli 2009. Inhaltsorientierung: Die Nützlichkeit ergibt sich erst durch ansehen des Inhaltes: Ein Buch über grundlegende Probleme der Klassenkörpertheorie.

Wissenscontainer - Wo ist das Wissen repräsentiert? Fall Basis Produktbasis Ähnlichkeits- Maß Lösungs- Transformation Vokabular Das Wissen ist über die Container verteilt Das Wissen kann zwischen den Containern verschoben werden - 17 -

CBR-Works Wir verwenden das Werkzeug CBR-Works um einen Internetladen für den Verkaufsprozeß zu bauen. CBR-Works ist Ein Modellierungswerkzeug Ein Tool um den Verkauf durchzuführen Der Kunde hat Wünsche, Präferenzen und Verhalten sucht Informationen um das best möglichste Produkt zu finden

Ein Beispiel: Hauskauf Wir wollen ein Haus kaufen. Vokabular: Woran sind wir interessiert, wonach fragen wir? Produktbasis: Was ist erhältlich? Ähnlichkeitsmaß: Welches bevorzugen wir? Transformation: Welche Veränderungen sind erlaubt? Das ist ein dynamischer Prozeß, ein Dialog, der effizient gestaltet werden muss.

Wünsche ... Wir wollen ein traditionelles Haus! Aber etwas modern wäre auch ganz schön! Die Energiefrage bedenken! Und wir wollen auch die Sommerabende genießen! Wie repräsentieren wir so etwas? Das ist direkt nicht möglich. Jede formale Repräsentation muss sich aber daran messen.

Fragen und Antworten : “CBR Answers System” Query: On my PC entering long street names causes a Crash with the message “storage error”. Case1:Under Windows XP there is not enough storage allocated for the name of the street. Can possible cause that the system shuts down. Case2:The PC-Version does not store the street names correctly. Case3: On the Sun entering Umlauts causes a crash.

SIMATIC Knowledge Manager CBR-Server Similarity model Search Structure Information about the Structure of the SIMATIC Information System Order No. Relation order numbers - product names Dictionary Information Entities Similarities Results www.ad.siemens.de View Document Documents in the Customer Support Information System

Vielen Dank für Ihre Aufmerksamkeit !