BTW, 26. Februar 2003Übertragung von Rangordnungen1 Ein Ansatz zur Übertragung von Rangordnungen bei der Suche auf strukturierten Daten Andreas Henrich.

Slides:



Advertisements
Ähnliche Präsentationen
Vortrag von Stephanie Weirauch Jens Pleger Peter Jancke Frank Wejmelka
Advertisements

Stefan Lohrum Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
Imperative Programmierung
Fast Fourier Transformation
Matrixmultiplikation
Punkt-in-Polygon-Verfahren III (R/R+-Baum)
Kohonennetze für Information Retrieval mit User Feedback
Lineare Suche Divide-and-Conquer-Suche Kombinationssuche
Suche in Texten (Stringsuche )
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Institut für Informatik Betriebliche Informationssysteme Sebastian Scholz Einführung in Hummingbird Enterprise Sebastian Scholz
der Universität Oldenburg
Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
10 Streams JavaHS Merseburg WS 05/06 E/A - Ströme (Streams) in Java.
Sortierverfahren Richard Göbel.
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
Der R-Baum Richard Göbel.
Effizienz: Indexstrukturen
WS Algorithmentheorie 05 - Treaps Prof. Dr. Th. Ottmann.
Algorithmen und Datenstrukturen
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 4 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (15 Hashverfahren: Verkettung der Überläufer) Prof. Th. Ottmann.
1 Vorlesung Informatik 2 Algorithmen und Datenstrukturen (21 – Kürzeste Wege) T. Lauer.
WS 06/07 Algorithmentheorie 01 - Einleitung Prof. Dr. Th. Ottmann Tobias Lauer.
Algorithmentheorie 12 – Spannende Bäume minimalen Gewichts
Informatik II, SS 2008 Algorithmen und Datenstrukturen Vorlesung 6 Prof. Dr. Thomas Ottmann Algorithmen & Datenstrukturen, Institut für Informatik Fakultät.
Geometrisches Divide and Conquer
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Universität Dortmund, Lehrstuhl Informatik 1 EINI II Einführung in die Informatik für Naturwissenschaftler und Ingenieure.
EINI-I Einführung in die Informatik für Naturwissenschaftler und Ingenieure I Vorlesung 2 SWS WS 99/00 Gisbert Dittrich FBI Unido
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
R-tree, R*-tree und R+-tree
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung In welcher Masche liegt der Punkt p?
PKJ 2005/1 Stefan Dissmann Ausblick Es fehlen noch: Möglichkeiten zum Strukturieren größerer Programme Umgang mit variabler Zahl von Elementen Umgang mit.
PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.
PKJ 2005/1 Stefan Dissmann Zusammenfassung Bisher im Kurs erarbeitete Konzepte(1): Umgang mit einfachen Datentypen Umgang mit Feldern Umgang mit Referenzen.
Grundlegende Analysen & Zwischendarstellungen
Was sind Histogramme? (1)
DVG Klassen und Objekte
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Weiteres Programm Studium des Breitendurchlaufs Hierzu
FH-Hof Algorithmen und Datenstrukturen - Einführung Richard Göbel.
PRJ 2007/1 Stefan Dissmann Verkettete datenstruktur: Liste Problem: Liste, die eine beliebige Zahl von Elementen verwaltet Operationen: Erzeugen, Anfügen,
Was umfaßt die CORBA Core Spezifikation? Welche zusätzlichen Komponenten muß ein ORB Produkt beinhalten? Core: CORBA Objekt Modell CORBA Architektur OMG.
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung 1 SS 2001 Algorithmus von Dijkstra.
Übersicht Motivation Konzeption Umsetzung/ Implementierung
Einführung in die Programmierung
Entstehung & Einflüsse Ideen, Wünsche, eigene Überlegungen bisheriges Dateisystem Einschrän- kungen: - technisch - zeitlich - fachlich Literatur, ältere.
Diskrete Mathematik II
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung 5 SS 2001 Segmentschnitt II (n Segmente)
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation II Vorlesung 7 SS 2000 Punkt-in-Polygon-Verfahren I (Trapezkarte)
Polynome und schnelle Fourier-Transformation
Java für Fortgeschrittene
Einführung in die Programmierung Wintersemester 2009/10 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Shape Similarity 27. Februar 2006 Michael Keller.
1.2 Trennung von Struktur und Inhalt
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Integration existierender digitaler Bibliotheken in Lernumgebungen LEBONED (Learning Environment Based On Non Educational Digital Libraries) Dipl.-Inform.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Geoinformation III Vorlesung 1 WS 2001/02 Punkt-in-Landkarte I (Streifenkarte)
Eike Schallehn, Martin Endig
Mag. Thomas Hilpold, Universität Linz, Institut für Wirtschaftsinformatik – Software Engineering 1 Algorithmen und Datenstrukturen 1 SS 2002 Mag.Thomas.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Datenstrukturen für den Algorithmus von.
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Foliendesign: Jörg Steinrücken & Tobias Kahn Vorlesung
Java-Kurs Übung Besprechung der Hausaufgabe
Institut für Kartographie und Geoinformation Prof. Dr. Lutz Plümer Diskrete Mathematik II Vorlesung Suche des kürzesten Weges in einem Netz.
Geoinformation II 6. Sem. Vorlesung April 2000 Geometrische Algorithmen - ein einführendes, größeres Beispiel für ein Semester-begleitendes Programmier.
5.1 5 Retrieval auf Bildern (.... in a nutshell)  Bedeutung.... ... im Zusammenhang mit Information Retrieval ... für Anwendungen Medizin: "Finde ähnliche.
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
 Präsentation transkript:

BTW, 26. Februar 2003Übertragung von Rangordnungen1 Ein Ansatz zur Übertragung von Rangordnungen bei der Suche auf strukturierten Daten Andreas Henrich und Günter Robbert Angewandte Informatik I Softwaretechnik und Informationssysteme Fakultät für Mathematik und Physik Universität Bayreuth

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 2 Übersicht Ähnlichkeitsanfragen auf strukturierten Dokumenten Anfragebeispiel Problemstellung Übertragung von Rangordnungen: Mögliche Semantiken Algorithmus RSV-Transfer Prototypische Implementierung: Systemarchitektur Experimentelle Ergebnisse Ausblick

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 3 Thema: Ähnlichkeitsanfragen auf strukturierten Dokumenten Struktur Medienobjekte Segmentierung

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 4 Ein Beispieldokument Thesis : document Einleitung : chunk In dieser Arbeit … Hauptteil : chunkSchluss : chunk HT1 : chunkHT2 : chunk Ferner … In Zukunft … Wir sehen … Außer … Hier … Am Ende …

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 5 Beispielanfrage Anfrage: Suche alle Bilder, die ein bestimmtes Logo enthalten und deren Text in der Umgebung inhaltlich einem gegebenen Beispieltext ähnelt. Anfrage: Suche alle Bilder, die ein bestimmtes Logo enthalten und deren Text in der Umgebung inhaltlich einem gegebenen Beispieltext ähnelt. Maximumsemantik -Semantik

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 6 Beteiligte Komponenten Ranker zur Erzeugung initialer Ströme Beispiel: Bilder nach Farbähnlichkeit zu Anfragebild sortiert Verfahren und Indexstrukturen für Ranker: invertierte Listen, R-Baum, X-Baum, LSD h -Baum, VA-File, … Combiner zur Kombination mehrerer Rangordnungen: Buckley-Lewit, Nosferatu, Quick-Combine, J*, … Transferer Übertragung von Rangordnungen zu verbundenen Objekten bisher höchsten implizit in Combinern Einführung eines expliziten RSV-Transfer-Algorithmus

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 7 Problem: Semantik der Übertragung der Rangordnungen einfaches Beispiel: Suche alle Bilder, die ein Segment enthalten, dass ähnlich zu einem gegebenen Logo ist die Ordnung auf den Segmenten erfolgt i.d.R. über ein Ähnlichkeitsmaß retrieval status value (RSV) Idee: Rangordnung der Bilder durch Übertragung der RSV-Werte der Segmente bestimmen! Aber wie? Mehrere Semantiken denkbar: RSV-Wert eines Bildes = maximaler RSV-Wert eines Segmentes RSV-Wert eines Bildes = RSV-Wert eines Segmentes …

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 8 denkbare Übertragungssemantiken: Maximum: Minimum: Durchschnitt: gewichteter Durchschnitt: … Wir fordern lediglich:

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 9 Transferer: grundsätzliches Vorgehen einfache Beispielanfrage: Gesucht werden die Bilder, die ein Segment enthalten, das einem gegebenen Logo ähnlich ist Annahme: Bildsegmente werden von einem Eingabestrom bereits nach Ähnlichkeit sortiert geliefert z.B. durch eine mehrdimensionale Zugriffsstruktur für Farbähnlichkeit z.B. durch eine Kombination von Rangordnungen für Farbe, Textur, … Dieser Eingabestrom kann inkrementell verarbeitet werden: Initialisierung und dann: GetNext

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 10 Transferer: grundsätzliches Vorgehen Nimm das erste Segment aus dem Eingabestrom Bestimme das zugehörige Bild Berechne den Ähnlichkeitswert RSV d für dieses Bild Ordne das Bild in eine Prioritätswarteschlange AL ein while (RSV d -Wert des 1. Eintrags in AL > RSV r -Wert des nächsten Elements im Eingabestrom ) do gibt das Bild im Ausgabestrom aus betrachte das nächste Bildsegment auf dem Eingabestrom bestimme das zugehörige Bild 1. Fall: dieses Bild ist bereits betrachtet worden ( nicht das ähnlichste Segment des Bildes) 2. Fall: dieses Bild wurde noch nicht betrachtet

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 11 RSV-Transfer- Algorithmus Tagungsband

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 12 RSV-Transfer-Algorithmus: Anmerkungen Wichtige Eigenschaft des Algorithmus: Inkrementell anwendbar Spezialfall Maximumsemantik: Erlaubt Vereinfachungen des Algorithmus Statt RSV d (o d ) zu berechnen kann beim 1. verbundenen Objekt o r zu o d direkt RSV r (o r ) genutzt werden Weitere Vereinfachung: Schleife zur Betrachtung mehrerer o d Objekte kann bei einer 1:n- Beziehung zwischen den Objekttypen entfallen

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 13 Systemarchitektur (1) Grundlegende Ideen: Alle Daten werden in externen Datenquellen verwaltet Alle Anfragekomponenten arbeiten stream-orientiert Retrievalfunktionalität wird oberhalb der Datenquellen realisiert Prototyp stellt API für Entwicklung neuer Retrievaldienste bereit Bereitstellung von Interfaces für die Erweiterbarkeit der Retrievalfunktionalität Implementierung des Prototypen in Java

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 14 Systemarchitektur (2)

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 15 Systemarchitektur (3) Featureextraktoren, Metriken: für die inhaltsbasierte Suche auf multimedialen Daten Hauptkomponenten für Anfrageverarbeitung: Prototypische Implementierung von: Ranker, Combiner, Transferer, … Alle Komponenten erweitern Interface Stream: Konstruktor: kreiert einen neuen Stream Init-Methode: initialisiert einen Stream getNext-Methode: liefert das nächste Element eines Streams

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 16 Systemarchitektur (4) Metadaten-Repository: enthält alle Daten zur Verwaltung von Streams und Durchführung von Anfragen Wrapper (zur Systemerweiterung): Datenquellenwrapper: Anbindung externer Datenquellen für die Suche Zugriffsstrukturenwrapper: Integration externer Zugriffsstrukturen für performante Ähnlichkeitssuche Streamwrapper: Anbindung externer Streams (externe Retrievalsysteme)

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 17 Experimentelle Ergebnisse (1) EckdatenTestkollektion: Strukturierte Dokumente einer Computerzeitschrift: 2213 Artikel Textblöcke ca Bilder ca Bildsegmente Verwendete Indexstrukturen: Zwei LSD h -Bäume : 10-dimensionale Vektoren für Farbcharakteristika 4-dimensionale Vektoren für Texturcharakteristika

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 18 Experimentelle Ergebnisse (2)

BTW, 26. Februar 2003 Übertragung von Rangordnungen S. 19 Ausblick Ansatz für Übertragung von Rangordnungen: RSV-Transfer Algorithmus Prototypisch implementiert und evaluiert Zur Zeit Gegenstand unserer Forschungen: Optimierungen am Prototyp Messungen bezüglich der Ergebnisqualität (INEX) Entwicklung einer graphischen Oberfläche für Anfragen