Query Reformulation Seminar Multimedia-Datenbanken Sommersemester 2002 Marcus Denecke.

Slides:



Advertisements
Ähnliche Präsentationen
Cluster- Projekt Präsentiert von Dominik Henn & Torben Pastuch
Advertisements

Partitionierungstechniken in Datenbanksystemen
Kohonennetze für Information Retrieval mit User Feedback
Datenbanken Einführung.
Datenmodellierung Externe Phase Informationsstruktur
Universität Rostock Fakultät für Informatik und Elektrotechnik Institut für Informatik, Lehrstuhl DBIS Albert-Einstein-Straße 21, D Rostock Putbus,
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
WS 05/06Automatische Akquisition linguistischen Wissens1 Partielles Wissen erweitern 1.Zusammenhang mit bisherigen Algorithmen 2.Vom offensichtlichen zum.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Multi-Media Seminar von Andre Münch
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
On a Buzzword: Hierachical Structure David Parnas.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
DOM (Document Object Model)
Das Maßproblem von Klee
Neuronale Grundlagen der Gestaltwahrnehmung
Information Retrieval Modelle: Vektor-Modell
1 KM-Modul: Knowledge Wizard Personalisierte Verknüpfung von Wissensprozessen und Geschäftsprozessen auf Basis von Metainformationen Dr. Marc Diefenbruch.
Bau effizienter und effektiver Metasuchmaschinen
WIESEL – Integration von Wissensmanagement und E-Learning auf der Basis von Semantic Web Technologien Matthias Rust, XML-Tage 2004, Berlin WIESEL Integration.
Universität Dortmund, Lehrstuhl Informatik 1 EINI II Einführung in die Informatik für Naturwissenschaftler und Ingenieure.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Übung Datenbanksysteme SQL-Anfragen (2)
eXtreme Programming (XP)
Thorsten Jost INF-M2 – AW1 – Sommersemester Mai 2008
Algorithmen und Komplexität
Access 2000 Datenbanken.
Theorie soziotechnischer Systeme – 12 Thomas Herrmann Informatik und Gesellschaft FB Informatik Universität Dortmund iundg.cs.uni-dortmund.de.
Kombination von AOP und FOP Ein Vortrag für das Seminar erweiterte Programmiertechniken von Samuel Simeonov im Sommersemester 2007.
3 Prinzipien des Information Retrieval
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 3.3 Relevance Feedback Bewertung von Ergebnisdokumenten Auswertung.
Beispielrelation Buchbestellungen H = Menge der bedeutenden Ziele = {a, d} Schwelle T = 4 Stichprobe S = {a, b, a, a, a, a} mit s = |S| = 6 N = Anzahl.
Dieter Bergmann, Lichtenfels
Weiteres Programm Studium des Breitendurchlaufs Hierzu
Grundschutztools
Clusteranalyse von Maria Eickhold und Tobias Töpfer.
Konzeption und Realisierung von DSS
Machine Learning KNN und andere (Kap. 8).
Spezifikation von Anforderungen
X Filter …als Beispiel effizienter Filterung von XML-Dokumenten in SDI-Systemen.
Schnelles und effizientes Suchen. Was ist MPEG 7? Wie funktioniert MPEG? Was bietet MPEG 7? Wo wird MPEG 7 verwendet?
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Farbtransfer zwischen Bildern und Bildsequenzen
Design and analysis of GUI test-case prioritization using weight-based methods Samra Khan.
Abschlussvortrag zur Studienarbeit
GIS - Seminar Wintersemester 2000/2001
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
Feature-Integration-Theory Merkmals-Integrations-Theorie
Integration oberflächenbestimmender Objekte ins DGM Seminar GIS IV SS
Information Retrieval, Vektorraummodell
Seminar: Virtuelle Forschungsumgebungen Dozent: Professor Manfred Thaller Referent: Peter Smits
Eike Schallehn, Martin Endig
Möglichkeiten der Visualisierung
- Gänseliesel Galerie - Alexander Franke & René Monecke für die.
Sebastian Loose DPF – A Perceptual Distance Function for Image Retrieval Proseminar SS 2005 Distanzen und Ähnlichkeitsmaße im Hochdimensionalem.
The PicSOM Retrieval System 1 Christian Steinberg.
„Single Color Extraction Sebastian Bertram Proseminar SS 2005: Distanzen und Ähnlichkeitsmaße im hochdimensionalen Raum and Image Query“
Unscharfe Anfragen in Multimedia- Datenbanksystemen Seminar Multimedia-Datenbanken WS 2001/2002 Silvana Runow.
WILLKOMMEN Daniel Matheis Betreuer: Birgitta König-Ries Michael Klein "Dezentrale Realisierung von Gruppendiensten in Peer-to-Peer-Umgebungen" Studienarbeiter:
Global-Illumination: Radiosity
- Studienarbeit - Entwurf und Umsetzung von kombinierten Anfragen für die Ähnlichkeitssuche auf digitalen Bilder auf der Basis von Regionen und Features.
5.1 5 Retrieval auf Bildern (.... in a nutshell)  Bedeutung.... ... im Zusammenhang mit Information Retrieval ... für Anwendungen Medizin: "Finde ähnliche.
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
iem.kug.ac.at Konzepte für virtuelle Akustik Theoretische Betrachtungen Alois Sontacchi Institute of Electronic Music and Acoustics at the University.
 Präsentation transkript:

Query Reformulation Seminar Multimedia-Datenbanken Sommersemester 2002 Marcus Denecke

Query Reformulation1 1. Einführung 2. Content-Based Image Retrieval 3. Relevanz-Feedback 3.1 Query-Reweighting 3.2 Query-Expansion 4. Implementation 5. Zusammenfassung Gliederung

Marcus DeneckeQuery Reformulation2 global zunehmende Menge an digitalen Daten darunter: steigender Anteil an Multimediadaten insbesondere Bilder: aus Medizin, Geographie etc. 1. Einführung Wunsch: effiziente Speicherung MMDatenbanken Wunsch: leichtes Wiederauffinden der (Binär-)Daten Problem: Suche in digitalen Daten Ansatz: Verschlagwortung

Marcus DeneckeQuery Reformulation3 jedes Bild wird manuell mit Schlagwörtern versehen Suche erfolgt auf diesen Begriffen aber: Verlagerung des Problems, keine Lösung: Skalierbarkeit Aufwand Subjektivität Inkonsistenz Komplexität Transformation Ansatz: Nutzung des Bildinhaltes zur Suche Schlagwörter 1. Einführung

Marcus DeneckeQuery Reformulation4 2. Content Based Image Retrieval frühe 90er Ansatz: Multimediadaten enthalten bestimmte Features / Merkmale Bsp. für Bilder: Farben, Texturen, Formen Nutzung als Bildindex Vorteile: Automatisierte Extraktion Daten selbst immer konsistent

Marcus DeneckeQuery Reformulation5 2. Content Based Image Retrieval

Marcus DeneckeQuery Reformulation6 Nutzer können ihren Informationsbedarf nicht mit Hilfe der Merkmale ausdrücken Lücke zwischen der Wahrnehmung des Nutzers und der Repräsentation im System Gewichte für den Nutzer umständlich 2. Content Based Image Retrieval Nachteile Idee: Merkmale verbergen und Gewichte dynamisch anpassen Dynamik Iterationen Relevanz-Feedback

Marcus DeneckeQuery Reformulation7 Multimediaobjekt O = O (D, F, R) D = Daten, F = Merkmale, R = Repräsentationen verschiedene Medientypen verschiedene Merkmale (z.B. Farbe, Textur, Form) Merkmale in unterschiedlichen Repräsentationen z.B. Histogramme und Color Moments für die Farbe Repräsentationen wiederum Vektoren mit Werten für die entsprechende Ausprägung 2. Content Based Image Retrieval Multimedia-Objekt-Modell

Marcus DeneckeQuery Reformulation8 Multimedia-Objekt-Modell 2. Content Based Image Retrieval

Marcus DeneckeQuery Reformulation9 Query-Modell 2. Content Based Image Retrieval Erweiterung des Objekt-Modells jeder Ast des Suchbaums ist entsprechend der Relevanz gewichtet bei mehr als einem vorgegebenen Beispiel: Objekt-basiertes Modell Merkmals-basiertes Modell

Marcus DeneckeQuery Reformulation10 Query-Modell 2. Content Based Image Retrieval

Marcus DeneckeQuery Reformulation11 Retrieval-Modell 2. Content Based Image Retrieval bestimmt die Ähnlichkeit zwischen einem Objekt O und einer Query Q durch Berechnung der Distanz mit einer Ähnlichkeitsfunktion D(O, Q) Ergebnis: gerankte Liste von Objekten Objekt-Modell, Query-Modell, Retrieval-Modell und eine Sammlung von Abstandsmassen zusammen bilden das Content-Based Multimedia Retrieval Modell

Marcus DeneckeQuery Reformulation12 Retrieval-Modell 2. Content Based Image Retrieval

Marcus DeneckeQuery Reformulation13 3. Relevanz-Feedback Informationsbedarf modelliert durch dynamisch angepasste Gewichte Query Reweighting Erweiterung der Query um neue Objekte Query Expansion Query Reformulation beschreibt den iterativen Prozeß der Anpassung einer Query basierend auf dem Feedback des Nutzers so, dass sie sein Informationsbedürfnis besser abdeckt als zuvor

Marcus DeneckeQuery Reformulation14 Techniken Query Refinement Query Representation Modification Query Reweighting Query Expansion Query Point Movement 3. Relevanz-Feedback Beispiel: ChariotChariot

Marcus DeneckeQuery Reformulation Query Reweighting Hand-Out Iterativer Prozess Ziel: Modellierung des Informationsbedarfes durch die Anpassung der Gewichte im Query-Model Versuch die high-level-Konzepte des Nutzers (Katze) auf low-level-Features des Systems (Farbe, Form, Textur) abzubilden

Marcus DeneckeQuery Reformulation16 Normalisierung 3.1 Query-Reweighting Problem: Ähnlichkeitsmaße müssen nicht immer im selben Bereich liegen Verzerrung Normalisierung der Komponenten eines Repräsentationsvektors r ij intra Ähnlichkeitswerte jeder Repräsentation S(r ij ) inter Gauss-Normalisierung Wertebereich [0, 1]

Marcus DeneckeQuery Reformulation17 Weight-Updating 3.1 Query-Reweighting eigentliche Erfassung der Subjektivität Nutzer gibt auf einer Skala von sehr relevant (3) bis gar nicht relevant (- 3) die Relevanz zurück Anpassung der Gewichte in den Repräsentationen (W ij ) inter Gewichte der Vektorkomponenten (W ijk ) intra Erhöhung und Minderung der Gewichtung der Merkmale und Repräsentationen

Marcus DeneckeQuery Reformulation Query Expansion Nutzer findet u.U. kein geeignetes Beispiel um sein Informationsbedürnis auszudrücken System das nur mit Beispielen arbeitet limitiert den Nutzer Lösung: Query Expansion Idee: Aufnahme von einer limitierten Auswahl an relevanten Objekten in die anfängliche Query

Marcus DeneckeQuery Reformulation19 Similar Expansion 3.2 Query Expansion Aufnahme von relevanten Objekten, wenn diese sehr ähnlich zu den vom Nutzer als relevant ausgewählten sind Rechtfertigung: da die Objekte den gewünschten ähnlich sind, repräsentieren sie wiederum andere ähnliche Objekte

Marcus DeneckeQuery Reformulation20 Distant Expansion 3.2 Query Expansion Aufnahme von relevanten Objekten, wenn diese weniger ähnlich zu den vom Nutzer als relevant ausgewählten sind Rechtfertigung: diese Objekte könnten einige interessante Merkmale aufweisen, die bis dahin nicht im Suchbaum berücksichtigt wurden Erweiterung der Anfrage um neue Merkmale sollten die Objekte nicht nützlich sein, so werden sie durch das Relevanz-Feedback in der nächsten Iteration wieder gelöscht

Marcus DeneckeQuery Reformulation21 Problem: Berechnung der Ähnlichkeitswerte extrem aufwendig Lösungsansatz: Pufferung eines Teils der Informationen jeder Iteration des Prozesses Ansatz: k-NN-Algorithmus 4. Implementation

Marcus DeneckeQuery Reformulation22 5. Zusammenfassung Relevanz-Feedback sinnvolle Ergänzung des CBIR durch Interaktion wird eine effiziente Suche ermöglicht, ohne dass beide Seiten die Grundlagen der jeweils anderen kennen Problem: die Abbildung von high-level-Konzepten auf low-level-Features ist sehr beschränkt Integration von high-level-Konzepten erforderlich

Marcus DeneckeQuery Reformulation23 Quellen Relevance Feedback: A Power Tool for Interactive Content-Based Image Retrieval; Rui, Huang, Ortega, Mehrotra, September 1998 Query Reformulation for Content Based Multimedia Retrieval in MARS; Pokaew, Mehrotra, Ortega, November 1998 Efficient Query Refinement in Multimedia Databases; Chakrabarti, Porkaew, Mehrotra, 2000