12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)

Slides:



Advertisements
Ähnliche Präsentationen
Information Retrieval in XML-Dokumenten
Advertisements

Kohonennetze für Information Retrieval mit User Feedback
Modellierung sozio-technischer Systeme SeeMe - Semi-strukturierte, sozio-technische Modellierungsmethode.
MAM Einstellungen & Erweiterte Möglichkeiten.
Projektumfeld Gesellschaftliche Strömungen Strukturen/ Gliederung
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
Seminar Textmining WS 06/07 Aufgaben III Termgewichtung Postings Datei Clustering.
Seminar Textmining WS 06/07
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Heuristiken und Kontexteinflüsse
Sortierverfahren Richard Göbel.
FH-Hof Effizienz - Grundlagen Richard Göbel. FH-Hof Inhalt Einführung Aufwand für Anfragen ohne Indexierung Indexstrukturen für Anfragen an eine Tabelle.
Gliederung Vertrauensintervalle Arten von Hypothesen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Information Retrieval Modelle: Vektor-Modell
1 KM-Modul: Knowledge Wizard Personalisierte Verknüpfung von Wissensprozessen und Geschäftsprozessen auf Basis von Metainformationen Dr. Marc Diefenbruch.
Bau effizienter und effektiver Metasuchmaschinen
Query Reformulation Seminar Multimedia-Datenbanken Sommersemester 2002 Marcus Denecke.
MMQL – Multimedia Query Language Eine Anfragesprache für Multimedia-Ähnlichkeitsanfragen Christian Mantei.
Kap. 6.2 Binäre B-Bäume Ullmann: (2, 3) - Bäume
Vergleich komplexer und einfacher Trainingsfälle in der Kardiologie (D 6 Wissensbasierte Systeme) 51. Jahrestagung GMDS Leipzig 1/10 Vergleich.
Was sind Histogramme? (1)
Qualitätskriterien zur Beurteilung von Dokumentationen
Relevanz Ranking Bisher:
Vereinfachtes Beispiel: Zuordnung von Dokumenten zu einer Klasse
3 Prinzipien des Information Retrieval
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 3.3 Relevance Feedback Bewertung von Ergebnisdokumenten Auswertung.
Intelligentes Crawling im WWW mit Hilfe intuitiver Suchbedingungen
Neuronale Netze Romy Kuttner, Franco Haberland.
und relative Häufigkeit Bettina delert, andreas mertke
Machine Learning KNN und andere (Kap. 8).
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
Christian Schulz, Marc Thielbeer, Sebastian Boldt
Histogramm/empirische Verteilung Verteilungen
Komponenten eines Information Retrieval Systems
Wissenschaftliches Arbeiten...
EXCEL PROFESSIONAL KURS
Suchen im Internet - Systematisch !!!
Infor:lösungen Allgemeine Funktionalitätsbeschreibung Lösungsnr.:RS0008_VendorQuoteHandling Titel:Lieferantenanfragebehandlung Lieferantenanfragebehandlung.
Ó Dipl. Ing. H. Heinemeyer MBA präsentiert:.
Abschlussvortrag zur Studienarbeit
Computational Thinking Online Algorithmen [Was ist es wert, die Zukunft zu kennen?] Kurt Mehlhorn Konstantinos Panagiotou.
Erzeugen von Karten, Layern und Legenden
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Hartmut Klauck Universität Frankfurt SS
Polynome und schnelle Fourier-Transformation
Allgemeines zu Datenbanken
Generalisiertes Vektorraummodell (Generalized Vector Space Model, GSVM) Karin Haenelt
Langfristig hohe Energiepreise  Allgemeine Kostenreduzierung
Trust and context using the RDF- Source related Storage System (RDF‑S3) and easy RQL (eRQL) Karsten Tolle und Fabian Wleklinski.
Projekt: Schüler verbessern ihren Unterricht
Projekt: Schüler verbessern ihren Unterricht
Lernen durch Vergleiche
Ó Dipl. Ing. H. Heinemeyer MBA präsentiert:.
Information Retrieval, Vektorraummodell
Integritätserhaltung und -Überprüfung in deduktiven Datenbanken
Stoppen der Eingabeaufforderung einer Abfrage j drücken Sie dann F5, oder klicken Sie auf Bildschirmpräsentation > Von Beginn an, um den Kurs zu starten.
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
The PicSOM Retrieval System 1 Christian Steinberg.
The link between leadership and followership: How affirming social identity translates vision into action. Projektarbeit Sozialpsychologie: Soziale Identität.
Implementierung von Relevance-Feedback-Methoden in einer Bilddatenbank
Unscharfe Anfragen in Multimedia- Datenbanksystemen Seminar Multimedia-Datenbanken WS 2001/2002 Silvana Runow.
Evaluierung von Information Retrieval Systemen Minimal Test Collection (MTC)- Verfahren Karin Haenelt / /
1 Igor Vaynerman Personalisierung der Netzdienste zur Benutzerunterstützung Igor Vaynerman FSU Jena 20. Mai 2005.
Seminar Ingenieurdatenbanken WS 04/05 Dr. Schallehn, Prof. Paul, Dipl.-Inf. Fröhlich {eike | paul | iti.cs.uni-magdeburg.de.
G.Meininghaus, Konstanz1 Bilder auf dem PC ordnen, wiederfinden und zeigen Windows 7.
- Seite 1 TIME INTELLIGENCE ® by Zeichenrand – Löschen! Titel.
- Seite 1 TIME INTELLIGENCE ® by Titel.
Rechen- und Kommunikationszentrum (RZ) Selektionsstrategien auf Graphstrukturen Sven Porsche Seminarvorträge Aachen.
Das Vorhaben wird bearbeitet von Koordiniert vom Gefördert durch Wissenschaftlich begleitet vom FKZ-Nr.: Kurztitel Laufzeit: XX.XX.2010-XX.XX.2012 Präsentation.
 Präsentation transkript:

Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)

Niko Zenker2 Gliederung I. Motivation II. Methoden zur Anfrageverfeinerung III. Auswertungen der Verfeinerungs- mechanismen IV. Zusammenfassung

Niko Zenker3 Motivation keine genauen Kenntnisse über den Aufbau der DB und Retrieval-Umgebung Anfragen beruhen auf dem Prinzip „Glück“ Verfeinerungen können per Hand realisiert werden durch Einführung von Relevanz-Feedback Methoden wird dieser Prozess teilautomatisiert

Niko Zenker4 Grundidee Auswählen von wichtigen Termen oder Ausdrücken, die an bestimmte vorherige Dokumente gebunden sind Dokumente, die der Benutzer vorher schon nicht sehen wollte, scheinen auch nicht von Interesse zu sein Ziel: gute Ergebnisse bei vagen Anfrangen

Niko Zenker5 Information Retrieval Anfrage Dokumente Verarbeitung Anfrage- darstellung Dokument- darstellung Verlgeich (Ähnlichkeitsberechnung) Ergebnisdokumente Relevanzbewertung und Feedback

Niko Zenker6 Vektor-Modell Anfragen werden mittels Vektor an die entspr. Daten gestellt mit und Relevanz Feedback Methode(n) generiert neuen Anfragevektor

Niko Zenker7 Anfrageverfeinerung Vektor Abgleich Ide dec-hi (Vector Adjustment) Fügt die Gewichte der Terme, der Dokumente direkt zu den Anfragetermen hinzu. Benutzt alle relevanten, aber nur die höchst unrelevanten zurückgelieferten Terme.

Niko Zenker8 Anfrageverfeinerung (II) Vektor Abgleich Ide regular (Vector Adjustment) Fügt die aktuellen Gewichte der Terme, der Dokumente direkt zu den Anfragetermen hinzu. Benutzt alle relevanten, und alle unrelevanten zurückgelieferten Terme.

Niko Zenker9 Anfrageverfeinerung (III) Vektor Abgleich Standard nach Rocchio (Vector Adjustment) Reduziert die Termgewichte durch Division mit der Anzahl der entsprechenden Dokumente.

Niko Zenker10 Wahrscheinlichkeitsfeedback Ziel ist es, die Dokumente nach ihrer Wahrscheinlichkeit zu ordnen, die vom Benutzer als relevant in Bezug auf die Query eingestuft wurden

Niko Zenker11 Anfrageverfeinerung (IV) konventionelles Wkt.-feedback (Probabilistic conventional) Verhältnis, der Wahrscheinlichkeiten der relevanten zu den nichtrelevanten Termen der Retrieval- Ergebnisses.

Niko Zenker12 Anfrageverfeinerung (V) angepassetes Wkt.- feedback bzgl. der Herkunft (Probabilistic adjusted derivation) Verallgemeinerung des konventionellen Modells, im Bezug auf das Auftreten bestimmter Dokumente.

Niko Zenker13 Beispiel 500 Dokumente in der DB (N) 100 mit den gewünschten Informationen (n i ) 25 werden als relevant markiert (R) nur 10 dieser als relevant markierten Dokumente enthalten die gewünschte Information (r i )

Niko Zenker14 Beispiel (II)

Niko Zenker15 Anfrageverfeinerung (VI) angepassetes Wkt.- feedback bzgl. der Herkunft (verbessert) (Probabilistic adjusted derivation revised) selbe Prinzip wie zuvor, nur mit anderen Werten für R‘ = R+3 und r i ‘=r i +3

Niko Zenker16 Auswertung der Methoden die Effizienz der Methoden, errechnet man durch einen Vergleich der ersten Iteration des Feedback-Verfahrens und der Initiationssuche normalerweise benutzt man Recall und Precision Messungen um dieses Ergebnis zu errechnen

Niko Zenker17 Precision & Recall Precision gefundene relevante Dokumente alle gefundenen Dokumente Recall gefundene relevante Dokumente__ gespeicherte relevante Dokumente Menge aller Dokumente relvante Dokumente gefundene relevante Dokumente

Niko Zenker18 Auswertung der Methoden (II) die Auswertung der Feedback-Dokumente wird erschwert weil sich die Ergebnisse teils deutlich vom echten Feedback-Ergebnis unterscheiden der User will nicht zweimal das selbe Dokument sehen die Relevanz-Feedback Operation muss entscheiden, ob sie neue Dokumente anzeigt, die nicht ursprünglich vom User gesehen wurden

Niko Zenker19 Partial Query Expansion vs. Full Query Expansion FQE: alle Anfragevektoren haben die selbe Länge wie der Ursprung Gewichtungen werden verändert PQE: reduzieren auf durchschnittliche Länge der Anfragevektoren Terme mit hoher Frequenz werden übernommen

Niko Zenker20 Ergebnisse aus der Forschung gewichtete Terme produzieren bessere Ergebnisse beim Feedback-Prozess full expansion erweist sich als besser als partial expansion die beste Feedback-Methode ist: „Ide dec hi“ Wahrscheinlichkeits-Feedback ist im Allgemeinen schlechter als Vektor-Feedback

Niko Zenker21 Optimierung des Feedbacks die durchschnittliche Länge der Anfrage ist von besonderem Interesse schlechte Initial-Ergebnisse iterieren meist mit guten Ergebnissen präzise gestellte Anfragen werden vom Feedback-Prozess besser adaptiert

Niko Zenker22 Zusammenfassung Relevanz-Feedback ist eine „billige“ Methode für die Neuformulierung von Anfragen mit Bezug auf die vorherigen Ergebnisse wegen der Einfachheit der Veränderungen der Anfragen, sollten Relevanz-Feedback- Systeme in jedes Text-Retrieval-System eingebunden werden