12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)

12.06.2002Niko Zenker2 Gliederung I. Motivation II. Methoden zur Anfrageverfeinerung III. Auswertungen der Verfeinerungs- mechanismen IV. Zusammenfassung

12.06.2002Niko Zenker3 Motivation keine genauen Kenntnisse über den Aufbau der DB und Retrieval-Umgebung Anfragen beruhen auf dem Prinzip „Glück“ Verfeinerungen können per Hand realisiert werden durch Einführung von Relevanz-Feedback Methoden wird dieser Prozess teilautomatisiert

12.06.2002Niko Zenker4 Grundidee Auswählen von wichtigen Termen oder Ausdrücken, die an bestimmte vorherige Dokumente gebunden sind Dokumente, die der Benutzer vorher schon nicht sehen wollte, scheinen auch nicht von Interesse zu sein Ziel: gute Ergebnisse bei vagen Anfrangen

12.06.2002Niko Zenker5 Information Retrieval Anfrage Dokumente Verarbeitung Anfrage- darstellung Dokument- darstellung Verlgeich (Ähnlichkeitsberechnung) Ergebnisdokumente Relevanzbewertung und Feedback

12.06.2002Niko Zenker6 Vektor-Modell Anfragen werden mittels Vektor an die entspr. Daten gestellt mit und Relevanz Feedback Methode(n) generiert neuen Anfragevektor

12.06.2002Niko Zenker7 Anfrageverfeinerung Vektor Abgleich Ide dec-hi (Vector Adjustment) Fügt die Gewichte der Terme, der Dokumente direkt zu den Anfragetermen hinzu. Benutzt alle relevanten, aber nur die höchst unrelevanten zurückgelieferten Terme.

12.06.2002Niko Zenker8 Anfrageverfeinerung (II) Vektor Abgleich Ide regular (Vector Adjustment) Fügt die aktuellen Gewichte der Terme, der Dokumente direkt zu den Anfragetermen hinzu. Benutzt alle relevanten, und alle unrelevanten zurückgelieferten Terme.

12.06.2002Niko Zenker9 Anfrageverfeinerung (III) Vektor Abgleich Standard nach Rocchio (Vector Adjustment) Reduziert die Termgewichte durch Division mit der Anzahl der entsprechenden Dokumente.

12.06.2002Niko Zenker10 Wahrscheinlichkeitsfeedback Ziel ist es, die Dokumente nach ihrer Wahrscheinlichkeit zu ordnen, die vom Benutzer als relevant in Bezug auf die Query eingestuft wurden

12.06.2002Niko Zenker11 Anfrageverfeinerung (IV) konventionelles Wkt.-feedback (Probabilistic conventional) Verhältnis, der Wahrscheinlichkeiten der relevanten zu den nichtrelevanten Termen der Retrieval- Ergebnisses.

12.06.2002Niko Zenker12 Anfrageverfeinerung (V) angepassetes Wkt.- feedback bzgl. der Herkunft (Probabilistic adjusted derivation) Verallgemeinerung des konventionellen Modells, im Bezug auf das Auftreten bestimmter Dokumente.

12.06.2002Niko Zenker13 Beispiel 500 Dokumente in der DB (N) 100 mit den gewünschten Informationen (n i ) 25 werden als relevant markiert (R) nur 10 dieser als relevant markierten Dokumente enthalten die gewünschte Information (r i )

12.06.2002Niko Zenker14 Beispiel (II)

12.06.2002Niko Zenker15 Anfrageverfeinerung (VI) angepassetes Wkt.- feedback bzgl. der Herkunft (verbessert) (Probabilistic adjusted derivation revised) selbe Prinzip wie zuvor, nur mit anderen Werten für R‘ = R+3 und r i ‘=r i +3

12.06.2002Niko Zenker16 Auswertung der Methoden die Effizienz der Methoden, errechnet man durch einen Vergleich der ersten Iteration des Feedback-Verfahrens und der Initiationssuche normalerweise benutzt man Recall und Precision Messungen um dieses Ergebnis zu errechnen

12.06.2002Niko Zenker17 Precision & Recall Precision gefundene relevante Dokumente alle gefundenen Dokumente Recall gefundene relevante Dokumente__ gespeicherte relevante Dokumente Menge aller Dokumente relvante Dokumente gefundene relevante Dokumente

12.06.2002Niko Zenker18 Auswertung der Methoden (II) die Auswertung der Feedback-Dokumente wird erschwert weil sich die Ergebnisse teils deutlich vom echten Feedback-Ergebnis unterscheiden der User will nicht zweimal das selbe Dokument sehen die Relevanz-Feedback Operation muss entscheiden, ob sie neue Dokumente anzeigt, die nicht ursprünglich vom User gesehen wurden

12.06.2002Niko Zenker19 Partial Query Expansion vs. Full Query Expansion FQE: alle Anfragevektoren haben die selbe Länge wie der Ursprung Gewichtungen werden verändert PQE: reduzieren auf durchschnittliche Länge der Anfragevektoren Terme mit hoher Frequenz werden übernommen

12.06.2002Niko Zenker20 Ergebnisse aus der Forschung gewichtete Terme produzieren bessere Ergebnisse beim Feedback-Prozess full expansion erweist sich als besser als partial expansion die beste Feedback-Methode ist: „Ide dec hi“ Wahrscheinlichkeits-Feedback ist im Allgemeinen schlechter als Vektor-Feedback

12.06.2002Niko Zenker21 Optimierung des Feedbacks die durchschnittliche Länge der Anfrage ist von besonderem Interesse schlechte Initial-Ergebnisse iterieren meist mit guten Ergebnissen präzise gestellte Anfragen werden vom Feedback-Prozess besser adaptiert

12.06.2002Niko Zenker22 Zusammenfassung Relevanz-Feedback ist eine „billige“ Methode für die Neuformulierung von Anfragen mit Bezug auf die vorherigen Ergebnisse wegen der Einfachheit der Veränderungen der Anfragen, sollten Relevanz-Feedback- Systeme in jedes Text-Retrieval-System eingebunden werden

12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)

Ähnliche Präsentationen

Präsentation zum Thema: "12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)

Ähnliche Präsentationen

Präsentation zum Thema: "12.06.2002Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)"— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback