Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval.

Ähnliche Präsentationen


Präsentation zum Thema: "Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval."—  Präsentation transkript:

1 Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval

2 Seminar Textmining WS 06/07 Metadaten Was sind Metadaten? Wenn Sie eine Bibliotheksdatenbank aufbauen sollen, welche Metadaten lassen sich erheben? Welche Metadaten sind sinnvoll? Wofür? ISBN Nummer Autor Titel Hrsg. Verlag Herausgabedatum Bindung Ort Key words Buchklappentext Verleihstatus Volltext Art Medium Sachgebiet (hierarchisch)

3 Seminar Textmining WS 06/07 User sucht ein Buch Verwaltung (Sachgebiet)

4 Seminar Textmining WS 06/07 Boolsches Retrieval Gegeben sei eine Datenbank mit Artikeln zum Thema Autosport. Zu jedem Dokument gibt es einen Titel und eine Menge von keywords. Stellen Sie eine boolsche Anfrage, die alle Dokumente darüber findet, dass Michael Schumacher gewinnt findet. Erstellen(Skizzieren) Sie eine geeignete Datenstruktur, die die folgenden Anfragen korrekt beantwortet (d.h. die richtigen und nur die richtigen Datensätze besorgt): –Goldmedaille AND Rennen AND gewagten Manöver –Massenkarambolage OR Unfall OR Rennen –Schumacher/key AND Ferrari/ti Modifizieren Sie die Datenstruktur, um die folgenden Anfragen korrekt beantworten zu können. –Antrieb AND Energie AND sparen –Ferrari MIN1 verwickelt Lässt sich die Treffermenge jeweils nach Relevanz ordnen?

5 Seminar Textmining WS 06/07 Datenbank zum Thema Autosport Ferrari siegt wieder! –Ferrari Sieg Schumacher –Bei dem gestrigen Rennen gewann Michael S. in einem überzeugenden Rennen zum 5. Mal in Folge die Goldmedaille. Während das Rennen am Anfang noch von X dominiert wurde, konnte Michael S. X schließlich in einem gewagten Manöver überholen und verlor den Vorsprung nicht wieder. Unfall bei Rennen –Ferrari Schumacher Karambolage –Am vergangenen Samstag kam es zu einer Massenkarambolage, in die auch Michael Schumacher vom Ferrari Team verwickelt wurde. Durch das deutlich gelichtete Fahrerfeld gewinnt Y anschließend. Neuer Motor mit weniger Verbrauch bei gleicher Leistung –Toyota Energieeffizienz Antriebsleistung –Der neue Antrieb, vorgestellt von Toyota, erreicht durch ein Computergesteuertes Einspritz- und Zündungsverfahren bei gleicher Leistung einen im Schnitt um 1,2 Liter verringerten Benzinverbrauch

6 Seminar Textmining WS 06/07 Ferrari D1,1,4, D2,4 Siegt D1,2 Wieder D1,3 Sieg D1,5 Schumacher D1,6 Bei D1,7 … gewagten D1,20 … Manöver D1,21 D1,6,20

7 Seminar Textmining WS 06/07 Invertierte Liste Zu folgendem Text erstellen Sie eine Datenstruktur, die es erlaubt, folgende Anfragen Probleme: Stoppwörter, Grösse

8 Seminar Textmining WS 06/07

9 Aufgaben II Rankingbewertungen Precision/Recall und Mean Average Precision Als Verbessung vom boolschen Retrieval Vector space –Hund Katze: –Dokument mit 3xHund und 0xKatze gewinnt über Dokument mit 1xHund und 1xKatze (Beispiel rechnen lassen)

10 Seminar Textmining WS 06/07

11

12

13

14


Herunterladen ppt "Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval."

Ähnliche Präsentationen


Google-Anzeigen