Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval.

Slides:



Advertisements
Ähnliche Präsentationen
Stefan Lohrum Konrad-Zuse-Zentrum für Informationstechnik Berlin (ZIB)
Advertisements

Kohonennetze für Information Retrieval mit User Feedback
PC-Senioren Ludwigsburg
Leseförderung im Medien-Mix
Vorlesung Programmieren II
Ein einführendes Tutorial
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Recherche im Informationssystem Medienpädagogik Ein einführendes Tutorial.
Suche in Texten (Stringsuche )
Seminar Textmining WS 06/07 Aufgaben V Bemerkung zu clustering Probabilistic IR Indexierung von Dokumenten Thesauri.
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Seminar Textmining WS 06/07 Aufgaben II 1.Dokumente im VSM 2.Ranking 3.Term-Term-Korrelation 4.Relevance Feedback 5.Termgewichtung.
Seminar Textmining WS 06/07
Seminar Textmining WS 06/07 Themen I Übung in erster Linie um zugrundeliegende Methoden zu verstehen. D.h. es gibt immer einen/mehrere Themenschwerpunkte,
Seminar Textmining WS 06/07 Aufgaben III Termgewichtung Postings Datei Clustering.
Seminar Textmining WS 06/07 Themen Übung 8 Diskussion über Erkennung von Eigennamen Question Answering Stemming.
Seminar Textmining WS 06/07
Seminar Textmining WS 06/07 Aufgaben IV Postings Datei Clustering Probabilistisches Information Retrieval.
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Auswertung der Interviews
Literaturverwaltung und Wissensorganisation
Fallstudie. 2 Statistik April Dokumente Jan Mio. Dokumente Performance 3 Mio. Queries pro Tag 9. Juni 2000 Most popular search engines.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
WS Algorithmentheorie 05 - Treaps Prof. Dr. Th. Ottmann.
WS 06/07 Algorithmentheorie 01 - Einleitung Prof. Dr. Th. Ottmann Tobias Lauer.
Information Retrieval Modelle: Vektor-Modell
Wahl des Themas Präzisieren der Formale Eingrenzung Fragestellung
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Vorlesung 4: Memory Universität Bielefeld – Technische Fakultät AG Rechnernetze und verteilte Systeme Peter B. Ladkin Wintersemester.
Eingabe und Kodierung von Daten in SPSS
Access 2000 Datenbanken.
Kurs Bearbeiten von Fachliteratur Dr. Barbara Hoffmann LiteraturKompetenz Literatur bearbeiten mit Der alte Karteikasten zum Erfassen von Forschungsliteratur.
Wie funktionieren Suchmaschinen?
Diskussion Dezimalklassifikation - Expertendiskussion Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2006/76 Diskusion Woran.
Recherche im Ein einführendes Tutorial Informationssystem Medienpädagogik
Recherche im Ein einführendes Tutorial Informationssystem Medienpädagogik
Information Retrieval: Methoden zur Selektivitätsabschätzung
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Entitäten Extraktion Einführung
Wissenschaftliches Arbeiten...
Oder: Der Unterschied zwischen eine erfolgreiche Firma und einer anderen...
des elektrischen Stroms
PDF-Datei erstellen Wir wollen nicht auf Papier drucken, sondern in eine PDF-Datei. (Portable Document Format) Wir öffnen das heruntergeladene Dokument.
Kriterien für das „Schriftliche“
Schweizer Geschichte Präsentation zur SVA von Michael Marro.
Beweissysteme Hartmut Klauck Universität Frankfurt WS 06/
Suchstrategie und erste Recherchen
Wichtige bibliographische Begriffe: Kurs WA, Zrelski, BRG WY, 2013.
Datenbanken Datenstrukturen.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
Datenbanken als Kern bibliothekarischer Informationsvermittlung Vortrag auf der 3. Gemeinsamen Jahrestagung der Arbeitsgemeinschaft katholisch-theologischer.
Ausgabe vom Seite 1, XML Eine Einführung XML - Eine Einführung.
Fügen Sie unten einen Clip zum Thema „Team“ ein.
Im Vergleich: Computer Auto.
Suchmaschinen.
Michael Schumacher.
Eine kurze Einführung.  Software zur Erstellung eines Dokumenten- servers  Dient zur Aufbewahrung von allen Typen von digitalen Inhalten (Texte, Bilder,
Inhaltsangabe RS an Josef.
Erik Zabel wurde am 7. Juli 1970 in Berlin geboren. Es ist eines der erfolgreichsten Fahrer der Welt. Während eines langen Karriere Siege auf Radwegen.
Formel 1 Home Horror Crash Michael Schumacher Autos Einzelne Teams.
Citavi im Prozess der wissenschaftlichen Arbeit
Niko Zenker1 Besondere Aspekte in Multimedia-Datenbanken Methoden zur iterativen Anfrageverfeinerung (Relevanz Feedback)
Aufgaben aus dem Staatsexamen
Fachportale Eine Einführung anhand 2 Beispiele: Fachportal Pädagogik Medpilot.
Angebot und Nachfrage beim 3 – Liter Auto. Seit dem es immer mehr Leute gibt, die wegen der sinkenden Löhne und ständig steigenden Spritkosten den Weg.
Programmiersprachen II Vorbesprechung Klausur Prof. Dr. Reiner Güttler Fachbereich GIS HTW.
Die Recherche in Datenbanken am Beispiel der Saarländischen Bibliographie.
Lernmodul Einführung Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Nutzungsbedingungen:
Einführung: Statistische Verfahren der automatischen Indexierung
 Präsentation transkript:

Seminar Textmining WS 06/07 Aufgaben I 1.Metadaten 2.Einfache Inverse Liste 3.Modifizierte Inverse Liste für komplexere Anfragen 4.Boolsches Retrieval

Seminar Textmining WS 06/07 Metadaten Was sind Metadaten? Wenn Sie eine Bibliotheksdatenbank aufbauen sollen, welche Metadaten lassen sich erheben? Welche Metadaten sind sinnvoll? Wofür? ISBN Nummer Autor Titel Hrsg. Verlag Herausgabedatum Bindung Ort Key words Buchklappentext Verleihstatus Volltext Art Medium Sachgebiet (hierarchisch)

Seminar Textmining WS 06/07 User sucht ein Buch Verwaltung (Sachgebiet)

Seminar Textmining WS 06/07 Boolsches Retrieval Gegeben sei eine Datenbank mit Artikeln zum Thema Autosport. Zu jedem Dokument gibt es einen Titel und eine Menge von keywords. Stellen Sie eine boolsche Anfrage, die alle Dokumente darüber findet, dass Michael Schumacher gewinnt findet. Erstellen(Skizzieren) Sie eine geeignete Datenstruktur, die die folgenden Anfragen korrekt beantwortet (d.h. die richtigen und nur die richtigen Datensätze besorgt): –Goldmedaille AND Rennen AND gewagten Manöver –Massenkarambolage OR Unfall OR Rennen –Schumacher/key AND Ferrari/ti Modifizieren Sie die Datenstruktur, um die folgenden Anfragen korrekt beantworten zu können. –Antrieb AND Energie AND sparen –Ferrari MIN1 verwickelt Lässt sich die Treffermenge jeweils nach Relevanz ordnen?

Seminar Textmining WS 06/07 Datenbank zum Thema Autosport Ferrari siegt wieder! –Ferrari Sieg Schumacher –Bei dem gestrigen Rennen gewann Michael S. in einem überzeugenden Rennen zum 5. Mal in Folge die Goldmedaille. Während das Rennen am Anfang noch von X dominiert wurde, konnte Michael S. X schließlich in einem gewagten Manöver überholen und verlor den Vorsprung nicht wieder. Unfall bei Rennen –Ferrari Schumacher Karambolage –Am vergangenen Samstag kam es zu einer Massenkarambolage, in die auch Michael Schumacher vom Ferrari Team verwickelt wurde. Durch das deutlich gelichtete Fahrerfeld gewinnt Y anschließend. Neuer Motor mit weniger Verbrauch bei gleicher Leistung –Toyota Energieeffizienz Antriebsleistung –Der neue Antrieb, vorgestellt von Toyota, erreicht durch ein Computergesteuertes Einspritz- und Zündungsverfahren bei gleicher Leistung einen im Schnitt um 1,2 Liter verringerten Benzinverbrauch

Seminar Textmining WS 06/07 Ferrari D1,1,4, D2,4 Siegt D1,2 Wieder D1,3 Sieg D1,5 Schumacher D1,6 Bei D1,7 … gewagten D1,20 … Manöver D1,21 D1,6,20

Seminar Textmining WS 06/07 Invertierte Liste Zu folgendem Text erstellen Sie eine Datenstruktur, die es erlaubt, folgende Anfragen Probleme: Stoppwörter, Grösse

Seminar Textmining WS 06/07

Aufgaben II Rankingbewertungen Precision/Recall und Mean Average Precision Als Verbessung vom boolschen Retrieval Vector space –Hund Katze: –Dokument mit 3xHund und 0xKatze gewinnt über Dokument mit 1xHund und 1xKatze (Beispiel rechnen lassen)

Seminar Textmining WS 06/07