Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.

Ähnliche Präsentationen


Präsentation zum Thema: "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle."—  Präsentation transkript:

1 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle oder automatische Anreicherung des unstrukturierten Textes um Deskribtoren, die mit dem herkömmlichen Datentyp string gespeichert werden können. Zu den Verfahren gehören die manuelle Klassifizierung oder Indexierung, sowie die automatischen Verfahren: Stichwortverfahren, morphologische Reduktion, Inhaltserschließung und Klassifizierung. Recherche Hierunter versteht man das Suchen von Textdokumenten nach Vorgabe von Dokumentendeskribtoren. Zu den Verfahren gehören die boolesche Suche, die Suche nach dem Vektorraummodell und die Probalistische Suche. Weiterhin kann man Freitextver- fahren (Suche nach Auftreten von Stichworten im Text) oder die Suche nach manuellen Klassifikationsmerkmalen unterscheiden.

2 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/5 Bewertung Eine Bewertung ordnet die gefundenen Dokumente ihrer Güte nach an (Wie gut nähert das Dokument die gestellte Recherche an?) und ermöglicht eine Reaktion des Nutzers. Zu den Verfahren gehört das Ranking, die Interaktion in Form der Relevanz – Rückkopplung (relevance Feedback) und die Messung der Selektionsgüte.

3 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/5 Die Verfahren zur Deskribierung können aus verschiedenen Blickwinkeln betrachtet werden. Die statistischen, wortbasierenden Verfahren sind im Bereich der Suchmaschinen oder Volltext-Datenbanksysteme am gebräuchlichsten. Diese Verfahren analysieren den Text aufgrund von Worten, die in ihm vorkommenden (Dieser Vorgang wird auch als Indizierung bezeichnet). Es werden dabei nur linguistische Analysen vorgenommen, etwa die Beugungsformen eines Wortes bei Deskribierung und Recherche, berücksichtigt. Eine Bewertung der Texte geschieht oft nach statistischen Maßstäben, wie die Häufigkeit des Wortes im Text.

4 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/5 Die linguistischen Verfahren analysieren die Satzstruktur der Texte und versuchen, die Worte im Satzzusammenhang zu erkennen. Sie ordnen den Worten deshalb eine bestimmte Rolle im Satz zu (etwa: Subjekt, Name, Relation zwischen Orten, Relation zwischen Zeitpunkten). Linguistische Verfahren sind stark vom Anwendungsbereich (Fachjargon) und der Sprache abhängig. Die wissensbasierten Verfahren versuchen mit Hilfe von Onotologien, das Anwendungsgebiet zu strukturieren. Onotologien kann man sich wie ein objektorientiertes Datenbankschema für ein bestimmtes Anwendungsgebiet vorstellen, in dem die Begriffe der Anwendung in verschiedene Spezialisierungs- oder Komponentenhierarchien eingeordnet werden.

5 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/5 Deskribierung Die Deskribierung beschreibt allgemein die Transformation eines Textdokumentes in eine Dokumentenbeschreibung. Dabei kann man folgende Arten von Beschreibungen erreichen wollen. Strukturbeschreibung, auch Metadaten genannt. Sie enthält eine dokumenttypspezifische (attributierte) Struktur (z.B. bibliographische Angaben) Deskribtoren, die Schlagworte über Text oder Stichworte aus dem Text darstellen. Eine Forderung an Deskribtionsverfahren ist, dass Dokumente gleichen Inhalts auch gleiche Deskribtoren bekommen. Man unterscheidet manuelle und automatische Verfahren.


Herunterladen ppt "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle."

Ähnliche Präsentationen


Google-Anzeigen