Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle.

Slides:



Advertisements
Ähnliche Präsentationen
Kohonennetze für Information Retrieval mit User Feedback
Advertisements

PG Intelligence Service
Vorgehensmodell - Wasserfallmodell
Zur Rolle der Sprache bei der Modellierung von Datenbanken
Übung Datenbanksysteme WS 2003/ Übung Datenbanksysteme Entwurf eines Bibliothekssystems
Kosten und Nutzen der Optimierung von Inhaltserschließung
BSZ SWBplus / Friederike Gerland 1 SWBplus Datenbank für Inhaltsverzeichnisse, Rezensionen, Abstracts.
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Kapitel 4 Datenstrukturen
„Philosopher‘s Index“ by OvidSP
Mein EBSCOhost-Lernprogramm
Wissensmanagement mit semantischen Netzen – Analyse und Vergleich verschiedener Softwarelösungen Autor: Holger Wilhelm Referentin: Prof. Dr. Uta Störl.
Numerik partieller Differentialgleichungen
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/12 Informationsretrieval Suche mit und nach Attributen und Merkmalen, die bedeutend für die.
Lernen als Informationsverarbeitung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/10 Grafische Anfragesprachen Geeignet sind grafische Anfragesprachen für Nutzer, die keine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/9 Data Mining Ist die Wissensgewinnung aus Datensammlungen (Knowledge Discovery in Database).
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Klassifikationen Klassifikationen dienen dazu, Themen oder Objekte systematisch zu ordnen.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/10
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/7
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Machine Learning (ML) Der erste Teil dieser Definition ist auch eine Beschreibung von Machine.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
QBE in MS Access formulieren
Abhängigkeitsbeziehung
UML im Überblick – Dipl. Ing. Ulrich Borchert / FH Merseburg 1/22
Schritte zu Datenmodellierung
Navigieren / Suchen 12.Oktober Kann ein Browser das? 12.Oktober Bei findet man für das Wort browsehttp://dict.leo.org.
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
HTML - Eine erste Annäherung
Benutzen von Internetseiten
© 2002 Prof. Dr. G. Hellberg 1 XML-Seminar XML-Technologie: XML in Theorie und Praxis Prof. Dr. G. Hellberg XML-Technologie: XML in Theorie und Praxis.
Support.ebsco.com Lernprogramm zur einfachen Suche in wissenschaftlichen Bibliotheken.
Semantisch gestützte Suche im Internet
Normalformen Normalisieren Schlüssel
6 Normalformen Normalisieren Schlüssel
Wie funktionieren Suchmaschinen?
Indexierung - Verschlagwortung
Relevanz Ranking Bisher: Sind wir davon ausgegangen, dass das Ergebnis des Rankings des statistischen Verfahrens in den Index geschrieben wird und dem.
Relevanz Ranking Bisher:
ISWeb - Information Systems & Semantic Web Marcin Grzegorzek 3.3 Relevance Feedback Bewertung von Ergebnisdokumenten Auswertung.
Entitäten Extraktion Wichtige Schritte Petra Maier WS 05/06.
Titel des Vortrags Name des Vortragenden Seminar
Komponenten eines Information Retrieval Systems
Entwurf und Realisierung einer digitalen Bibliothek zur Verwaltung von Notenhandschriften Dipl.-Ing. Temenushka Ignatova Datenbank- und Informationssysteme,
Objektive Hermeneutik
Im Internet geht alles schneller, aber es dauert länger
1 Dipl.-Ing.(FH) Oliver Schulte In Kooperation mit Thema : Objektorientierte Realisierung eines Programms zur Erkennung von Vogelstimmen mit Hilfe Neuronaler.
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
Kaufkraft & Preisindex
DW /JR–Integration Bf BK
Suchen und Finden. Vielfältig vorgehen Kompetenzen aufbauen Recherche als Prozess Ziel: Ergebnismengen minimieren, Qualität maximieren.
Suchmaschinen.
Dokumentenablage und -Flut im Griff - mit unternehmensweiten Suchmaschinen Fachvortrag auf der I+E Messe Freiburg ©Semantec 2007 Dokumentenablage.
Ortung mit GSM Dipl. Ing. Ulrich Borchert Fach: Mobile Computing HS Merseburg (FH)
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Informatik Technische Informatik Praktische Informatik Theoretische
Verfassen von Aufsätzen
Arbeit mit Arbeitsaufträgen
TUDWCMS Wie kann der Autor eines Dokumentes geändert werden ?
XML und Datenbanken Textbasierte Abbildung von XML auf Datenbanken Sebastian Roolant.
1 Zahlreiche Transformationen - Achtung Hochspannung Meike Klettke.
MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Text bearbeiten Word Texte eingeben und bearbeiten automatische und.
Einleitung NEVARIS FINANCE ist das ideale Programm für mittlere und größere Baufirmen. In Verbindung mit unseren zuverlässigen DMS- Ergänzungen (DMS =
MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen.
Excel-Tool: Beschwerdeanalyse  Folie 1 von Bitte Makros aktivieren Das Excel-Tool funktioniert nur mit eingeschalteten Makros. Eventuell erhalten.
Wie verwende ich Suchmaschinen richtig?
 Präsentation transkript:

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/5 Grundtechniken des Information Retrieval Deskribierung Hierunter versteht man eine manuelle oder automatische Anreicherung des unstrukturierten Textes um Deskribtoren, die mit dem herkömmlichen Datentyp string gespeichert werden können. Zu den Verfahren gehören die manuelle Klassifizierung oder Indexierung, sowie die automatischen Verfahren: Stichwortverfahren, morphologische Reduktion, Inhaltserschließung und Klassifizierung. Recherche Hierunter versteht man das Suchen von Textdokumenten nach Vorgabe von Dokumentendeskribtoren. Zu den Verfahren gehören die boolesche Suche, die Suche nach dem Vektorraummodell und die Probalistische Suche. Weiterhin kann man Freitextver- fahren (Suche nach Auftreten von Stichworten im Text) oder die Suche nach manuellen Klassifikationsmerkmalen unterscheiden.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/5 Bewertung Eine Bewertung ordnet die gefundenen Dokumente ihrer Güte nach an (Wie gut nähert das Dokument die gestellte Recherche an?) und ermöglicht eine Reaktion des Nutzers. Zu den Verfahren gehört das Ranking, die Interaktion in Form der Relevanz – Rückkopplung (relevance Feedback) und die Messung der Selektionsgüte.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/5 Die Verfahren zur Deskribierung können aus verschiedenen Blickwinkeln betrachtet werden. Die statistischen, wortbasierenden Verfahren sind im Bereich der Suchmaschinen oder Volltext-Datenbanksysteme am gebräuchlichsten. Diese Verfahren analysieren den Text aufgrund von Worten, die in ihm vorkommenden (Dieser Vorgang wird auch als Indizierung bezeichnet). Es werden dabei nur linguistische Analysen vorgenommen, etwa die Beugungsformen eines Wortes bei Deskribierung und Recherche, berücksichtigt. Eine Bewertung der Texte geschieht oft nach statistischen Maßstäben, wie die Häufigkeit des Wortes im Text.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/5 Die linguistischen Verfahren analysieren die Satzstruktur der Texte und versuchen, die Worte im Satzzusammenhang zu erkennen. Sie ordnen den Worten deshalb eine bestimmte Rolle im Satz zu (etwa: Subjekt, Name, Relation zwischen Orten, Relation zwischen Zeitpunkten). Linguistische Verfahren sind stark vom Anwendungsbereich (Fachjargon) und der Sprache abhängig. Die wissensbasierten Verfahren versuchen mit Hilfe von Onotologien, das Anwendungsgebiet zu strukturieren. Onotologien kann man sich wie ein objektorientiertes Datenbankschema für ein bestimmtes Anwendungsgebiet vorstellen, in dem die Begriffe der Anwendung in verschiedene Spezialisierungs- oder Komponentenhierarchien eingeordnet werden.

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/5 Deskribierung Die Deskribierung beschreibt allgemein die Transformation eines Textdokumentes in eine Dokumentenbeschreibung. Dabei kann man folgende Arten von Beschreibungen erreichen wollen. Strukturbeschreibung, auch Metadaten genannt. Sie enthält eine dokumenttypspezifische (attributierte) Struktur (z.B. bibliographische Angaben) Deskribtoren, die Schlagworte über Text oder Stichworte aus dem Text darstellen. Eine Forderung an Deskribtionsverfahren ist, dass Dokumente gleichen Inhalts auch gleiche Deskribtoren bekommen. Man unterscheidet manuelle und automatische Verfahren.