Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)

Ähnliche Präsentationen


Präsentation zum Thema: "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)"—  Präsentation transkript:

1 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri) das sprachliche oder terminologische Gegenstück zu hierarchischen Klassifikationssystemen. Während Klassifikationen Themen oder Objekte inhaltlich ordnen, erfassen Thesauren Wörter, Terme und Ausdrücke eines Sachgebietes und beschreiben die Beziehungen zwischen ihnen. Thesauren haben vor allem zwei Funktionen: Sie definieren ein kontrolliertes Vokabular. Sie stellen Beziehungen (Relationen) zwischen den Termen dieses Vokabulars her.

2 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg2/8 Mit Thesauren lassen sich eine Vielzahl von weiteren Beziehungen zwischen Wörtern darstellen. Nach DIN1463 ist ein Thesaurus eine geordnete Zusammenstellung von Begriffen mit ihren (natürlich-sprachlichen) Beziehungen. Unterscheidungen sollten zwischen allgemeinen Thesauren und Thesauren für IR Systeme bestehen. Ein allgemeiner Thesaurus listet zu jedem Wort, neben einer kurzen Definition des Begriffes, verschiedene Relationen zu Gruppen von anderen Wörtern auf: Synonyme (Wörter mit gleicher Bedeutung) Antonyme (Wörter mit gegensätzlicher Bedeutung) Verwandte Wörter Oberbegriffe speziellere Begriffe Bei mehrdeutigen Wörtern werden diese Gruppen für jede Bedeutung einzeln ausgelistet.

3 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg3/8 Ein Beispiel für einen allgemeinen Thesaurus ist Rogets Thesaurus von 1852, in dem die Wörter der englischen Sprache nach den Ideen, die ausdrücken sortiert sind. Die allgemeinen Thesauren dienen Kreativität, Vielfalt aber auch Präzision bei der Wortwahl zu unterstützen oder vorzutäuschen.

4 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg4/8 Thesauren in IR Systemen (Th-IRSys) Im Gegensatz zu den allgemeinen Thesauren stehen bei den Th-IRSys die Beschreibung eines Wissensgebietes und die möglichst eindeutige Auszeichnung der Dokumente einer Sammlung zu diesem Gebiet im Vordergrund. Kernstück eines Th-IRSys ist ein kontrolliertes Vokabular (Problematik der Synonymie und Polysemie). Im Kernbestand werden zur Indexierung nur zugelassene Ausdrücke und sorgfältig ausgewählte Terme aufgenommen. Die Ausdrücke im Vokabular werden Deskribtoren genannt. Zu jedem Deskribtor kann eine Menge von Synonymen angegeben werden. Diese Synonyme haben in der Fachsprache eine gleiche oder ähnliche Bedeutung, werden aber in der Indexierung nicht aufgenommen. Die Definition der Synonymmengen legt die Detailgenauigkeit eines Thesaurus fest.

5 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg5/8 Zugangsweisen für Thesauren in IR Systemen (Th-IRSys) Typischerweise gibt es zwei Zugangsweisen für Th-IRSys. 1.Alphabetische Liste der Deskribtoren In dieser Liste sind auch die Terme aus den Synonymmengen aufgenommen. Mit Hilfe dieser Liste kann auf dem Deskribtor und den dazugehörigen Synonymen verwiesen werden. Bestehen Deskribtoren oder Ausdrücke aus mehreren Wörtern, gibt es den so genannten Rotated Index, in dem sie unter jedem der einzelnen Wörter, aus denen sie zusammengesetzt sind, alphabetisch verzeichnet sind.

6 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg6/8 2. Oberbegriffs- und Unterbegriffsrelationen Hier sind Th-IRSys hierarchisch gegliedert. Zu jedem Term ist ein Oberbegriff und eine Reihe spezifischer Begriffe angegeben, wenn diese im Thesaurus existieren. Durch diese Relationen kann ein Thesaurus – wie eine Klassifikation – als hierarchischer Graph gesehen werden. Sind die Ober- und Unterbegriffe streng definiert, kann ein Baum entstehen.

7 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg7/8 Konstruktion eines Thesaurus Vorwiegend werden Thesauren per Hand vom Menschen erstellt. Dabei handelt es sich meist um mehrere Personen einer Institution, die mit dem Fachgebiet vertraut sind. Manuelle Thesauren sind in ihrer Entwicklung aufwendig, teuer und langsam. In letzter Zeit wurde versucht, Thesauren automatisch auf der Basis großer Textsammlungen zu erstellen. Solche automatisch erstellten Thesauren sind billig, schnell und stärker auf eine Domäne zugeschnitten. Vorgehensweise zur Erstellung von Thesauren Bezugsrahmen wird eingegrenzt (Festlegung der Thematik, Spezifität, Sprachstil) Auswahl der Quellen (aktuelle Literatur, vorhandene Thesauren, Lehrbücher usw.)

8 Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg8/8 Terminologische Kontrolle des Vokabulars (Beseitigung der Unschärfen der natürlichen Sprache) Aufteilung der Terme in die Synonymmengen. Es werden dazu verschiedene Kontrollläufe unterschieden: Synonymkontrolle: Zusammenfassen von unterschiedlichen Schreibweisen, Abkürzungen, Vollformen, verschiedener Sprachstile, Fremdwörter usw. Polysemkontrolle unterscheidet Wörter mit gleicher Schreibweise aber unterschiedlicher Bedeutung. Zerlegungskontrolle werden Komposita gegebenenfalls in ihre Bestandteile zerlegt (ist unter Unständen notwendig, um ihre Spezifität eines Begriffes zu erhalten). Begriffliche Kontrolle


Herunterladen ppt "Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)"

Ähnliche Präsentationen


Google-Anzeigen