Terminologie und Thesauri

Slides:



Advertisements
Ähnliche Präsentationen
Zur Rolle der Sprache bei der Modellierung von Datenbanken
Advertisements

Generalisierung/Spezialisierung (1)
Frame-Logik Eine Einführung Andreas Glausch.
8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie
Imperative Programmierung
Bibliothekskurs Sozialwissenschaften
Die Registervariablen: Tenor of Discourse
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Information Retrieval auf Texten An ihre Grenzen stoßen relationale Datenbanken bei der.
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/8 Thesauren In gewisser Weise bilden Thesauren (Singular Thesaurus, Plural auch Thesauri)
Philosophie der Logik nach Frege I
Fakten, Regeln und Anfragen
Hypertextualisierung mit Topic Maps Ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten.
Beispiele für Ausdrucksalgebren
Soziale Interaktion und Alltagsleben
Interaktionen Verteilte Anwendungen Wintersemester 06/07 © Wolfgang Schönfeld Wie arbeiten VS mit ihrem Material (im einfachsten Fall)?
Die Entwicklung von Konzepten
Vom Thesaurus zur Ontologie
Terminologische Kontrolle durch Thesauri
Was ist ein Thesaurus? Wozu wird ein Thesaurus benutzt?
How to? Tipps und Tricks für die Thesauruserstellung
Klassifikation - Grundbegriffe
Spree SoSe 2009 Feedback Thesaurus Feedback Thesaurus Einstieg Frau Spree Schöne Ergebnisse – bei strengster Bewertung: 1,01,31,72,02,32,73,03,74,
How to? Tipps und Tricks für die Thesauruserstellung
1 Indexierung - Begriffszerlegung Alphabete Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/2006 Begriffszerlegung – wo gibt.
Indexierung - Verschlagwortung
Feedback Thesaurus-Projekt
Informationsarchitektur Beschreiben und Benennen
Spree SoSe 2010 Feedback Thesaurus / Facettenklassifikation Feedback Thesaurus / Facettenklassifikation Einstieg Frau Spree Schöne Ergebnisse – bei strengster.
Fortgeschrittene Methoden der Wissensorganisation
Jakob Voß: Grundlegende Aspekte des Semantic Web: Modellierung von Ontologien ( ) Modellierung von Ontologien Jakob Voß
Spree SoSe 2010 Optimierung von Volltextinvertierung durch den Einsatz von Indexierungswörterbüchern Artikelstrecke ab BUTTERBLUME im Deutschen Wörterbuch.
Was ist ein Thesaurus und wie wird er erstellt?
Grundlagen zu Thesaurus Petra Maier CIS, SS 07. Thesaurus und verwandte Begriffe Folksonomy Glossar Kontrolliertes Vokabular Ontologie Taxonomie, Klassifikationsschema.
Einführung zur Literaturrecherche in der Sportwissenschaft Bibliothekskataloge und Datenbanken Herbstsemester 2013 Gabriela Scherrer
5 Methoden und Werkzeuge zur Prozessmodellierung
Präsentation von: Tamara Nadine Elisa
Spezifik des fachbezogenen Sprachunterrichts Anita Emse, Lektorin der Fachhochschule Turiba.
Copyright 2011 Bernd Brügge, Christian Herzog Grundlagen der Programmierung TUM Wintersemester 2011/12 Kapitel 11, Folie 1 2 Dr. Christian Herzog Technische.
Wird ganz am Anfang der HTML-Datei geschrieben Doctype html public bedeutet, dass man sich auf die Öffentlichkeit der html-dtd bezieht Html ist die meist.
Klassifikation und Thesaurus Hilfsmittel der Wirtschaftsdokumentation
SS 2010 – IBB4C Datenmanagement Fr 15:15 – 16:45 R Vorlesung #2 Datenbankentwurf.
Lexikalische Semantik
Suchen und Finden. Vielfältig vorgehen Kompetenzen aufbauen Recherche als Prozess Ziel: Ergebnismengen minimieren, Qualität maximieren.
Semantische Grundbegriffe Busch/Stenschke Kap. 11
Vorstellungstheorie: Bedeutung als mentale Struktur.
Übung zu Einführung in die LDV I
Schulungsunterlagen der AG RDA
Die Ganze Welt im Computer? Informationsbeschaffung im Internet
Terminologische Kontrolle durch Thesauri
Theoretischer Hintergrund Systematische Wortschatzarbeit –
Mensch – Maschine - Kommunikation
Messergebnis Das Messergebnis ist der Näherungswert für den wahren Wert der Messgröße, der durch Auswertung der mit einer Messeinrichtung gewonnenen Messwerte.
Bedeutungsbeziehungen
Äquivalenz.
Fachwortschatz. Terminologie.
7. Formale Sprachen und Grammatiken
EINFÜHRUNG IN DIE MORPHOLOGIE Morphologie = Formenlehre
Topic Maps: Personal Brain
Ergebnisbericht zum Thema Bedarf an Fremdsprachen im Bereich Tourismus erstellt nach 82 extensiven Interviews, durchgeführt in sieben europäischen Ländern.
Lexikalische Semantik
Umweltmanagementinformationssysteme (Übung) WS 07/08 Sven Lindenhahn Arbeitsgruppe MIS Seite 1 Umweltmanagementinformationssysteme (Übung) 2.
IB + IA Anfänger Semantik
Deutsche zusammengesetze Wörter
VO#1: Lexikologie als sprachwissenschaftliche Disziplin Lexikologie, Matej-Bel-Univeristät in Banská Bystrica, Z. Tuhárska.
Das Zahlwort. Die Zahlwörter bezeichnen: -eine Zahl oder (in Verbindung mit Substantiven) eine bestimmte Anzahl von Gegenständen: Grundzahlwörter; -Den.
Die Kategorie der Bestimmtheit/ Unbestimmtheit
1) Das Wort als sprachliche Grundeinheit; 2) Das Problem der Grundeinheit der Sprache 3) Die Definition des Wortes;
VORLESUNG 1 Sprachbau Sememe Sätze Redeteilen Wortformen Wortgruppe Morpheme (Begriffe)
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
Thesauruskürzel WS 2009/10 Spree / ISD1 Deutsch Englisch
 Präsentation transkript:

Terminologie und Thesauri Karen Koos WS 2009/2010 in Anlehnung an Ulrike Spree, teilweise übernommen aus Spree: Terminologische Kontrolle durch Thesauri, HAW Hamburg WS2008/2009

... was ist eigentlich ein Pferd? Empfänger Sender Begriff [Konzept] Ich glaub', mich tritt ein Pferd Ross Rappe ... erzählt mal wieder was vom Pferd... Pferd Klepper Kaltblut Bezeichnung [Benennung, Term] Roß Araber Gaul Zossen Mähre Equus przewalskii Fohlen Schimmel Stute Pony Hengst In Auszügen übernommen von Jutta Lindenthal FH Postdam - Grundlagen der Informationsmethodik I - 22.10.2003

Semiotisches Dreieck

Semiotisches Dreieck -> Beispiel

Terminologie -> Probleme bei Benennungen Synonymie: ein Begriff - mehr als eine Benennung/Bezeichnung Zwei Wörter sind synonym, wenn sie die gleiche (ähnliche) Bedeutung haben. Orange – Apfelsine, Samstag – Sonnabend, Abtreibung – Schwangerschaftsabbruch Homonymie (Teekesselchen): eine Benennung - mehr als ein (etymologisch nicht verwandter) Begriff Bank (Geldinstitut, Sitzgelegenheit), Tau (Seil, morgendlicher Niederschlag), Schicht (Gestein, Arbeit, Sozialstruktur) Polysemie (Teekesselchen): eine Bezeichnung - mehr als ein (etymologisch verwandter) Begriff Pferd = Tier, Pferd = Turngerät

Terminologische Kontrolle Formale Ansetzung Polysemkontrolle, Homonymkontrolle Synonymkontrolle

Formale Ansetzung Numerus: Bevorzugt Singular Ausnahmen: Wörter, die nur im Plural vorkommen wie Eltern; Kosten Wortfolge: Bevorzugt natürliche Wortfolge in Adjektiv-Substantiv-Verbindungen Internationale Beziehungen statt Beziehungen, Internationale Wortart: Bevorzugt Substantive statt Verben Therapie statt Therapieren Wortart: Keine isolierten Adjektive Internationale Beziehungen statt International Abkürzungen: Bevorzugt Langform statt Kurzform Nacht-und-Nebel-Häftling statt NN-Häftling Möglichst wenig kombinierte Bezeichnungen

Polysemkontrolle / Homonymkontrolle Bezeichnungen mit identischer Schreibweise aber unterschiedlichen Bedeutungen werden disambiguiert durch qualifizierenden Zusatz in runden Klammern (Homonymenzusatz, Qualifikator) Kiefer (Knochen) Kiefer (Nadelholz) Morphologie (Biologie) Morphologie (Sprachwissenschaft)

Synonymkontrolle In Terminologiedatenbanken wird ein Deskriptor festgelegt und die Verwendung aller Synonyme verboten bzw. eingeschränkt In Wissensdatenbanken Verweis von Synonym auf Deskriptor (z.B. Buchregister, Thesaurus)

Äquivalenzrelationen Hierarchierelationen Assoziationsrelation

Relationsformen A=B A B A B Weihnachten=Christfest Äquivalenzrelation B wird für den Zweck des Thesaurus in der Bedeutung A gleichgesetzt A B IsA Teil von Hierarchierelation B ist ein A oder ist ein Teil von A Weihnachten is A Kirchenfest A B Assoziationsrelation B und A überschneiden sich in einem Bedeutungselement Weihnachten / Familienfeier nach: ANSI/NISO Z39.19-1993

Äquivalenzrelation (für Synonyme) = Beziehung zwischen Bezeichnung(en) und Begriff Zusammenfassung von bedeutungsgleichen oder ähnlichen Bezeichnungen [Benennungen,Terme] zu einem Begriff [Konzept] in der Äquivalenzklasse Verweisungsrelation, analog "siehe-Verweisung" in Buchregistern Pferd UF Gaul UF Ross Ross USE Pferd Relationenkürzel: deu BS – BF [Benutze Synonym - Benutzt für] eng USE – UF [Use - Use(d) for]

Äquivalenzrelation -> Typen äquivalenter Terme Zur Äquivalenzklasse werden Bezeichnungen zusammengefasst, die bedeutungsgleich oder bedeutungsähnlich sind. Das können sein: Lexikalische Varianten [Schreibweisen] Synonyme Quasisynonyme Von diesen Bezeichnungen wird eine Variante zur Vorzugsbenennung (Deskriptor) gewählt, die den Begriff repräsentiert.

Äquivalenzrelation -> Lexikalische und syntaktische Varianten Kurzformen (Abkürzungen, Akronyme) WEK - Windenergieanlage Schreibweisen (graphische Varianten) Roß – Ross, Windenergie-Anlage - Windenergieanlage Normierte Bezeichungen EG – Ägypten Invertierte Formen Beziehungen, Internationale

Äquivalenzrelation -> Synonyme Regionale und dialektale Varianten Brötchen - Schrippe - Semmel Chronologische Varianten (veraltete Ausdrücke) Antlitz - Gesicht Gruppensprachliche Varianten Geld - Kies - Zaster Fachsprachliche Bezeichnungen Keuchhusten - Pertussis Stilistische Varianten, Sprachebene Visage - Fresse - Gesicht - Antlitz Generische Bezeichnung und Handelsnamen Papier-Taschentuch - Tempo Varianten unterschiedlicher linguistischer Herkunft Konspiration - Verschwörung Fremdsprachige Bezeichnungen Crystal night - Kristallnacht

Äquivalenzrelation -> Quasisynonyme Da es reine Synonyme bei genauer Betrachtung in Fachsprachen und auch in der natürlichen Sprache kaum gibt, müssen die meisten sog. Synonyme als Quasisynonyme angesehen werden. Begriffe, die in einem Thesaurus zu spezifisch sind, können als Quasisynonyme auf den allgemeineren Begriff verweisen (upward posting oder generic posting). Gestein UF Basalt Granit Schiefer

Hierarchierelation = Beziehung zwischen Begriffen (Deskriptoren) Beziehung zwischen Begriffen höherer und niedrigerer Abstraktionsebene (Ober- und Unterklassen) Relationenkürzel: deu OB - UB [Oberbegriff - Unterbegriff] eng BT - NT [Broader term - Narrower term] Tier NT Katze NT Pferd

Hierarchierelation -> Formen der Hierarchierelation Abstraktionsrelation (generische Relation, Subsumtionsrelation, Subordinationsrelation, Generalisierungs-Spezialisierung-Relation) Instanzrelation Bestandsrelation (partitive Relation, Pertinenz, Meronymie)

Hierarchierelation -> Abstraktionsrelation = Logische Relation zwischen Oberbegriffen und Unterbegriffen Der Unterbegriff hat alle Merkmale des Oberbegriffs und hat mindestens ein spezifizierendes Merkmal darüber hinaus Der Oberbegriff besitzt weniger Begriffsmerkmale als der Unterbegriff (geringere Intension) Der Oberbegriff hat einen größeren Begriffsumfang als der Unterbegriff (gößere Extension) Is-A-Hierarchie (logische Hierarchie) Pferd Is-A Säugetier -> Pferd NTG Säugetier Relationenkürzel: deu OA – UA [Oberbegriff - Unterbegriff (Abstraktionsrelation)] eng BTG – NTG [Broader term - Narrower term (generic)]

Hierarchierelation -> Abstraktionsrelation -> Achtung! Jagen Jäger Jagdmesser Keine korrekte Abstraktionsrelation, denn: Unterbegriff und Oberbegriff gehören stets der gleichen Begriffskategorie an. Vorgänge können mithin nur mit Vorgängen, Eigenschaften nur mit Eigenschaften, Gegenstände nur mit Gegenständen in einer Abstraktionsrelation stehen. [DIN 1463 Teil 1, Nov 1987, 5.3.1]

Hierarchierelation -> Bestandrelation Bestandsrelation [partitive Relation, Teil-Ganzes-Relation, Part-Whole-Relationship] Beziehung zwischen Begriffen eines größeren Ganzen und eines Teils davon Relationenkürzel: deu SP - TP eng BTP - NTP [Broader term - Narrower term (partitive)] Körperorgansysteme und Organe Nervensystem Zentralnervensystem Gehirn Rückenmark Geographische Systeme Deutschland Schleswig-Holstein Lübeck

Hierarchierelation -> Polyhierarchie = Beziehung zwischen Begriffen (Deskritporen) Ein Unterbegriff hat mehr als einen Oberbegriff Prinzipiell gibt es in einem Thesaurus keine Beschränkung für die Anzahl der für einen Begriff angebbaren über- oder untergeordneten Begriffe. Man spricht von [...] Polyhierarchie, wenn für einen Begriff mehr als ein direkt übergeordneter Begriff angegeben wird. [DIN 1463 Teil 1, Nov 1987, 5.3.3]

Assoziationsrelation Eine Assoziationsrelation ist eine zwischen Begriffen bzw. ihren Bezeichnungen als wichtig erscheinende Relation, die weder eindeutig hierarchischer Natur ist, noch als äquivalent angesehen werden kann. [DIN 1463 Teil 1, Nov 1987, 5.4] Disziplin und Objekte bzw. Personen der Disziplin Zoologie - Zoologe; Neurologie - Nervensystem Ereignisse und Akteure Jagd - Jäger Objekte, Ereignisse und Gegenmittel Pflanzen - Herbizide Aktionen und ihre Produkte Weben - Kleidung; Buch - Buchdruck Ereignisse und ihre Ursachen Infektion - Krankheitserreger Weibliche und männliche Form Lehrerin - Lehrer

Relationen -> Abkürzungen nach: DIN 1463, Teil 2, 3.1 und ANSI/NISO Z39.18-1993, p. xii Deutsch Englisch SB = Spitzenbegriff TT = Top Term OB = Oberbegriff BT = Broader term UB = Unterbegriff NT = Narrower term VB = Verwandter Begriff RT = Related term OA = Oberbegriff (Abstraktionsrelation) BTG = Broader term (generic) UA = Unterbegriff (Abstraktionsrelation) NTG = Narrower term (generic) --- BTI = Broader term (instance) NTI = Narrower term (instance) SP = Verbandsbegriff (Bestandsrelation) BTP = Broader term (partitive) TP = Teilbegriff (Bestandsrelation) NTP = Narrower term (partitive) BS = Benutze Synonym USE = Use BF = Benutzt für Synonym UF = Use(d) for BK = Benutze Kombination KB = Benutzt in Kombination UFC = Used for combination H = Erläuterung (Hinweis) SN = Scope note D = Definition

Beispiel für Relationen im Thesaurus

Begriffszerlegung, Präkombination, Postkoordination Als Präkombination bezeichnet man in der Indexierung eine Methode, bei der die Deskriptoren schon bei ihrer Vergabe durch Qualifikatoren oder Links verknüpft werden. Die Auswahl der Thesaurusbegriffe erfolgt also während der inhaltlichen Erschließungsphase durch eine koordinierte Vergabe der Deskriptoren. Als Postkoordination bezeichnet man in der Indexierung eine Methode, bei der die Deskriptoren möglichst so vergeben werden, dass der Rechercheur die richtigen Dokumente mit Hilfe der Booleschen Operatoren NICHT, ODER, UND möglichst gezielt wieder finden kann. Die Auswahl der Thesaurusbegriffe erfolgt also erst beim Information Retrieval, d.h. nach der Erschließungsphase. Quelle: Wikipedia, http://de.wikipedia.org/, Stand: 16.10.2009

Präkombination oder Postkoordination? Sind alle begrifflichen Komponenten nötig? (Blumengießkanne) Bleibt nach Zerlegung die Spezifität erhalten? (Medienwissenschaft) Lässt sich die Ausgangsbenennung rekonstruieren? (Schlangengift) Gebräuchlichkeit der Begriffskombination? (DVD-Player) Handelt es sich um eine feststehende Wendung / Fachausdruck? (Baumschule; Autobahn) Achtung: Es werden immer nur Begriffe und nicht Wörter zerlegt Also: Handschuh  Hand + Bekleidung (nicht: Hand + Schuh)

Begriffszerlegung Autobahn Blumengießkanne Schlangengift Blume + Gießkanne? Schlangengift Schlange + Gift? Plattenspieler Platte + Spieler? Schallplatte + Abspielgerät? Kindergarten Kind + Garten?

Thesaurus: Zusammenfassung ist eine Dokumentationssprache Kontrolliertes Vokabular, dessen Begriffe durch Relationen miteinander verbunden sind und ein semantisches Netz bilden Unterstützt Indexierung und Retrieval Wird angewandt zur inhaltlichen Erschließung und in Terminologiedatenbanken für eine einheitliche Unternehmenssprache

Fachtermini, die Sie verstehen müssen Deskriptor Begriffsrelation übergeordneter Begriff - untergeordneter Begriff / hierarchische Relation Verwandter Begriff / Assoziationsrelation Synonymkontrolle / Äquivalenzrelation Polysemkontrolle / Homonym Zerlegungskontrolle / Begriffskombination

Ziele eines Thesaurus: Sämtliche Informationen innerhalb eines Unternehmens sollen für jeden schnell zugänglich und leicht auffindbar sein unnötige Doppelarbeit soll vermieden werden, denn oft arbeiten zwei Mitarbeiter an der gleichen Problemlösung und wissen es nicht Kommunikation soll verbessert werden