Terminologiearbeit: Vom guten Vorsatz zur Umsetzung Maryline Hernandez IAI, Saarbrücken tekom RG Baden 22. Januar 2008
Vorstellung Institut für Angewandte Informationsforschung seit über 20 Jahren sprachtechnologische Anwendungen Dienstleistungen und Softwarelösungen Indexierung Terminologieextraktion und –evaluierung Informatiker, Computerlinguisten, Übersetzer Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Überblick Einführung Erste Schritte Tipps Aufwand Weiterführende Schritte Referenzen Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Einführung ein bisschen Terminologielehre Das Semiotische Dreieck Begriffsorientiertheit Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Einführung Das Semiotische Dreieck Begriff Benennung Gegenstand Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Einführung Begriffsorientiertheit Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit: Wichtigste Argumente & Ziele erhöhte Qualität der Daten und Dokumente Reduktion der Übersetzungskosten einheitliches Image (Corporate Identity) bessere interne Kommunikation Rechtssicherheit Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit: als "spontaner Prozess"? Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Terminologiearbeit: als definierter Prozess Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Am Anfang war die Vision Datenbank, Web-basiert, bunt und multilingual aber: es gibt nicht "die Lösung" Oberstes Gebot: Bedürfnisse der Anwender analysieren Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Erste Schritte Datenmodell definieren System auswählen Inhalte erschließen Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 1: Datenmodell /1 Beispiel: den Bestand des heimischen Weinkellers erfassen wichtige Informationen zu einem Wein: Rebsorte Jahrgang Herkunft Anzahl v. Flaschen Wozu passt der Wein? Name Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 1: Datenmodell /2 Welche Informationen sind für die Erfassung eines Worts unabdingbar? Datenkategorien für eine TDB festlegen Datenkategorien gruppieren verwaltungsrelevant begriffsrelevant benennungsrelevant Datenmodell definiert! Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /1 Kommerzielle Terminologieverwaltungssysteme mit vorgegebener oder frei definierbarer Datenstruktur Zeitersparnis erhöhte Konsistenz und Qualität fehlende Kompatibilität zwischen Tools hohe Anfangsinvestition Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /2 Eigenentwicklungen flexibel (in Konzeption und Wartung) Abhängigkeiten zwischen Feldern prüfbar z.B. Angabe im Feld "Genus" nur wenn "Wortart" "Substantiv" ist konzeptioneller bzw. programmatischer Aufwand notwendig Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 2: Systemauswahl /3 Strategische Überlegung und Bedarfsanalyse notwendig eine spätere Umstellung ist kostspielig Alternative: mit Listen anfangen Excel, Access Korrekturen im Datenmodell möglich später Umstieg auf ein "echtes System" Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /1 Unterschiedliche Ausgangssituationen nur Dokumente vorhanden bereits Listen vorhanden Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /2 - aus einem Dokument Übung Ein Dokument durchforsten Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /3 Ansätze der Termextraktion manuell pragmatisch auch auf Basis von Papierdokumenten zeitaufwändig, fehleranfällig automatisch statistisch schnell erzeugte Liste Software-Kauf oder Dienstleistung automatisch linguistisch kann vorhandene Termliste berücksichtigen Lauf über Dokumentbestand Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /4 - aus einer Liste Übung Termliste begutachten Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Schritt 3: Inhalte erschließen /5 - aus einer Liste Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps und Aufwand Benennungsautonomie Was gehört in die TDB? Wie viel Terminologie ist genug? Was gilt es zu vermeiden? Einmalige Investitionen Regelmäßige Aufwände Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Benennungsautonomie* *vgl. Schmitz ein vollständiger Datenblock pro Benennung Feld "Verwendungsstatus" unterscheidet zwischen Vorzugsbenennung erlaubtes Synonym nicht erlaubtes Synonym Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Benennungsautonomie Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Was gehört in die TDB? Faustregel: alle Benennungen, deren Gebrauch festgelegt werden muss auch Produktbezeichnungen nicht nur Vorzugsbenennungen nicht jede nicht erlaubte Benennung Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Wie viel Terminologie ist genug? /1 wenn das festegelegte Fachgebiet (zunächst) abgedeckt ist weitere Fachgebiete hinzufügen Umfang für ein industrielles Produkt: ca. 5.000 bis 8.000 Benennungen davon ca. 10 % nicht erlaubte Benennungen Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Wie viel Terminologie ist genug? /2 Terminologiedichte in Texten anfangs 10 % wenn TDB gut ausgebaut, bis zu 50 % aber: Terminologiearbeit ist nie abgeschlossen! Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Tipps Was gilt es zu vermeiden? zu wenig Zeit einplanen zuviel auf einmal machen wollen, ein zu komplexes System erstellen ein starres Datenmodell definieren, von dem man nicht wegkommt alleine anfangen Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Aufwand: Einmalige Investitionen Planung: intern, ggf. mit Dienstleister Kauf 1.000 bis 30.000 EUR* *vgl. Oehmig bzw. Entwicklung intern oder extern je nach Komplexität des Systems Aufbau: Erfassungskosten* Term + Definition: ca. 3 pro Stunde -> 20 EUR pro Term Term + Kontextbeispiel: ca. 20 pro Stunde -> 3 EUR pro Term Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Aufwand: Regelmäßige Aufwände Wartung* *vgl. Warburton pro Benennung, pro Jahr: < 1 bis > 5 US$ Aktualisierung neue Benennungen Ergänzung zusätzliche Informationen (Definitionen…) zusätzliche Fachgebiete Halbe bis ganze Stelle für Terminologiearbeit Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Weiterführende Schritte /1 Terminologieleitfaden was gehört in die Datenbank? Termbildungsregeln wie entsteht eine neue Benennung? Antragswesen ganze Firma in die Terminologiearbeit miteinbeziehen Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Weiterführende Schritte /2 Ausbau der fremdsprachlichen Seite Verwendung der entstandenen autoritativen Terminologie gewährleisten: Werkzeuge für sprachliche Qualitätssicherung von Texten: CLAT Aufbau einer Ontologie Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Referenzen Pavel,Silvia/Nolet, Diane: Handbook of Terminology (www.termiumplus.gc.ca) Hennig, Jörg/Tjarks-Sobhani, Marita (Hrsg.): Terminologiearbeit für Technische Dokumentation (tekom Schriften zur Technischen Kommunikation Nr. 12) Soukup-Unterweger, Irmgard: Von Z bis A – Basiswissen Terminologie tekom Frühjahrstagung 2006: Terminologie von Anfang an Drewer, Petra: Sauberes Terminologiemanagement – saubere Terminologie: Wie bringe ich Ordnung ins terminologische Chaos? Oehmig, Peter: Effizienter im Unternehmen - Wirtschaftlichkeit der Terminologiearbeit Schmitz, Klaus-Dirk: Systeme zur Terminologieverwaltung Warburton, Kara: Terminology Management in the Localization Industry – Results of the LISA Terminology Survey Wright, Sue Ellen/Budin, Gerhard: Handbook of terminology management Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Normen DIN 2330: Begriffe und Benennungen - Allgemeine Grundsätze ISO 10241: International terminology standards – Preparation and layout ISO 12620: Computeranwendungen in der Terminologiearbeit - Datenkategorien ISO 12200: Computeranwendungen in der Terminologiearbeit - Maschinenlesbares Terminologieaustauschformat (MARTIF) Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008
Vielen Dank! Für weitere Fragen: Maryline Hernandez IAI – Institut für Angewandte Informationforschung Martin-Luther-Str. 14 66111 Saarbrücken maryline.hernandez@iai-sb.de
Bildernachweis Zettelkasten http://www.literaturmanagement.net/zettelkasten.html Rotweinflasche www.wg-eschenau.de/pages/weinshop/index.php Champagner www.marions-kochbuch.de/index/1256.htm Luppe alt.makos.at/suche/ Kisten www.fioregmbh.ch/sperrholzkisten.htm Gefahr http://www.geschichteinchronologie.ch/ v/verkehrszeichen-CH/gefahrsignale.html Münzen www.uni-tuebingen.de/uni/qvo/38dinge/dinge04.html Kreuzung www.kirche-wohltorf.de/gemeindebf2004.html Copyright © 2008 IAI Maryline Hernandez tekom RG Baden 22.01.2008