Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Detlef Reineke Universidad de Las Palmas de Gran Canaria MARTIF und TBX Austauschformate für Terminologie 2. Kölner Tagung Softwarelokalisierung IIM der.

Ähnliche Präsentationen


Präsentation zum Thema: "Detlef Reineke Universidad de Las Palmas de Gran Canaria MARTIF und TBX Austauschformate für Terminologie 2. Kölner Tagung Softwarelokalisierung IIM der."—  Präsentation transkript:

1 Detlef Reineke Universidad de Las Palmas de Gran Canaria MARTIF und TBX Austauschformate für Terminologie 2. Kölner Tagung Softwarelokalisierung IIM der FH Köln,

2 Detlef Reineke2/27 Übersicht Vorteile standardisierter Terminologieaustauschformate Kurzer Rückblick MARTIF (Machine-readable terminology interchange format) TBX (TermBase eXchange Format) Datenmodellierung und –austausch in Trados MultiTerm Ausblick

3 Detlef Reineke3/27 Vorteile von Austauschstandards Minimierung kostspieliger Redundanzen Systemunabhängige Erarbeitung und Vertrieb (Anbieter) Angebotserweiterung (Kunde) Konzentration auf Werkzeugoptimierung 10 Formate = 180 Konvertierungen 100 Formate = Konvertierungen 1 Update 10 Formate = 540 Konvertierungen 1 Update 100 Formate = Konvertierungen 1 Standardaustauschformat = 20 bzw. 200 Konvertierungen

4 Detlef Reineke4/27 Kurzer Rückblick MATER (Magnetic Tape Exchange Format for Terminological/Lexicographical Records = ISO 6156:1986) Standard für Datenaustausch zwischen Großrechnern 9-Spur Magnetband Feste Datenstruktur Integration terminologischer UND lexikographischer Daten MicroMATER flexibles Format für den Datenaustausch zwischen Großrechnern, Rechnern der mittleren Datentechnik und Microcomputern (Datenkategorien und –länge flexible)

5 Detlef Reineke5/27 Kurzer Rückblick TEI (Text Encoding Initiative) Format für Auszeichnung und den Austausch von Texten Zunächst SGML-basiert (Standard Generalized Markup Language) inzwischen XML-basiert (eXtensible Markup Language) TEI.terminology TEI ISO

6 Detlef Reineke6/27 MARTIF (ISO 12200:1999) Machine-readable terminology interchange format ISO Technical Committee 37 (Terminology - principles and coordination), Sub-Committee 3 (Computer applications for terminology), Working Group 3 (Data interchange) Text Encoding Initiative (TEI) und LISA (Localisation Industry Standards Association) SGML (Standard Generalized Markup Language = ISO 8879) ISO 649 (7-Bit Zeichensatz = 126 Zeichen) ISO (1999): Computer applications in terminology – Data categories

7 Detlef Reineke7/27 MARTIF Grundstruktur I.Prolog II.Document instance ( ) A.header ( ) B.text 1.front (optional) 2.body a.1 st terminological entry (minimum of one) b.2 nd terminological entry c.etc. (additional terminological entries) 3.back (optional) (ISO 12200:25)

8 Detlef Reineke8/27 DTD (Document Type Definition) Definition der Dokumentstruktur (Elemente, Attribute und Beziehungen) Instrument zur Validierung des MARTIF-Dokuments I. Prolog (Zeichendefinition) II. Document instance … MARTIF

9 Detlef Reineke9/27 DTD (Document Type Definition) MARTIF

10 Detlef Reineke10/27 MARTIF Dokumentinstanz … (Angaben zum gesamten Datenbestand) … (terminologische Einträge) … (bibliographische Daten) … (Verweise auf externes Referenzmaterial ) (ISO 12200:25)

11 Detlef Reineke11/27 MARTIF Darstellung der Datenkategorien Obergruppen von Datenkategorien,, bzw.,,,, etc. tig = term information group, ntig = nested term information group Instantiierung der Datenkategorien mittels type-Attribut Maß für die Lichtundurchlässigkeit synonym

12 Detlef Reineke12/27 Datenkategorien und Datenelemente subject field:Materialbeschaffenheit term:Opazität part of speech:Substantiv grammatical gender:f definition:Maß für Lichtundurchlässigkeit source:DIN 6370: , S. 383 MARTIF

13 Detlef Reineke13/27 Terminologischer Eintrag …

14 Detlef Reineke14/27 Terminologischer Eintrag - Querverweis … Opazität … Maß für die Lichtundurchlässigkeit S. 383 MARTIF

15 Detlef Reineke15/27 MARTIF Blind interchange (Teil 2) Verlustfreier Austausch terminologischer Daten ohne Absprache Umstellung auf XML (Unicode, Darstellung in HTML-Umgebung) Eindeutige Untermenge an Datenkategorien und Inhalten (ISO 12620) XML-Parser und Validierungswerkzeug für Überprüfung der Datenkategorie-Inhalte negotiated interchangeblind interchange noun, n., sub, Substantivn

16 Detlef Reineke16/27 TBX TermBase eXchange Format OSCAR-Gruppe (Open Standards for Container/Content Allowing Re- user group) der LISA (Localisation Industry Standards Assocation) SALT-Projekt (Standards-based Access Service to Multilingual Lexicons and Terminologies) ISO (2003): Computer applications in terminology – Terminological markup framework (TMF) - Regeln für die Spezifikation terminologischer Markup-Sprachen (TML) MSC (MARTIF with Specified Constraints) = Blind MARTIF

17 Detlef Reineke17/27 TBX Metamodell (ISO 16642:18) Terminological Data Collection (TDC) Global Information (GI)Complementary Information (CI) Terminological Entry (TE) Language Section (LS) Term Section (TS) Term Component Section (TCS) * * * *

18 Detlef Reineke18/27 TBX Angaben zum Gesamtbestand der terminologischen Datenbank …... ? = kann max. einmal vorkommen + = kommt min. einmal vor (LISA 2002:11)

19 Detlef Reineke19/27 TBX Eintragsebene ? = kann max. einmal vorkommen + = kommt min. einmal vor (LISA 2002:12)

20 Detlef Reineke20/27 TBX Terminologischer Eintrag …

21 Detlef Reineke21/27 TBX DTD Rudimentäre Typendefinition Keine XML-Auszeichnung Keine Definition von Namensräumen möglich Keine Definition fester Wertemengen von Datenkategorien möglich Empfehlung: XML Schema

22 Detlef Reineke22/27 Trados MultiTerm MultiTerm 5.5 ** Materialbeschaffenheit Opazität Substantiv f Maß für die Lichtundurchlässigkeit ^DIN 6370: ^, S. 383 … Opacity

23 Detlef Reineke23/27 Trados MultiTerm MultiTerm 5.5 Flach strukturiertes Exportformat Keine Zuordnung zu Metamodell bzw. Metadatenkategorien Beziehungen zwischen den Datenkategorien nicht explizit Sprach- (langSet) und Termkomponentenebene (termCompList) nicht adäquat darstellbar Eingeschränkte Zuordnungsmöglichkeit von Attributfeldern Umständliche Konvertierung über Exportschnittstelle bzw. Zwischenformat

24 Detlef Reineke24/27 Trados MultiTerm MultiTerm iX - - … - Materialbeschaffenheit - - Opazität - Substantiv - f …

25 Detlef Reineke25/27 Trados MultiTerm MultiTerm iX

26 Detlef Reineke26/27 Metadatenkategorien TBX vs. MultiTerm iX MultiTerm iXTBX * nicht vorhanden * * Bezeichnungsebene nicht vorhanden,

27 Detlef Reineke27/27 Fazit Geringe Implementierung TBX vs. Akzeptanz XLIFF/TMX TBX-ähnliches Format bisher nur in Trados MultiTerm iX, SGML- basiertes Format in STAR Termbase Schnittstellen zu OLIF2, TMX, XLIFF Offene Detaills (z.B. Standardzeichenkodierung, Binärdateien) Feinere Datenkategorien (ISO 12620) Umstellung auf Standardformate erfordert Zeit, Geld und Fachwissen Anpassung der Hochschulstudiengänge (Bologna-Erklärung)

28 Dr. Detlef Reineke Universidad de Las Palmas de Gran Canaria Facultad de Traducción e Interpretación C/ Pérez del Toro, Las Palmas de Gran Canaria Vielen Dank für Ihre Aufmerksamkeit.


Herunterladen ppt "Detlef Reineke Universidad de Las Palmas de Gran Canaria MARTIF und TBX Austauschformate für Terminologie 2. Kölner Tagung Softwarelokalisierung IIM der."

Ähnliche Präsentationen


Google-Anzeigen