Translation-Memory-Technologie: Konzepte, ihre Realisierungen in kommerziellen Produkten und Entscheidungshilfen für den Einsatz konkreter Systeme Uta Seewald-Heeg — Hochschule Anhalt (FH) EQUIVALENCES 01 Neuenburg, 19. Mai 2001
Translation-Memory-Technologie Konzepte der Translation-Memory-Technologie Recycling bestehender Übersetzungen Komponenten von Translation-Memory-Systemen Kommerzielle Produkte Produktpalette Systemeigenschaften Terminologieverwaltung Retrieval im Referenzmaterial 3 Entscheidungshilfen für den Einsatz konkreter Systeme
Konzepte der Translation-Memory-Technologie Recycling bestehender Übersetzungen
Traditioneller Übersetzungsprozess Quelltext- Dokument 1 Zieltext- Dokument 1 Übersetzen Nachschlagen/Recherchieren von Terminologie In Wörterbüchern In Terminologiedatenbanken Auf WWW-Seiten Suchen bereits erstellter Übersetzungen Im Ablagesystem Auf Disketten Im Dateisystem des Computers Zieltext- Dokument 2 Quelltext- Dokument 2 . . Quelltext- Dokument n Zieltext- Dokument n
Recycling bestehender Übersetzungen Übersetzungsprozess mit Translation Memory Quelltext- Dokument Zieltext- Dokument Pre-processing Extraktion der Formatinformation Abgleich der Quelltext-Sätze mit dem Referenzmaterial (Matches) Post-processing Zusammenführen der übersetzten Sätze mit der Formatinformation Speichern der Satzpaare im TM Übersetzen Überprüfen der Matches
Konzepte der Translation-Memory-Technologie Komponenten von Translation-Memory-Systemen
Translation Memory (TM) Übersetzungsspeicher CAT Multilinguales Text-/Satzarchiv Synchronisierte quellsprachige und übersetzte Textsegmente (Sätze), die als Referenzmaterial dienen Retrieval erfolgt in der Regel mit fuzzy logic
Komponenten von Translation-Memory-Systemen 3 Text-/ Dokumenten- programm 4 Alignment- programm 1 Datenbank- Verwaltungs- programm 2 Terminologie- programm 5 Import-/ Export- Filter
1 Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren Datenbank- Verwaltungs- programm Morphologische Analyse Linguistisches Tagging Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren
2 Möglichkeit des Imports elektronisch gespeicherter Glossare Morphologische Analyse Eintragsmodelle TM-Schnittstelle Workflow 2 Terminologie- programm Möglichkeit des Imports elektronisch gespeicherter Glossare Translation Manager (IBM) wird mit Terminologie-Wörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an einige Programme sind sehr komplex (Fuzzy-Match-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel) Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen)
3 Programm, in dem die Übersetzung angefertigt wird Text-/ Dokumenten- programm Programm, in dem die Übersetzung angefertigt wird häufig: 2 parallel angeordnete Fenster (AT - ZT) oft: 1 weiteres Fenster, das Einheiten des TM anzeigt meistens: Fenster des Terminologieprogramms z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten
4 Alignment- programm Möglichkeit, bestehende Texte und Übersetzungen in die Datenbank einzulesen Texte werden in Segmente (meist Sätze) zerlegt Zuordnung von Textstellen (Sätzen) durch Verwendung von statistischen und/oder inhaltlichen Kriterien Nachbearbeitung in der Regel erforderlich große Unterschiede zwischen den angebotenen Programmen Star Transit: stark automatisiert (zeitsparend) Trados WinAlign: halbautomatisch; mit graphischer Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben in der Regel: zusätzliche Kosten bei der Anschaffung
5 Import-/ Export- Filter Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM) Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB) Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet
Eignung von Translation-Memory-Systemen Texte liegen maschinenlesbar vor Große Textmengen mit hohem Anteil an Wiederholungen (Sätze, syntaktische Strukturen, Terminologie) innerhalb eines Textes sowie relativ zum vorhandenen Referenzmaterial Umfangreiche Terminologie Sicherstellen der terminologischen Konsistenz Wenige große Kunden (schnellere Amortisierung)
Kommerzielle Produkte Produktpalette
Translation Memory-Systeme Déjà Vu von Atril EPTAS TM von ALPNET Technology http://www.epp.de/ SDLX von SDL Transit von STAR Translation Manager von IBM Translator's Workbench von Trados ZeresTrans von Zeres http://hermes.zeres.de/ TRANS Suite 2000 von Cypresoft http://www.cypresoft.com/
TM-Technologie in MÜ-Systemen Personal Translator Office plus 2001 (Linguatec) T1 (Langenscheidt)
Kommerzielle Produkte Systemeigenschaften: Terminologieverwaltung
Trados MultiTerm ‘95
http://www.trados.com / (Testversion für 30 Tage) Trados MultiTerm ’95 http://www.trados.com / (Testversion für 30 Tage) Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden Einträge können kreuzreferenziert werden Suche in beliebigen Sprachrichtungen möglich Suche mit Wildcards und Fuzzy Match
MultiTerm ’95 Fuzzy Searching
MultiTerm ’95 Einbinden graphischer Elemente
TermStar von Star
TermStar von Star Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden Einträge können kreuzreferenziert werden Suche in beliebigen Sprachrichtungen möglich Unterschiedliche Eintragsmodi verfügbar
Wahl verschiedener Layouts für die Bildschirmansicht möglich TermStar Kreuzreferenzen Wahl verschiedener Layouts für die Bildschirmansicht möglich
Integration grafischer Elemente TermStar Integration grafischer Elemente Kreuzreferenzen
Kommerzielle Produkte Systemeigenschaften: Retrieval im Referenzmaterial
Trados Translator's Workbench
Trados Translator's Workbench Workbench-Editor = Textverarbeitungsprogramm (MS Word oder Word Perfect) oder TagEditor, T-Tagger oder S-Tagger Bei Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit Einführung einer neuen Version: Trados 5
Trados Translator‘s Workbench Edition 3
Trados Translator‘s Workbench Edition 3
Trados Translator‘s Workbench Edition 3
Trados Translator‘s Workbench
Trados Translator‘s Workbench
TRADOS Translator‘s Workbench Term einfügen
Trados Translator‘s Workbench Konkordanzsuche
Trados Translator‘s Workbench
Trados Translator‘s Workbench
TransIt von Star Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen
Transit von Star
Transit von Star Anlegen eines Projektes Der Benutzer erhält Hilfestellung durch sogenannte Wizards (Programm-Assistenten).
Transit von Star Transit-Editor (Version 3.0) Fuzzy-Index Fenster Ziel-text- Fenster Notiz- Fenster Wörter-buch- Fenster
TransIt von Star Version 3
TransIt von Star Version 3
Transit von Star
SDLX von SDL SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien SDLX – Weiterentwicklung von Amptran SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen
SDLX — Version 2.0
SDLX Version 3.5
SDLX
SDLX
SDLX
SDLX Übernahme der Übersetzung eines Fuzzy-Matches Übernahme eines 100%-Matches
Déjà Vu Interactive von Atril Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet (Produktumfang, Anschaffungskosten) Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter
Déjà Vu Interactive Version 3.0.18
Déjà Vu Interactive Fuzziness Je niedriger der Wert ist, desto weniger Entsprechungen werden angezeigt. Mit dem Schieberegler lässt sich ein Wert im Bereich von 0 (nur genau übereinstimmende Entsprechungen) bis 9 wählen. Minimum number of words in a sentence Sätze mit weniger Wörtern werden in den Datenbanken von Déjà Vu nicht gespeichert. Mit dem Schieberegler kann ein Wert im Bereich von 1 bis 9 gewählt werden.
Déjà Vu Interactive „Vorübersetzung“
IBM — TranslationManager „Mutter“ aller TM-Systeme Von IBM zur Unterstützung der eigenen Lokalisierungs-bedürfnisse entwickelt Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing) Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungs-programme ausgeliefert wird In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich)
IBM — TranslationManager Filter MS Word WordPerfect Ami Pro HTML RTF Ventura Publisher Interleaf FrameBuilder BookMaster IPF (Information Presentation Facility) ASCII Alle Format- Informationen bleiben während der Übersetzung erhalten, so dass Original und Übersetzung das gleiche Layout haben.
IBM — TranslationManager Version 2.6.1 Übersetzungsvorschläge aus dem TM
IBM — TranslationManager copy & paste Aktives Segment
IBM — TranslationManager Übernahme eines Eintrags aus dem Wörterbuch mit Ctrl + a
IBM Translation Manager Nachschlagen im TM
IBM Translation Manager Globale Änderungen im TM
Vergleich der Retrievalleistung Referenzsatz This chapter is an introduction to X11 operations. Testsatz TWB TransIt SDLX DejaVu TManager This chapter is a brief introduction to X11 operations. 81 % 76 % 74 % 1 Chapter 2 is an introduction to X11 operations. 86 % 86 % 81 % 1 Chapter 2 of this manual is an introduction to X11 operations. 70 % 68 % 59 % 5 See the introduction to X11 operations. 53 % 44 % 48 % 5 X11 operations are introduced in this chapter. < 30 % 52 % 23 % 7 X11 is introduced in this chapter. < 30 % 44 % 23 % 7
Eigene Forschungen zum Retrieval in TMs Anreicherung des Referenzmaterials mit linguistischem Wissen durch Shallow Parsing. XML-basierter Ansatz zum linguistischen Retrieval im Translation-Memory. Berücksichtigung struktureller (Textebene) und syntaktischer Eigenschaften (Satzebene) von Texten. Retrievalergebnisse intuitiv plausibler.
Entscheidungshilfen für den Einsatz konkreter Systeme
Parameter zur Auswahl eines TM-Systems (I) „Whenever I want to buy a pair of shoes I try them on and consider whether I feel comfortable wearing them, and whether they fit my needs. I will buy different shoes for different purposes: playing professional football, walking, or staying at home. I draw the possible scenario for using my future shoes and I buy accordingly.“ [Celia Ross in: Language International 12/2000,36]
Parameter zur Auswahl eines TM-Systems (II) EAGLES-Arbeitsgruppe "Assessment and evaluation“ ISO-Norm 9126 Adäquatheits-Evaluation Benutzerprofil Aufgabenbereich Leistungsmerkmale des TM-Systems Prüf-/Qualitätskriterien: Funktionalität (functionality) Zuverlässigkeit (reliability) Brauchbarkeit (usability) Leistungsfähigkeit (efficiency) Wartbarkeit (maintainability) Portierbarkeit (portability)
Parameter zur Auswahl eines TM-Systems (III) Übersetzungsvolumen Textsorten Textsorten-Eigenschaften hinsichtlich Idiomatizität Terminologie Erfordernis von Konsistenz zwischen den Übersetzungen Dateiformate Sprachen bzw. Sprachpaare Benutzung anderer Übersetzungshilfen und Notwendigkeit, diese in das TM zu integrieren Einsatz in einem Team oder als Einzelarbeitsplatz Wiederverwendbarkeit von TM-Material in anderen Umgebungen Umfang der verfügbaren Zeit zum Erlernen eines neuen Werkzeugs
Parameter zur Auswahl eines TM-Systems Anschaffungskosten Trados Translator‘s Workbench http://www.Trados.com/ US$/EUR 595 zzgl. Versandkoten und MWSt TranIt von Star http://www.star-ag.ch/ Transit und TermStar Smart 3.0: EUR 695 DéjàVu von Atril http://www.atril.com/ EUR 841,50 zzgl. MwSt SDLX von SDL http://www.sdlintl.com/products/sdlx/nav/main.htm US$ 50 IBM Translation Manager http://www-4.ibm.com/software/ad/translat/tm/
Resümee Jedes der vorgestellten Translation-Memory-Systeme erfordert eine Einarbeitung, um sie effizienzsteigernd einzusetzen. Terminologie-Verwaltungssysteme bieten nennenswerte Erleichterung bei der Erstellung und Pflege von Terminologie. Sowohl Terminologie-Verwaltungssysteme als auch Transaltion-Memory-Systeme tragen zur Konsistenz der Übersetzungen bei. Für effiziente Auftragsbearbeitung gibt es bei großen Textmengen mit hohem Anteil an Wiederholungen zu TMs keine Alternative.
Vielen Dank für Ihre Aufmerksamkeit! Uta Seewald-Heeg seewald@heeg.de