Translation-Memory-Technologie: Konzepte, ihre Realisierungen in kommerziellen Produkten und Entscheidungshilfen für den Einsatz konkreter Systeme.

Slides:



Advertisements
Ähnliche Präsentationen
Web-Content-Management-Systeme
Advertisements

RefWorks in 15 Minuten.
Highlights der neuen Version
Prüfungspläne Bachelor-Thesis
Agenda Visio 2003 – ein Tool stellt sich vor
PADLR Submodul Modular Content Archives Ein Content Browser für Lehr- materialien aus der Elektrotechnik Dipl.-Ing. Mark Painter Institut für Nachrichtentechnik.
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
DEPARTMENT FÜR INFORMATIK
Datenbankzugriff im WWW (Kommerzielle Systeme)
Fiery Command WorkStation 5
Konzeption und Realisierung eines Text- Analysesystems zur Automatisierung der Bewerberauswahl von diesem Datenformat jede beliebige Anwendung adaptieren.
Intranet-Portal mit Microsoft SharePoint Portal Server
HTML - Einführung Richard Göbel.
Java: Grundlagen der Sprache
Internetstruktur Das Internet besteht aus vielen Computern, die weltweit untereinander vernetzt sind.
Eine Einführung in OpenOffice. Was? Freies Office-Paket mit offenem Quellcode Erste funktionierende Version im Oktober 2001 veröffentlicht Basiert auf.
Integrierte Übersetzungsprozesse
Text-Retrieval mit Oracle Vortrag von Andreas Mück & David Diestel.
SYSTRAN Information and translation technologies.
Computergestützte Übersetzung
Access 2000 Datenbanken.
Concurrent Versions System
Elektronische Werkzeuge für den Übersetzer – Ein Überblick – Uta Seewald-Heeg — Hochschule Anhalt ATICOM Dortmund, 18. März Typen elektronischer.
Einführung und Überblick
Die Bank von morgen - eine neue Welt für IT und Kunden? 23. Oktober 2001.
Translation–Memory–Systeme in der Softwarelokalisierung
Ausbildung in Softwarelokalisierung
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
PHProjekt – eine open source Projektmanagementsoftware
Erweiterung von EMF Refactor um Update Funktionalität in grafischen Editoren Thorsten Arendt, AG Taentzer, SWT FoPra-Vorstellung, 19. April 2012.
Computergestützte Übersetzung und Terminologieverwaltung
SOFTWARE.
Fotobuch: Case Study informare Consulting GmbH
Michael Haverbeck System Engineer
Internet und Intranet im Krankenhaus
Neue Module und weitere Entwicklung in uniLIME Gerald Schuster, Advanced Technical Software, Wien.
Warum brauche ich ein CMS – Content Management System?
Das fachkommunikative Dreierlei
Content Management ist ein Prozess und umfasst die Erstellung, Verwaltung und kontrollierte Veröffentlichung von Inhalten. Content-Management- Systeme.
Proseminar: „Webtechnologien für Ecommerce“
Hardware / Software Codesign Hardware versus Software.
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
Aktuelle Produktstände – TRIBASE
Wasserfallmodell und Einzelbegriffe
Liske Informationsmanagementsysteme 2005 Informationen managen Strategisches Kalkül und technische Wirksamkeit.
Freiwillige Feuerwehr der Stadt Perg
PRO:CONTROL Ziel des Moduls Arbeitspakete
Oliver Spritzendorfer Thomas Fekete
Using latent semantic analysis to find different names for the same entity in free text Präsentation und Diskussion des Papers Im Rahmen des PS Web-Information.
Quellen: Internet INTRANET Ausarbeitung von Sven Strasser und Sascha Aufderheide im Modul Netzwerktechnik, Klasse INBS Mai 2003.
CMS Content-Management-Systeme (CMS), dienen der Verwaltung und Pflege von Dokumenten und Inhalten in Inter- und Intranetanwendungen. Den Entwickler oder.
xRM1 Pilot Implementierung
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Bfu – Beratungsstelle für Unfallverhütung Transit NXT von STAR in der bfu Feierabendgespräch Tecom, 11. Juni 2014, Bern Antonio Cifelli, Übersetzer
28. Oktober 2009Autor: Walter Leuenberger Computeria Urdorf Treff vom 28. Oktober 2009 Arbeiten mit Vorlagen (in Word, Excel, usw.)
->Prinzip ->Systeme ->Peer – to – Peer
Einfaches Erstellen von Präsentationen aus Einzelfolien heraus.
MareNet Ein neuer elektronischer Informationsdienst für die Meeresforschung IuK Trier, 12. März 2001 Michael Hohlfeld Institute for Science Networking.
Bern University of Applied Sciences Engineering and Information Technology Documentation generator for XML-based description standards Ausgangslage: Die.
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
1 Wolfgang Wiese, Regionales RechenZentrum Erlangen WCMS 3. August 2000 Wolfgang Wiese RRZE / Lehrstuhl für Informatik VII
Udoka Ogbue Technische Universität Dresden
Seminararbeit Release Management von Web-Systemen Minh Tran Lehrstuhl für Software Engineering RWTH Aachen
Comprehensive Information Base (CIB) – ein Prototyp zur semantischen Datenintegration Stefan Arts
Making Global Knowledge Leaders Thomas Kemmann, PROMATIS AG Oracle eBusiness Suite Datenübernahme.
„Warum ist Sia translations das Richtige für mich?“ „Warum ist Sia translations das Richtige für mich?“ Was bekommen Sie automatisch von uns? KKostenlose.
Firmenpräsentation Incite GmbH.
Konzepte von Terminologie-Datenbanken
Vergleich von Terminologie-Datenbanksystemen
 Präsentation transkript:

Translation-Memory-Technologie: Konzepte, ihre Realisierungen in kommerziellen Produkten und Entscheidungshilfen für den Einsatz konkreter Systeme Uta Seewald-Heeg — Hochschule Anhalt (FH) EQUIVALENCES 01 Neuenburg, 19. Mai 2001

Translation-Memory-Technologie Konzepte der Translation-Memory-Technologie Recycling bestehender Übersetzungen Komponenten von Translation-Memory-Systemen Kommerzielle Produkte Produktpalette Systemeigenschaften Terminologieverwaltung Retrieval im Referenzmaterial 3 Entscheidungshilfen für den Einsatz konkreter Systeme

Konzepte der Translation-Memory-Technologie Recycling bestehender Übersetzungen

Traditioneller Übersetzungsprozess Quelltext- Dokument 1 Zieltext- Dokument 1 Übersetzen Nachschlagen/Recherchieren von Terminologie In Wörterbüchern In Terminologiedatenbanken Auf WWW-Seiten Suchen bereits erstellter Übersetzungen Im Ablagesystem Auf Disketten Im Dateisystem des Computers Zieltext- Dokument 2 Quelltext- Dokument 2 . . Quelltext- Dokument n Zieltext- Dokument n

Recycling bestehender Übersetzungen Übersetzungsprozess mit Translation Memory Quelltext- Dokument Zieltext- Dokument Pre-processing Extraktion der Formatinformation Abgleich der Quelltext-Sätze mit dem Referenzmaterial (Matches) Post-processing Zusammenführen der übersetzten Sätze mit der Formatinformation Speichern der Satzpaare im TM Übersetzen Überprüfen der Matches

Konzepte der Translation-Memory-Technologie Komponenten von Translation-Memory-Systemen

Translation Memory (TM) Übersetzungsspeicher CAT Multilinguales Text-/Satzarchiv Synchronisierte quellsprachige und übersetzte Textsegmente (Sätze), die als Referenzmaterial dienen Retrieval erfolgt in der Regel mit fuzzy logic

Komponenten von Translation-Memory-Systemen 3 Text-/ Dokumenten- programm 4 Alignment- programm 1 Datenbank- Verwaltungs- programm 2 Terminologie- programm 5 Import-/ Export- Filter

1 Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren Datenbank- Verwaltungs- programm Morphologische Analyse Linguistisches Tagging Suche nach gespeicherten Übersetzungen mit Fuzzy-Match-Verfahren Perfect Match: Segment im zu übersetzenden Dokument und im TM stimmen zu 100 % überein Full Match: Das Segment im zu übersetzenden Dokument und im TM stimmen bis auf Ersetzungsklassen wie Zahlen, Monatsnamen überein Fuzzy Match: Textsegmente, die Abweichung zum zu übersetzenden Segment aufweisen Eingriff bei Fehlern oder globalen terminologischen Änderungen an Satzpaaren

2 Möglichkeit des Imports elektronisch gespeicherter Glossare Morphologische Analyse Eintragsmodelle TM-Schnittstelle Workflow 2 Terminologie- programm Möglichkeit des Imports elektronisch gespeicherter Glossare Translation Manager (IBM) wird mit Terminologie-Wörterbuch ausgeliefert, andere Firmen (Trados, Star) bieten Terminologie-Wörterbücher zusätzlich an einige Programme sind sehr komplex (Fuzzy-Match-Algorithmen ermöglichen Suche nach Wörtern mit derselben Wurzel) Möglichkeit, nach einzelnen Wörtern im TM zu suchen (in den meisten Programmen)

3 Programm, in dem die Übersetzung angefertigt wird Text-/ Dokumenten- programm Programm, in dem die Übersetzung angefertigt wird häufig: 2 parallel angeordnete Fenster (AT - ZT) oft: 1 weiteres Fenster, das Einheiten des TM anzeigt meistens: Fenster des Terminologieprogramms z.T. recht primitive Textverarbeitungsmöglichkeiten, einige Programme erlauben nur „copy and paste“, andere volle Formatierungsmöglichkeiten

4 Alignment- programm Möglichkeit, bestehende Texte und Übersetzungen in die Datenbank einzulesen Texte werden in Segmente (meist Sätze) zerlegt Zuordnung von Textstellen (Sätzen) durch Verwendung von statistischen und/oder inhaltlichen Kriterien Nachbearbeitung in der Regel erforderlich große Unterschiede zwischen den angebotenen Programmen Star Transit: stark automatisiert (zeitsparend) Trados WinAlign: halbautomatisch; mit graphischer Alignierfunktion; ermöglicht, Alignment-Probleme schnell und einfach zu beheben in der Regel: zusätzliche Kosten bei der Anschaffung

5 Import-/ Export- Filter Einige Programme sind mit einer reichen Auswahl an Filtern ausgestattet (Déjà Vu, SDLX, IBM) Andere Programme bieten Filter zu Aufpreis an (Star Transit, Trados TWB) Alle Programme sind standardmäßig mit einem Filter für MS Word ausgestattet

Eignung von Translation-Memory-Systemen Texte liegen maschinenlesbar vor Große Textmengen mit hohem Anteil an Wiederholungen (Sätze, syntaktische Strukturen, Terminologie) innerhalb eines Textes sowie relativ zum vorhandenen Referenzmaterial Umfangreiche Terminologie Sicherstellen der terminologischen Konsistenz Wenige große Kunden (schnellere Amortisierung)

Kommerzielle Produkte Produktpalette

Translation Memory-Systeme Déjà Vu von Atril EPTAS TM von ALPNET Technology http://www.epp.de/ SDLX von SDL Transit von STAR Translation Manager von IBM Translator's Workbench von Trados ZeresTrans von Zeres http://hermes.zeres.de/ TRANS Suite 2000 von Cypresoft http://www.cypresoft.com/

TM-Technologie in MÜ-Systemen Personal Translator Office plus 2001 (Linguatec) T1 (Langenscheidt)

Kommerzielle Produkte Systemeigenschaften: Terminologieverwaltung

Trados MultiTerm ‘95

http://www.trados.com / (Testversion für 30 Tage) Trados MultiTerm ’95 http://www.trados.com / (Testversion für 30 Tage) Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden Einträge können kreuzreferenziert werden Suche in beliebigen Sprachrichtungen möglich Suche mit Wildcards und Fuzzy Match

MultiTerm ’95 Fuzzy Searching

MultiTerm ’95 Einbinden graphischer Elemente

TermStar von Star

TermStar von Star Zu einem Terminus bzw. einem Konzept können bis zu 20 zielsprachige Äquivalente eingetragen werden Einträge können kreuzreferenziert werden Suche in beliebigen Sprachrichtungen möglich Unterschiedliche Eintragsmodi verfügbar

Wahl verschiedener Layouts für die Bildschirmansicht möglich TermStar Kreuzreferenzen Wahl verschiedener Layouts für die Bildschirmansicht möglich

Integration grafischer Elemente TermStar Integration grafischer Elemente Kreuzreferenzen

Kommerzielle Produkte Systemeigenschaften: Retrieval im Referenzmaterial

Trados Translator's Workbench

Trados Translator's Workbench Workbench-Editor = Textverarbeitungsprogramm (MS Word oder Word Perfect) oder TagEditor, T-Tagger oder S-Tagger Bei Intergartion in Textverarbeitung hohe Benutzerfreundlichkeit Einführung einer neuen Version: Trados 5

Trados Translator‘s Workbench Edition 3

Trados Translator‘s Workbench Edition 3

Trados Translator‘s Workbench Edition 3

Trados Translator‘s Workbench

Trados Translator‘s Workbench

TRADOS Translator‘s Workbench Term einfügen

Trados Translator‘s Workbench Konkordanzsuche

Trados Translator‘s Workbench

Trados Translator‘s Workbench

TransIt von Star Translation Memory von Star basiert nicht auf einer Datenbank, sondern auf einem sogenannten Assoziativen Netzwerk Ermöglicht sehr schnellen Zugriff und Laufzeit auch bei großen Datenmengen

Transit von Star

Transit von Star Anlegen eines Projektes Der Benutzer erhält Hilfestellung durch sogenannte Wizards (Programm-Assistenten).

Transit von Star Transit-Editor (Version 3.0) Fuzzy-Index Fenster Ziel-text- Fenster Notiz- Fenster Wörter-buch- Fenster

TransIt von Star Version 3

TransIt von Star Version 3

Transit von Star

SDLX von SDL SDL – eines der grössten Lokalisierungsunternehmen in Groß Britannien SDLX – Weiterentwicklung von Amptran SDLX setzt sich aus einer Reihe von Einzelprogrammen zusammen

SDLX — Version 2.0

SDLX Version 3.5

SDLX

SDLX

SDLX

SDLX Übernahme der Übersetzung eines Fuzzy-Matches Übernahme eines 100%-Matches

Déjà Vu Interactive von Atril Déjà Vu vor allem bei freiberuflich tätigen Übersetzern verbreitet (Produktumfang, Anschaffungskosten) Umfasst eigenes Alignment-Werkzeug, Terminologie-Programm, Wörterbücher zur Rechtschreibprüfung und Dokumentenfilter

Déjà Vu Interactive Version 3.0.18

Déjà Vu Interactive Fuzziness Je niedriger der Wert ist, desto weniger Entsprechungen werden angezeigt. Mit dem Schieberegler lässt sich ein Wert im Bereich von 0 (nur genau übereinstimmende Entsprechungen) bis 9 wählen. Minimum number of words in a sentence Sätze mit weniger Wörtern werden in den Datenbanken von Déjà Vu nicht gespeichert. Mit dem Schieberegler kann ein Wert im Bereich von 1 bis 9 gewählt werden.

Déjà Vu Interactive „Vorübersetzung“

IBM — TranslationManager „Mutter“ aller TM-Systeme Von IBM zur Unterstützung der eigenen Lokalisierungs-bedürfnisse entwickelt Hat seine anfängliche Position als Marktführer verloren (langsame Entwicklung, wenig Marketing) Einziges Programm, das mit Alignment-Tool, erweiterbarem Wörterbuch und Filtern für die gängigsten Textverarbeitungs-programme ausgeliefert wird In mancher Hinsicht das einfachste Programm, allerdings ohne besonderes Interface (nicht sehr benutzerfreundlich)

IBM — TranslationManager Filter MS Word WordPerfect Ami Pro HTML RTF Ventura Publisher Interleaf FrameBuilder BookMaster IPF (Information Presentation Facility) ASCII Alle Format- Informationen bleiben während der Übersetzung erhalten, so dass Original und Übersetzung das gleiche Layout haben.

IBM — TranslationManager Version 2.6.1 Übersetzungsvorschläge aus dem TM

IBM — TranslationManager copy & paste Aktives Segment

IBM — TranslationManager Übernahme eines Eintrags aus dem Wörterbuch mit Ctrl + a

IBM Translation Manager Nachschlagen im TM

IBM Translation Manager Globale Änderungen im TM

Vergleich der Retrievalleistung Referenzsatz This chapter is an introduction to X11 operations. Testsatz TWB TransIt SDLX DejaVu TManager This chapter is a brief introduction to X11 operations. 81 % 76 % 74 % 1 Chapter 2 is an introduction to X11 operations. 86 % 86 % 81 % 1 Chapter 2 of this manual is an introduction to X11 operations. 70 % 68 % 59 % 5 See the introduction to X11 operations. 53 % 44 % 48 % 5 X11 operations are introduced in this chapter. < 30 % 52 % 23 % 7 X11 is introduced in this chapter. < 30 % 44 % 23 % 7

Eigene Forschungen zum Retrieval in TMs Anreicherung des Referenzmaterials mit linguistischem Wissen durch Shallow Parsing. XML-basierter Ansatz zum linguistischen Retrieval im Translation-Memory. Berücksichtigung struktureller (Textebene) und syntaktischer Eigenschaften (Satzebene) von Texten. Retrievalergebnisse intuitiv plausibler.

Entscheidungshilfen für den Einsatz konkreter Systeme

Parameter zur Auswahl eines TM-Systems (I) „Whenever I want to buy a pair of shoes I try them on and consider whether I feel comfortable wearing them, and whether they fit my needs. I will buy different shoes for different purposes: playing professional football, walking, or staying at home. I draw the possible scenario for using my future shoes and I buy accordingly.“ [Celia Ross in: Language International 12/2000,36]

Parameter zur Auswahl eines TM-Systems (II) EAGLES-Arbeitsgruppe "Assessment and evaluation“ ISO-Norm 9126 Adäquatheits-Evaluation Benutzerprofil Aufgabenbereich Leistungsmerkmale des TM-Systems Prüf-/Qualitätskriterien: Funktionalität (functionality) Zuverlässigkeit (reliability) Brauchbarkeit (usability) Leistungsfähigkeit (efficiency) Wartbarkeit (maintainability) Portierbarkeit (portability)

Parameter zur Auswahl eines TM-Systems (III) Übersetzungsvolumen Textsorten Textsorten-Eigenschaften hinsichtlich Idiomatizität Terminologie Erfordernis von Konsistenz zwischen den Übersetzungen Dateiformate Sprachen bzw. Sprachpaare Benutzung anderer Übersetzungshilfen und Notwendigkeit, diese in das TM zu integrieren Einsatz in einem Team oder als Einzelarbeitsplatz Wiederverwendbarkeit von TM-Material in anderen Umgebungen Umfang der verfügbaren Zeit zum Erlernen eines neuen Werkzeugs

Parameter zur Auswahl eines TM-Systems Anschaffungskosten Trados Translator‘s Workbench http://www.Trados.com/ US$/EUR 595 zzgl. Versandkoten und MWSt TranIt von Star http://www.star-ag.ch/ Transit und TermStar Smart 3.0: EUR 695 DéjàVu von Atril http://www.atril.com/ EUR 841,50 zzgl. MwSt SDLX von SDL http://www.sdlintl.com/products/sdlx/nav/main.htm US$ 50 IBM Translation Manager http://www-4.ibm.com/software/ad/translat/tm/

Resümee Jedes der vorgestellten Translation-Memory-Systeme erfordert eine Einarbeitung, um sie effizienzsteigernd einzusetzen. Terminologie-Verwaltungssysteme bieten nennenswerte Erleichterung bei der Erstellung und Pflege von Terminologie. Sowohl Terminologie-Verwaltungssysteme als auch Transaltion-Memory-Systeme tragen zur Konsistenz der Übersetzungen bei. Für effiziente Auftragsbearbeitung gibt es bei großen Textmengen mit hohem Anteil an Wiederholungen zu TMs keine Alternative.

Vielen Dank für Ihre Aufmerksamkeit! Uta Seewald-Heeg seewald@heeg.de