Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre.

Ähnliche Präsentationen


Präsentation zum Thema: "Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre."—  Präsentation transkript:

1 Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre Zusammenarbeit in der Medieninformatik Kolloquium zu Ehren von Prof. Dr.-Ing. Detlef Klöditz Köthen, 22. November 2001

2 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

3 Lokalisierung Anpassung, d.h. Übersetzung eines Software-Produkts an einen lokalen Markt mit seinen sprachlichen und kulturellen Besonderheiten Sprachliche und kulturelle Anpassung von Web-Seiten

4 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

5 Lokalisierungsprozess (nach Microsoft)

6 Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen Internationalisierung (I18N) Globalisierung (G11N) –(Sprach-, Kultur- und Plattform- Unabhängigkeit von Produkten) Lokalisierung (L10N) Internationalisierung (I18N) Globalisierung (G11N) –(Sprach-, Kultur- und Plattform- Unabhängigkeit von Produkten) Lokalisierung (L10N)

7 Internationalisierung Bsp.: Sortierroutinen

8 Codierungssysteme Codepages Zuordnung von Byte-Werten auf Buchstaben eines Alphabets Byte-Werte (auch: Code-Points) sind Indizes in einer Codepage Bis zum Code 0x7F (127) werden Code-Points von allen Codepages auf die gleichen Buchstaben abgebildet (ASCII- 7-Bit-Zeichensatz) Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255) Codepages Zuordnung von Byte-Werten auf Buchstaben eines Alphabets Byte-Werte (auch: Code-Points) sind Indizes in einer Codepage Bis zum Code 0x7F (127) werden Code-Points von allen Codepages auf die gleichen Buchstaben abgebildet (ASCII- 7-Bit-Zeichensatz) Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255) Byte StringWindows Codepage 1252Windows Codepage 1253 Hex Dez (W. European) (Cyrillic) 0xD6 214 Ö Ц 0xFF 252 ü ь

9 encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Печатать' Cancel = 'Прерывание' Help = 'Помощь' tryAgain = 'Новая попытка' Icon = 'Пиктограмма' inspect = 'Исследовать' Action = 'Окно переключить' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Печатать' Cancel = 'Прерывание' Help = 'Помощь' tryAgain = 'Новая попытка' Icon = 'Пиктограмма' inspect = 'Исследовать' Action = 'Окно переключить' Locales (Variablen mit sprach- bzw. marktabhängig unterschiedlichen Werten) Zeichenketten Datumsformate Kalender, Zeitformate Währungsformate Maßeinheiten Grafiken Farben Schreibstile Produktverpackung Zeichenketten Datumsformate Kalender, Zeitformate Währungsformate Maßeinheiten Grafiken Farben Schreibstile Produktverpackung encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Drucken' Cancel = 'Abbruch' Help = 'Hilfe' tryAgain = 'Neuer Versuch' Icon = 'Ikone' inspect = 'Untersuchen' Action = 'Fenster umschalten' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Drucken' Cancel = 'Abbruch' Help = 'Hilfe' tryAgain = 'Neuer Versuch' Icon = 'Ikone' inspect = 'Untersuchen' Action = 'Fenster umschalten' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Print' Cancel = 'Cancel' Help = 'Help' tryAgain = 'Retry' Icon = 'Button' inspect = 'Inspect' Action = 'Switch Window' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Print' Cancel = 'Cancel' Help = 'Help' tryAgain = 'Retry' Icon = 'Button' inspect = 'Inspect' Action = 'Switch Window' VisualWorks 5.i

10 Datumsformate 22. November /11/ /22/2001 November 22, November /11/ novembre November /11/ /22/2001 November 22, November /11/ novembre 2001 Deutsch EU Amerikanisch Französisch

11 Feldlängen !

12 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

13 Kompetenz beim Einsatz von Lokalisierungswerkzeugen Maschinelle Übersetzungssysteme Translation-Memory-Systeme Programme zur Bearbeitung von Online-Hilfen Programme zur Lokalisierung von Software-Quelldateien

14 Kompetenz beim Einsatz von Lokalisierungswerkzeugen Kulturkompetenz Textsortenkompetenz IT-Kompetenz Kulturkompetenz Textsortenkompetenz IT-Kompetenz

15 Kulturkompetenz Laufschrift von links nach rechts laufend Navigationsleiste Datumsangaben

16 Textsortenkompetenz Textsorten –Handbücher –Online-Hilfe-Texte (i.d.R. HTML-Dateien) –Benutzerschnittstelle (Menüs, Benutzerdialoge, Schaltflächen, Fensterinhalte, Icons) –Fehlermeldungen –Schulungsmaterial –Lizenzverträge Textsorteneigenschaften Technische Realisierung, Formate Textsorten –Handbücher –Online-Hilfe-Texte (i.d.R. HTML-Dateien) –Benutzerschnittstelle (Menüs, Benutzerdialoge, Schaltflächen, Fensterinhalte, Icons) –Fehlermeldungen –Schulungsmaterial –Lizenzverträge Textsorteneigenschaften Technische Realisierung, Formate

17 Benutzerschnittstelle Interne Repräsentation von Textelementen Menü in einemEntsprechung in der Quelldatei Windows-Programm(Resource File) 6 MENU FIXED IMPURE BEGIN POPUP "&DATEI" BEGIN MENUITEM "&NEU...\tSTRG+N" MENUITEM "Ö&ffnen...\tSTRG+O" MENUITEM "S&chließen" MENUITEM SEPARATOR MENUITEM "S&peichern\tSTRG+S" MENUITEM "&Speichern &unter..." MENUITEM "Als Websei&te speichern..." MENUITEM "Pac&k & Go..." MENUITEM SEPARATOR MENUITEM "&Webseitenvorschau" MENUITEM SEPARATOR MENUITEM "Seite einr&ichten"

18 Tastenkombinationen

19 IT-Kompetenz Aufbau und Funktionsweise von Lokalisierungswerkzeugen PASSOLO erkennt typische Lokalisierungs- fehler wie abgeschnittene Beschriftungen von Schaltflächen

20 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

21 Entwicklung des Lokalisierungswerkzeugs Web-TCM Web-TCM: Web Translation & Content Management Kooperationsprojekt –Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen) –Firma Georg Heeg Web-TCM: Web Translation & Content Management Kooperationsprojekt –Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen) –Firma Georg Heeg Web-TCM

22 Smalltalk Programmier- werkzeug des Web-TCM

23 Web Translation & Content Management Web Translation –Lokalisieren, Übersetzen Content Management –Verwalten von Inhalten bzw. Änderungen auf einer WWW-Seite (in einer beliebigen Sprache) Web Translation –Lokalisieren, Übersetzen Content Management –Verwalten von Inhalten bzw. Änderungen auf einer WWW-Seite (in einer beliebigen Sprache) Web-TCM

24 Fachübersetzen... Fachübersetzen Extraktion der Textblöcke Nummerierung der Textblöcke Segmentierung n n Deutsch Fachübersetzen English Français Traduction specialisée Русский технический перевод HTML-Seite mit Zugriffsfunktion über die Nummern der Textblöcke Memory Web-TCM

25 Memory (TM) Nr.DEENFRRU 1 Sprachelanguagelangueязык 2 Fachüber- setzen Traduction spécialisée 3.. n HTML-Seite mit Zugriffsfunktion über die Nummern der Textblöcke... Sprachparameter (lang=de) in der URL defr Web-TCM

26 Fachübersetzen Fachübersetzen Traduction spécialisée Traduction spécialisée Fachübersetzen Traduction spécialisée FachübersetzenTraduction spécialisée Web-TCM

27 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. Web-TCM

28 XHTML Fachübersetzen... Fachübersetzen... Web-TCM

29 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM- Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM Web-TCM

30 SSP Smalltalk Server Pages <%lang := request anyParameterValueAt: 'lang'. tm := Heeg.Translator.TM new: lang.%> <%lang := request anyParameterValueAt: 'lang'. tm := Heeg.Translator.TM new: lang.%> Web-TCM

31 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM- Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM 4.Resegmentieren Web-TCM

32

33

34

35

36

37 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM-Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM 4.Resegmentieren 5.Übersetzen –Translation Memory in allen Zielsprachen Web-TCM

38

39

40

41

42

43

44 Export in kommerzielle TM-Systeme TMX-Austauschformat

Sprach- und Sachfachangebot Languages and application domains Langues et disciplines spécialisées Языка и дисципл ина... Sprach- und Sachfachangebot Languages and application domains Langues et disciplines spécialisées Языка и дисципл ина...

45 Entwicklungsaufwand Zwei Arbeitswochen Interaktive Weiterentwicklung während der Nutzung Zwei Arbeitswochen Interaktive Weiterentwicklung während der Nutzung Web-TCMROBUST

46 Web-TCM Vergleich mit kommerziellen TM-basierten Lokalisierungswerkzeugen Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstützt Bei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer Passwort-geschützter Zugang https (http mit Verschlüsselung) Kombiniert Translation-Memory-Technologie mit Content- Management Unterstützt Export in kommerzielle TM-Systeme (TMX-Austauschformat) Unterstützt Export statischer Web-Seiten in allen verfügbaren Sprachen Erstes Lokalisierungswerkzeug, das virtuelle Team-Arbeit real unterstützt Bei verfügbaren kommerziellen Systemen müssen TMs importiert bzw. exportiert werden und erfordern immer einen Abgleich der TMs verschiedener Übersetzer Passwort-geschützter Zugang https (http mit Verschlüsselung) Kombiniert Translation-Memory-Technologie mit Content- Management Unterstützt Export in kommerzielle TM-Systeme (TMX-Austauschformat) Unterstützt Export statischer Web-Seiten in allen verfügbaren Sprachen

47 Kompetenz für das Lokalisierungsprojekt und den Einsatz von Web-TCM Sprachdatenverarbeitung Grundlagen der Lokalisierungstechnologie Codierungssysteme Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM Dynamische Web-Seiten, HTML, XML Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R) –Projektorganisation Projektmanager Übersetzungsteams Proofreading, Qualitätskontrolle –Arbeitsschritte Extraktion von Textelementen aus Grafiken Vorbereitung der Terminologie Übersetzung der Webseiten Proofreading Übergabe Lokalisierungswerkzeug (Web-TCM) Codierungssysteme Lokalisierung von Schulungsmaterial (Text und Grafik) mit TM Dynamische Web-Seiten, HTML, XML Lokalisierungsprojekt: Web-Site-Lokalisierung (D E, F, R) –Projektorganisation Projektmanager Übersetzungsteams Proofreading, Qualitätskontrolle –Arbeitsschritte Extraktion von Textelementen aus Grafiken Vorbereitung der Terminologie Übersetzung der Webseiten Proofreading Übergabe Lokalisierungswerkzeug (Web-TCM) SS 2001

48 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

49 Resümee Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen: –Informatik –Computerlinguistik –Sprachmittlung, Fachsprachen Einrichtung der Vertiefungsrichtung Softwarelokalisierung im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend Sowohl Entwicklung als auch Einsatz von Lokalisierungswerkzeugen erfordern Kompetenzen aus den drei Bereichen: –Informatik –Computerlinguistik –Sprachmittlung, Fachsprachen Einrichtung der Vertiefungsrichtung Softwarelokalisierung im Diplomstudiengang Fachübersetzen am Fachbereich Informatik trägt dieser Interdisziplinarität Rechnung FB Informatik der HS Anhalt (FH) damit in der Hochschulausbildung wegweisend


Herunterladen ppt "Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre."

Ähnliche Präsentationen


Google-Anzeigen