Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre.

Ähnliche Präsentationen


Präsentation zum Thema: "Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre."—  Präsentation transkript:

1 Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre Zusammenarbeit in der Medieninformatik Kolloquium zu Ehren von Prof. Dr.-Ing. Detlef Klöditz Köthen, 22. November 2001

2 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

3 Lokalisierung Anpassung, d.h. Übersetzung eines Software-Produkts an einen lokalen Markt mit seinen sprachlichen und kulturellen Besonderheiten Sprachliche und kulturelle Anpassung von Web-Seiten

4 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

5 Lokalisierungsprozess (nach Microsoft)

6 Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen Internationalisierung (I18N) Globalisierung (G11N) –(Sprach-, Kultur- und Plattform- Unabhängigkeit von Produkten) Lokalisierung (L10N) Internationalisierung (I18N) Globalisierung (G11N) –(Sprach-, Kultur- und Plattform- Unabhängigkeit von Produkten) Lokalisierung (L10N)

7 Internationalisierung Bsp.: Sortierroutinen

8 Codierungssysteme Codepages Zuordnung von Byte-Werten auf Buchstaben eines Alphabets Byte-Werte (auch: Code-Points) sind Indizes in einer Codepage Bis zum Code 0x7F (127) werden Code-Points von allen Codepages auf die gleichen Buchstaben abgebildet (ASCII- 7-Bit-Zeichensatz) Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255) Codepages Zuordnung von Byte-Werten auf Buchstaben eines Alphabets Byte-Werte (auch: Code-Points) sind Indizes in einer Codepage Bis zum Code 0x7F (127) werden Code-Points von allen Codepages auf die gleichen Buchstaben abgebildet (ASCII- 7-Bit-Zeichensatz) Unterscheidung in der Zuordnung der Buchstaben für Codes zwischen 0x80 (128) und 0xFF (255) Byte StringWindows Codepage 1252Windows Codepage 1253 Hex Dez (W. European) (Cyrillic) 0xD6 214 Ö Ц 0xFF 252 ü ь

9 encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Печатать' Cancel = 'Прерывание' Help = 'Помощь' tryAgain = 'Новая попытка' Icon = 'Пиктограмма' inspect = 'Исследовать' Action = 'Окно переключить' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Печатать' Cancel = 'Прерывание' Help = 'Помощь' tryAgain = 'Новая попытка' Icon = 'Пиктограмма' inspect = 'Исследовать' Action = 'Окно переключить' Locales (Variablen mit sprach- bzw. marktabhängig unterschiedlichen Werten) Zeichenketten Datumsformate Kalender, Zeitformate Währungsformate Maßeinheiten Grafiken Farben Schreibstile Produktverpackung Zeichenketten Datumsformate Kalender, Zeitformate Währungsformate Maßeinheiten Grafiken Farben Schreibstile Produktverpackung encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Drucken' Cancel = 'Abbruch' Help = 'Hilfe' tryAgain = 'Neuer Versuch' Icon = 'Ikone' inspect = 'Untersuchen' Action = 'Fenster umschalten' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Drucken' Cancel = 'Abbruch' Help = 'Hilfe' tryAgain = 'Neuer Versuch' Icon = 'Ikone' inspect = 'Untersuchen' Action = 'Fenster umschalten' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Print' Cancel = 'Cancel' Help = 'Help' tryAgain = 'Retry' Icon = 'Button' inspect = 'Inspect' Action = 'Switch Window' encoding: #UTF_8 catalog: #labels cacheSize: 113 Hardcopy = 'Print' Cancel = 'Cancel' Help = 'Help' tryAgain = 'Retry' Icon = 'Button' inspect = 'Inspect' Action = 'Switch Window' VisualWorks 5.i

10 Datumsformate 22. November /11/ /22/2001 November 22, November /11/ novembre November /11/ /22/2001 November 22, November /11/ novembre 2001 Deutsch EU Amerikanisch Französisch

11 Feldlängen !

12 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

13 Kompetenz beim Einsatz von Lokalisierungswerkzeugen Maschinelle Übersetzungssysteme Translation-Memory-Systeme Programme zur Bearbeitung von Online-Hilfen Programme zur Lokalisierung von Software-Quelldateien

14 Kompetenz beim Einsatz von Lokalisierungswerkzeugen Kulturkompetenz Textsortenkompetenz IT-Kompetenz Kulturkompetenz Textsortenkompetenz IT-Kompetenz

15 Kulturkompetenz Laufschrift von links nach rechts laufend Navigationsleiste Datumsangaben

16 Textsortenkompetenz Textsorten –Handbücher –Online-Hilfe-Texte (i.d.R. HTML-Dateien) –Benutzerschnittstelle (Menüs, Benutzerdialoge, Schaltflächen, Fensterinhalte, Icons) –Fehlermeldungen –Schulungsmaterial –Lizenzverträge Textsorteneigenschaften Technische Realisierung, Formate Textsorten –Handbücher –Online-Hilfe-Texte (i.d.R. HTML-Dateien) –Benutzerschnittstelle (Menüs, Benutzerdialoge, Schaltflächen, Fensterinhalte, Icons) –Fehlermeldungen –Schulungsmaterial –Lizenzverträge Textsorteneigenschaften Technische Realisierung, Formate

17 Benutzerschnittstelle Interne Repräsentation von Textelementen Menü in einemEntsprechung in der Quelldatei Windows-Programm(Resource File) 6 MENU FIXED IMPURE BEGIN POPUP "&DATEI" BEGIN MENUITEM "&NEU...\tSTRG+N" MENUITEM "Ö&ffnen...\tSTRG+O" MENUITEM "S&chließen" MENUITEM SEPARATOR MENUITEM "S&peichern\tSTRG+S" MENUITEM "&Speichern &unter..." MENUITEM "Als Websei&te speichern..." MENUITEM "Pac&k & Go..." MENUITEM SEPARATOR MENUITEM "&Webseitenvorschau" MENUITEM SEPARATOR MENUITEM "Seite einr&ichten"

18 Tastenkombinationen

19 IT-Kompetenz Aufbau und Funktionsweise von Lokalisierungswerkzeugen PASSOLO erkennt typische Lokalisierungs- fehler wie abgeschnittene Beschriftungen von Schaltflächen

20 Entwicklung und Einsatz von Lokalisierungswerkzeugen 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee 1.Lokalisierung 2.Kompetenzen bei der Entwicklung von Software und Lokalisierungswerkzeugen 3.Kompetenzen beim Einsatz von Lokalisierungswerkzeugen 4.Entwicklung des Lokalisierungswerkzeugs Web-TCM 5.Resümee

21 Entwicklung des Lokalisierungswerkzeugs Web-TCM Web-TCM: Web Translation & Content Management Kooperationsprojekt –Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen) –Firma Georg Heeg Web-TCM: Web Translation & Content Management Kooperationsprojekt –Fachbereich Informatik der Hochschule Anhalt (Studiengang Fachübersetzen) –Firma Georg Heeg Web-TCM

22 Smalltalk Programmier- werkzeug des Web-TCM

23 Web Translation & Content Management Web Translation –Lokalisieren, Übersetzen Content Management –Verwalten von Inhalten bzw. Änderungen auf einer WWW-Seite (in einer beliebigen Sprache) Web Translation –Lokalisieren, Übersetzen Content Management –Verwalten von Inhalten bzw. Änderungen auf einer WWW-Seite (in einer beliebigen Sprache) Web-TCM

24 Fachübersetzen... Fachübersetzen Extraktion der Textblöcke Nummerierung der Textblöcke Segmentierung n n Deutsch Fachübersetzen English Français Traduction specialisée Русский технический перевод HTML-Seite mit Zugriffsfunktion über die Nummern der Textblöcke Memory Web-TCM

25 Memory (TM) Nr.DEENFRRU 1 Sprachelanguagelangueязык 2 Fachüber- setzen Traduction spécialisée 3.. n HTML-Seite mit Zugriffsfunktion über die Nummern der Textblöcke... Sprachparameter (lang=de) in der URL defr Web-TCM

26 Fachübersetzen Fachübersetzen Traduction spécialisée Traduction spécialisée Fachübersetzen Traduction spécialisée FachübersetzenTraduction spécialisée Web-TCM

27 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. Web-TCM

28 XHTML Fachübersetzen... Fachübersetzen... Web-TCM

29 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM- Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM Web-TCM

30 SSP Smalltalk Server Pages <%lang := request anyParameterValueAt: 'lang'. tm := Heeg.Translator.TM new: lang.%> <%lang := request anyParameterValueAt: 'lang'. tm := Heeg.Translator.TM new: lang.%> Web-TCM

31 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM- Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM 4.Resegmentieren Web-TCM

32

33

34

35

36

37 Workflow einsprachig mehrsprachig 1.HTML-Dateien bereitstellen –HTML Tidy (www.w3w.org) 2.HTML-Dateien in XHTML-Dateien konvertieren –Jede Datei beginnt mit einer DTD –Jedes Tag muss beendet werden, z.B., kurz: –Alle HTML-Bestandteile werden klein geschrieben. –Substitution bestimmter Tags, z.B. 3.Segmentierung der HTML-Dateien –*.htm (XHTML) –XML-Parser in Smalltalk (Parse-Tree) –Segmentierer in Smalltalk (Baumtransformation, TM-Segmente) –Generierung der ssp-Dateien (*.ssp) –Ablegen der AS-Segmente (hier: deutsch) in das TM 4.Resegmentieren 5.Übersetzen –Translation Memory in allen Zielsprachen Web-TCM

38

39

40

41

42

43

44 Export in kommerzielle TM-Systeme TMX-Austauschformat

Sprach- und Sachfachangebot Languages and application domains Langues et disciplines spécialisées Языка и дисципл ина... Sprach- und Sachfachangebot Languages and application domains Langues et disciplines spécialisées Языка и дисципл ина...

Herunterladen ppt "Entwicklung und Einsatz von Lokalisierungswerkzeugen (Web-TCM) Informatik-, Computerlinguistik-, Fachsprachenkompetenz Uta Seewald-Heeg Interdisziplinäre."

Ähnliche Präsentationen


Google-Anzeigen