Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Intelligente Terminologiearbeit an der Quelle

Ähnliche Präsentationen


Präsentation zum Thema: "Intelligente Terminologiearbeit an der Quelle"—  Präsentation transkript:

1 Intelligente Terminologiearbeit an der Quelle
Dipl.-Ing. Horst Liebscher. alxUserForum [ ]

2 I. Historische Entwicklungen II. Ein neuer Begriff
Agenda I. Historische Entwicklungen II. Ein neuer Begriff III. Ein Blick in die Praxis IV. Neue Ansatzpunkte Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 2

3 I. Entwicklung Ein Blick zurück
Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 3

4 MCT@euroscript :: Multilingual Content Technologies
Erstellen Übersetzen Publizieren Dienstleistungen Prozessoptimierung Beratung Systeme, Integrationen Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 4

5 Beratung, Prozessoptimierung
euroscript :: MCT Beratung, Prozessoptimierung Beratung, Training im Umfeld TMS, CMS, Redaktionssysteme, Terminologie systemunabhängig, zertifizierter Partner Terminologieprojekte Erarbeiten von Termi- nologie-Architekturen und -strukturen sowie -workflows, Initialbefül- lung der Systeme, Migrationen Cross Over Consulting Vermittlung ganzheit- licher Ansätze für homo- gene Abläufe im Gesamtunternehmen Quelltextoptimierung, Autorenunterstützung Lösungsansätze auf der Grundlage von acrolinx Maschinelle Übersetzung Bedarfsanalyse, Machbarkeitsstudien, Systemeinführung, Systemintegration, Initialbefüllung, Domainpflege Design von Architekturen Kundenportale und Automatisierungen, Worflowoptimierungen Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 5

6 Entwicklungen :: Systeme im Umfeld
Steuerung RS DTP TMS TDB AA conv TDB fuzz ling TMS = Translation Memory System TDB = Terminologie-Datenbank DTP = Desktop Publishing conv = Konverter für Direktpublikationen RS = Redaktionssystem AA = System zur Autorenunterstützung MÜ = System für maschinelle Übersetzung fuzz = Fuzzy-Algorithmen, Statistik ling = linguistische Basis TDB ling Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 6

7 Entwicklungen :: Die Frage nach der TDB
[Industrie-]Anwender Übersetzungsdienstleister RS TMS TMS AA TDB TDB TDB fuzz ling fuzz A O O Q Q Rollen im Prozess A = Autor, interner Auftraggeber O = Organisator, Projektmanager Q = qualitätssichernde Instanz Ü = Übersetzer, Entsprechungsfinder R = Reviewer, Revisor Ü R R Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 7

8 Termarbeit klassisch = Fuzzy [grob]
Bezogen auf Terminologie-Funktionen: Fuzzy-Suche Fuzzy-Finden statistische Methoden keine Normalisierung Bezogen auf Prozessschritte Übersetzungsprozess Fuzzy-Terminologie-Harvesting  hinzufügen neu Terminologiearbeit, laufend  Fuzzy-Abgleich gegen den existierenden Bestand Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 8

9 Ein Beispiel in klassischer Ausführung [1]
Termextraktion ohne allzu besondere Workflow-Einstellungen ggf. nur in Kombination mit Dokumentübersetzung möglich gut gemeintes, fatales Prozessjunktim Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 9

10 Ein Beispieltext Benutzerfreundlichkeit
Kompaktes Design und geringes Gewicht ermöglichen das Messen mit nur einer Hand Einfache Bedienung, auch mit Arbeitshandschuhen Problemloses Messen auch bei schwerer Zugänglichkeit der Proben Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse Messzelle mit Sichtfenster und Hintergrundbeleuchtung Robustheit Robustes, dichtes Gehäuse Entwickelt für den Einsatz in der Industrie und im Freien Geprüfte Beständigkeit der probenberührenden Teile gegen Batteriesäure und sämtliche gängigen chemischen Proben Eigensicher (ATEX-Kennzeichnung [Ex] II 2 G Ex ib IIC T4) Kabellose Kommunikation IrDA-Schnittstelle für Datenaustausch mit dem PC und Datenexport an den Drucker RFID-Schnittstelle für einfachen Wechsel der Messeinstellungen durch Einlesen von RFID-Tags Effizienz Speicher für bis zu 100 Proben-IDs zur einfachen Probenidentifizierung Speicher für bis zu 20 Messmethoden Speicher für bis zu 1024 Messergebnisse Zwei austauschbare 1,5-V-AA-Batterien für einen langfristigen, verlässlichen Betrieb Energiesparmodus zur Senkung des Stromverbrauchs Einfacher und schneller Austausch der gesamten Pumpeneinheit Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 10

11 Ein Beispiel in klassischer Ausführung [2]
Rein statistische Auswertung mit einigen wenigen Optionen zur Einschränkung Aus der Liste wählt man manuell seine Kandidaten per Tickbox "Term" oder schließt "Stoppwörter" aus. zusätzlich steht die Segmentanzeige zur Verfügung (Kontext) Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 11

12 Ein Beispiel in klassischer Ausführung [3]
Schon bekannte Terme sind in fett und blau markiert und werden direkt vorgeschlagen. Eine Grundformreduzierung ist hier inzwischen möglich (Messergebnisse und Proben im Plural), muss nachträg-lich angepasst werden Daraus folgt allerdings: ursprünglich flektierte Formen werden immer wieder extrahiert Erst wenn alle Kandidaten auf "Final" gesetzt wurden, kann die Aufgabe abge-schlossen werden und die Terme gehen in den Termbestand über. Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 12

13 II. Ein neuer Begriff Terminologie 2.0
Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 13

14 Terminologiearbeit wird in den linguistischen Kontext erhoben
Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 14

15 Entwicklungen :: neu = linguistisch
Bezogen auf Terminologie-Funktionen: Fuzzy-Suche findet weiterhin statt Fuzzy-Finden findet ebenso weiterhin statt Normalisierung: das ist neu Bezogen auf Prozessschritte Terminologie-Harvesting  hinzufügen neu = linguistisch basiert Terminologiearbeit, laufend  recht verlässlicher, linguistisch basierter Abgleich gegen den existierenden Bestand ÜDL(LSP)  TMS + TDB = PM + Ü+T AG  TDB, ev. TMS = T + PM* Was er definitiv braucht: TDB. Das gilt immer Was er u. U. braucht TMS. Das gilt für bestimmte Konstellationen. Weiter: AA am RS, im CMS = Autor wie gehabt Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 15

16 Beispiel [linguistisch]
Term Freq. Status Contexts PoS Speicher 3 Proposed noun Hintergrundbeleuchtung 2 Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse … Messergebnis Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse… Arbeitshandschuh 1 Einfache Bedienung, auch mit Arbeitshandschuhen ATEX-Kennzeichnung Eigensicher (ATEX-Kennzeichnung [Ex] II 2 G Ex ib IIC T4) Benutzerfreundlichkeit Beständigkeit Geprüfte Beständigkeit der probenberührenden Teile gegen Batteriesäure und sämtliche gängigen… Datenaustausch IrDA-Schnittstelle für Datenaustausch mit dem PC und Datenexport an den Drucker Datenexport Energiesparmodus Gehäuse Robustes, dichtes Gehäuse IIC IrDA-Schnittstelle kabellos Kabellose adj LC-Display Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse Messeinstellung RFID-Schnittstelle für einfachen Wechsel der Messeinstellungen durch Einlesen von RFID-Tags Messmethoden Speicher für bis zu 20 Messmethoden probenberührend Probenidentifizierung Speicher für bis zu 100 Proben-IDs zur einfachen Probenidentifizierung Proben-IDs Pumpeneinheit Einfacher und schneller Austausch der gesamten Pumpeneinheit RFID-Schnittstelle RFID-Tag Robustheit Sichtbarkeit Sichtfenster Messzelle mit Sichtfenster und Hintergrundbeleuchtung Stromverbrauch Energiesparmodus zur Senkung des Stromverbrauchs Zugänglichkeit Problemloses Messen auch bei schwerer Zugänglichkeit der Proben Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 16

17 A Ü R Workflowszenario [A] TDB
ein repräsentativer Terminologiebestand existiert neue Terminologie entsteht mit neuen Technologien und neuen Produkten Vorschlagsgremium Terminologiekreis  technische Tool-Unterstützung bei einer Extraktion ist nicht zwingend erforderlich  Agieren der Prozessbeteiligten in einem TDB-System A Ü Schritte im Prozess: Kreieren neuer Terme im Terminologiekreis (mindestens Quelle, Kontext, Definition) Übertragung in Zielsprachen inhaltliche Freigabe durch z. B. Tochtergesellschaften Strukturelle Freigabe im Gesamtbestand TDB R Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 17

18 A Ü R Workflowszenario [B]
Tf(R) = Tf(Ü) =Redakteure sehen Terminologie durch andere Brillen als Übersetzer Zusätzlich ein Vorschlagswesen seitens des Übersetzers ist sinnvoll. Daher gibt es hier auch: Termharvesting/Termextraktionsprozesse. Schwierigkeit: Termarbeit parallel zum Übersetzungsprozess  zeitkritische Freigabeprozesse  potenzielle Inkonsistenzen in Memory und CMS zusätzlicher Termbestand beim Übersetzungsdienstleister  Nutzung des acrolinx-Kontepts non-Terme A Schritte im Prozess: Kreieren neuer Terme und Zielvorschläge im Übersetzungsprozess Termantrag an Terminologiekreis strukturelle Freigabe oder Abweisung a) Aufnahme in Gesamtbestand b) Aufnahme in zusätzlichen Termbestand beim Übersetzungsdienstleister ggf. inhaltliche Freigabe durch Tochtergesellschaft Ü TDB TDB TDB R Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 18

19 es existiert kein repräsentativer Terminologiebestand
Workflowszenario [C] es existiert kein repräsentativer Terminologiebestand daher: Termharvesting/Termextraktion Probleme im Ablauf:  Projektlaufzeit  Freigabeprozess  im Memory abgebildete potenziell ungültige Terminologie  dito im CMS Schritte:  Termharvesting/Termextraktion  Klassifizieren [zeitextensiv, aber unabdingbar und einmalig]  Übertragen  Freigeben Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 19

20 III. Ein Blick in die Praxis
Fallstricke Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 20

21 Komplexe Anforderungen wegen mehrerer Systeme:
Vorsicht 1 Komplexe Anforderungen wegen mehrerer Systeme: Datenbankstrukturen müssen komplexe Anforderungen über mehrere Prozesse abbilden Rollen/Rechte-Konzept muss bis auf die Sprachebene geregelt werden Definieren eines Termbanksystems als das führende Definieren von Synchronisierungsmechanismen bzw. Austauschritualen zwischen den Systemen Unausweichliche Notwendigkeit eines Terminologiekonzepts: strukturellen Anforderungen Prozessbeschreibungen Beschreibung der Arbeitsteiligkeiten/Verantwortlichkeiten Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 21

22 Schwierigkeiten im Prozessablauf bei parallelen Termprozessen
Vorsicht 2 Schwierigkeiten im Prozessablauf bei parallelen Termprozessen geharvestete* Terme, die ganz neu sind geharvestete* Terme, die erfasst sind, aber noch nicht kategorisiert wurden geharvestete* Terme, die für eine andere Sprachrichtung bereits als valide Terme kategorisiert wurden und noch keine zielsprachige Entsprechung haben  … müssen gleichzeitig, aber unterschiedlich behandelt werden * Unwort Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 22

23 Verführerisches Feature Schnelleingabe von Termen *
Vorsicht 3 Verführerisches Feature Schnelleingabe von Termen * Die Erfassung von Termen direkt aus dem Editor kann in streng konzipierten Prozessen unter Umständen zum ineffizienten Bummerang werden: Die Auswahl neuer Terme erfolgt seriell. non-Terme werden nicht erfasst. Eine konsequente Erfassung von Terminologie findet also nicht statt [= valide Terme + Unworte + non-Terme]. Damit ist die Terminologie im acrolinx-Sinne [Terminologie 2.0] nicht repräsentativ. Da non-Terme nicht bekannt sind, werden bei der Prüfung von Inhalten potenziell mehr Fehler ausgegeben. Dies kann bei strengen Prozessritualen [Freigabe von Dokumenten auf der Basis der acrolinx-Bewertung] zu unerwünschten Effekten führen. * Nachtrag, unter Eindruck der Vorträge aus dem acrolinx-Labor auf der UserKonferenz Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 23

24 Brücke zur MÜ: Quelltextoptimierung und maschinelle Übersetzung
IV. Neue Perspektiven Brücke zur MÜ: Quelltextoptimierung und maschinelle Übersetzung Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 24

25 regelbasierte MÜ-Systeme * steuerbare Prozesse
Ansätze regelbasierte MÜ-Systeme * steuerbare Prozesse linguistische Synergien via Terminologie RS TMS TDB AA TDB * Terminologie auch nutzbar in statistisch basierten MÜ-Szenarien, aber mit vergleichsweise geringerem Potenzial zur Prozesssteuerung TDB Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 25

26 Forschungsprojekt taraXŰ
Innovation Forschungsprojekt taraXŰ Prototyp eines selbsttarierenden Übersetzungssystems  automatisierte Übersetzungsprozesse  integrierte Quelltextbewertung  intelligente Prozesssteuerung  Integration von TM-Technologie, regelbasierter MÜ und statistischer MÜ  umfangreiche Evaluierungsrunden im Projekt Konsortium: acrolinx + DFKI + euroscript + yocoy gefördert vom Land Berlin Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 26

27 Fazit Terminologiearbeit berührt aktuell meist mehrere Bereiche in den komplexen Prozessketten des Managens von Inhalten in einem Unternehmen. Weitere Ansatzpunkte [MÜ] liegen nahe. Die aktuellen Systeme sind noch nicht für die Abbildung aller Anforderungen ausgestattet. Daher sind aktuell Architekturen mit mehreren Terminologiekomponenten durchaus sinnvoll [Schwerpunkt Autorenunterstützung, Schwerpunkt Übersetzungsprozess, Schwerpunkt maschinelle Übersetzung]. Synergien über diese Systeme hinweg können aber bereits jetzt eingelöst werden. Dies wird die Basis sein für eine technologische Assimilation dieser Ansätze… … und ein Zusammenwachsen der Systeme. Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 27

28 Danke für die Aufmerksamkeit!
Horst Liebscher, , alxUserForum Karlsruhe. – v1-0, slide 28


Herunterladen ppt "Intelligente Terminologiearbeit an der Quelle"

Ähnliche Präsentationen


Google-Anzeigen