Intelligente Terminologiearbeit an der Quelle

Slides:



Advertisements
Ähnliche Präsentationen
Migration von Feldbussen zu PROFINET
Advertisements

Anbindung mobiler Endgeräte über den Terminal Service
Einfluss von Web Services Technologien auf organisatorische Strukturen Referent: Sergej Groß
Monitoring - Wärmepumpen im Gebäudebestand
Von David Keß, Heinrich Wölk, Daniel Hauck
On the Criteria to Be Used in Decomposing Systems into Modules
„Ansicht Arbeitsbereich“ ist die nutzerspezifische Ansicht, in der alle Dokumente aufgelistet sind, die dem angemeldeten Benutzer zugeordnet sind. D.h.
ACN Closing Cockpit Andrea Mokesch
Daten fließen lassen XML in Microsoft Office 2003 Lorenz Goebel Frank Fischer
Agenda DataAssist e.K. Probleme heutiger Ansätze der Netzwerkdokumentation Management der Netzwerkdokumentation Management von Rechnern Der NetDoc Server.
:33 Architektur Moderner Internet Applikationen – Prolog Copyright ©2003 Christian Donner. Alle Rechte vorbehalten. Architektur Moderner.
Seite 1DatumThomas MickleyKundeninformationsdatenbank jw Kundeninformationsdatenbank Dipl. Ing. Thomas Mickley consulting Frankfurt,
Jw Peter Späth Seite 1 Materialanforderungen per Web jw Consulting Dr. Peter Späth jw Consulting GmbH
DEPARTMENT FÜR INFORMATIK
Datenbankzugriff im WWW (Kommerzielle Systeme)
SAP R/3 - Speichermanagement
Unternehmens-Präsentation
Java: Objektorientierte Programmierung
K-Modeler Engineering
Die Nutzung von ERP-Daten für die firmenweite Terminologieverwaltung
Integrierte Übersetzungsprozesse
Rational Unified Process (RUP) - Definitionen
Kursleitung: Hier ist Platz für Ihren Namen
Workshop: Qualifizierung für Groupware 7. September 1999 Dortmund Herzlich willkommen zum.
Medien Zentrum Duisburg
Mit uns lernen Ihre Maschinen sehen: Wir verfügen über langjährige Erfahrung in der Bildverarbeitung Wir blicken auf zahlreiche realisierte.
Grundschutztools
Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.
Innovationsmanagement
Synergieeffekte durch softwaregestützte Prozessmodelle
Computergestützte Übersetzung und Terminologieverwaltung
QDE - Messdatenerfassung
Druckerinstallation HP1050C
Internet und Intranet im Krankenhaus
Gliederung Einleitung eID-Infrastruktur und Komponenten
Dr. Ella Scherp und Dr. Günther Vedder
DC 155 – Das Konzept DC155 Das Konzept DC155 Technische Features
Prototypentwicklung für ein Testmanagementsystem
Warum brauche ich ein CMS – Content Management System?
1 Workshop Service Inbetriebnahme und Rücksicherung Saia Service an PCD's Inbetriebnahme und Rücksicherung III. Workshop Inbetriebnahme und Laden der Datensicherung.
1 Semiautomatische Medienresonanz- und Diffusions-Analyse Waltraud Wiedermann, GF APA-DeFacto und APA-MediaWatch Michael Granitzer, Know-Center.
Service Design by EstherKnaus® Der Benchmark für Dienstleistungen
Xenario IES Information Enterprise Server. Xenario Information Enterprise Server (IES) Die neue Architektur des Sitepark Information Enterprise Servers.
Das fachkommunikative Dreierlei
Binde & Wallner Engineering GmbH
1 Scholl Communications AG. 2 Vorstellung Scholl Communications AG »Seit 1988 Jahren erfolgreich am Markt »Software, Lösungen und Dienstleistungen für.
Gestaltung von Folien mit Powerpoint
Was macht eigentlich dieses ExsoForm? Ein Beispiel für eine Dokumentendefinition in Screenshots.
Soziale Netzwerke: ökonomische und technische Konzepte Seminar im WS 2009/2010 PD Dr. Lilia Waehlert.
1 CeBIT 2008 Knowledge Management 2.0 Ulrich Kampffmeyer PROJECT CONSULT Unternehmensberatung Dr. Ulrich Kampffmeyer GmbH Breitenfelder Straße
Seminar: Entwicklung verteilter eingebetteter Systeme WS05/06 Betreuer: Info:
HORIZONT 1 XINFO ® Das IT - Informationssystem HORIZONT Software für Rechenzentren Garmischer Str. 8 D München Tel ++49(0)89 /
Publikation auf Knopfdruck Judith Riegelnig Michael Grüebler 19. Oktober 2010 / Statistiktage Neuenburg.
Ganzheitliches Projekt-, Ressourcen- und Qualitätsmanagement 1 Reports und AddOns Auf den folgenden Seiten wird Ihnen die Funktionsweise der Reports und.
die Auftragsbearbeitung für den Kleinbetrieb
secunet Security Networks AG
Paradigmenwechsel in der Unternehmensmodellierung Prof. Dr. Wolfgang Voigt Dipl.-Ing. Päd. Alexander Huwaldt UML Extrakt UML Seminar, Chemnitz
PRO:CONTROL Ziel des Moduls Arbeitspakete
PARTENARIAT ÉDUCATIF GRUNDTVIG PARTENARIAT ÉDUCATIF GRUNDTVIG REPERES KULTURELLER ZUSAMMENHALT UND AUSDEHNUNG DER IDEEN AUF EUROPÄISCHEM.
Content Management System
Wozu Terminologie? Lexalp, WP 10 – Training
KMUs in Tirol / Österreich - Betriebliche Planung Welche Zukunft sehen Tirols Unternehmen? Eine repräsentative Befragung über Optimismus, Ängste, Herausforderungen.
CC-by-Lizenz, Autor: Bernd Schmid für isb-w.euisb-w.eu Systemische Professionalität Verantwortung ISB-Konzepte kompakt Leitung: Dr. Bernd.
Die Management-Tools von Z&H COACH beinhalten zentrale Hilfsmittel für ein Management-System. Sorgfältig angewendet führen diese Tools Ihr Unternehmen.
Dipl.-Inform. (FH) Mike Bach Unterschiedliche Anwendungen im Unternehmen – Warum, Wer und Wie Best-of-Breed vs. Alles aus einer Hand Dipl.-Inform. Mike.
Fachhochschule Südwestfalen
Papierloses Parlament: Ein Projekt, dass das Leben der Ratsmitglieder und der Präsidenten verändert hat! Jean-Albert Ferrez, Präsident GRVS
Team 8 Eva Reinl, Markus Leimbach
DABay – Neuerung im Modul Bescheide
IT-Dienstleistungen E-Learning Systeme Content Management 1 Fallbeispiel ILIAS: Das Repository-Objekt-Plugin „Centra“
 Präsentation transkript:

Intelligente Terminologiearbeit an der Quelle Dipl.-Ing. Horst Liebscher. alxUserForum [14.10.2010]

I. Historische Entwicklungen II. Ein neuer Begriff Agenda I. Historische Entwicklungen II. Ein neuer Begriff III. Ein Blick in die Praxis IV. Neue Ansatzpunkte Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 2

I. Entwicklung Ein Blick zurück Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 3

MCT@euroscript :: Multilingual Content Technologies Erstellen Übersetzen Publizieren Dienstleistungen Prozessoptimierung Beratung Systeme, Integrationen Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 4

Beratung, Prozessoptimierung euroscript :: MCT Beratung, Prozessoptimierung Beratung, Training im Umfeld TMS, CMS, Redaktionssysteme, Terminologie systemunabhängig, zertifizierter Partner Terminologieprojekte Erarbeiten von Termi- nologie-Architekturen und -strukturen sowie -workflows, Initialbefül- lung der Systeme, Migrationen Cross Over Consulting Vermittlung ganzheit- licher Ansätze für homo- gene Abläufe im Gesamtunternehmen Quelltextoptimierung, Autorenunterstützung Lösungsansätze auf der Grundlage von acrolinx Maschinelle Übersetzung Bedarfsanalyse, Machbarkeitsstudien, Systemeinführung, Systemintegration, Initialbefüllung, Domainpflege Design von Architekturen Kundenportale und Automatisierungen, Worflowoptimierungen Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 5

Entwicklungen :: Systeme im Umfeld Steuerung RS DTP TMS TDB AA conv TDB fuzz ling TMS = Translation Memory System TDB = Terminologie-Datenbank DTP = Desktop Publishing conv = Konverter für Direktpublikationen RS = Redaktionssystem AA = System zur Autorenunterstützung MÜ = System für maschinelle Übersetzung fuzz = Fuzzy-Algorithmen, Statistik ling = linguistische Basis MÜ TDB ling Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 6

Entwicklungen :: Die Frage nach der TDB [Industrie-]Anwender Übersetzungsdienstleister RS TMS TMS AA TDB TDB TDB fuzz ling fuzz A O O Q Q Rollen im Prozess A = Autor, interner Auftraggeber O = Organisator, Projektmanager Q = qualitätssichernde Instanz Ü = Übersetzer, Entsprechungsfinder R = Reviewer, Revisor Ü R R Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 7

Termarbeit klassisch = Fuzzy [grob] Bezogen auf Terminologie-Funktionen: Fuzzy-Suche Fuzzy-Finden statistische Methoden keine Normalisierung Bezogen auf Prozessschritte Übersetzungsprozess Fuzzy-Terminologie-Harvesting  hinzufügen neu Terminologiearbeit, laufend  Fuzzy-Abgleich gegen den existierenden Bestand Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 8

Ein Beispiel in klassischer Ausführung [1] Termextraktion ohne allzu besondere Workflow-Einstellungen ggf. nur in Kombination mit Dokumentübersetzung möglich gut gemeintes, fatales Prozessjunktim Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 9

Ein Beispieltext Benutzerfreundlichkeit Kompaktes Design und geringes Gewicht ermöglichen das Messen mit nur einer Hand Einfache Bedienung, auch mit Arbeitshandschuhen Problemloses Messen auch bei schwerer Zugänglichkeit der Proben Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse Messzelle mit Sichtfenster und Hintergrundbeleuchtung Robustheit Robustes, dichtes Gehäuse Entwickelt für den Einsatz in der Industrie und im Freien Geprüfte Beständigkeit der probenberührenden Teile gegen Batteriesäure und sämtliche gängigen chemischen Proben Eigensicher (ATEX-Kennzeichnung [Ex] II 2 G Ex ib IIC T4) Kabellose Kommunikation IrDA-Schnittstelle für Datenaustausch mit dem PC und Datenexport an den Drucker RFID-Schnittstelle für einfachen Wechsel der Messeinstellungen durch Einlesen von RFID-Tags Effizienz Speicher für bis zu 100 Proben-IDs zur einfachen Probenidentifizierung Speicher für bis zu 20 Messmethoden Speicher für bis zu 1024 Messergebnisse Zwei austauschbare 1,5-V-AA-Batterien für einen langfristigen, verlässlichen Betrieb Energiesparmodus zur Senkung des Stromverbrauchs Einfacher und schneller Austausch der gesamten Pumpeneinheit Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 10

Ein Beispiel in klassischer Ausführung [2] Rein statistische Auswertung mit einigen wenigen Optionen zur Einschränkung Aus der Liste wählt man manuell seine Kandidaten per Tickbox "Term" oder schließt "Stoppwörter" aus. zusätzlich steht die Segmentanzeige zur Verfügung (Kontext) Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 11

Ein Beispiel in klassischer Ausführung [3] Schon bekannte Terme sind in fett und blau markiert und werden direkt vorgeschlagen. Eine Grundformreduzierung ist hier inzwischen möglich (Messergebnisse und Proben im Plural), muss nachträg-lich angepasst werden Daraus folgt allerdings: ursprünglich flektierte Formen werden immer wieder extrahiert Erst wenn alle Kandidaten auf "Final" gesetzt wurden, kann die Aufgabe abge-schlossen werden und die Terme gehen in den Termbestand über. Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 12

II. Ein neuer Begriff Terminologie 2.0 Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 13

Terminologiearbeit wird in den linguistischen Kontext erhoben Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 14

Entwicklungen :: neu = linguistisch Bezogen auf Terminologie-Funktionen: Fuzzy-Suche findet weiterhin statt Fuzzy-Finden findet ebenso weiterhin statt Normalisierung: das ist neu Bezogen auf Prozessschritte Terminologie-Harvesting  hinzufügen neu = linguistisch basiert Terminologiearbeit, laufend  recht verlässlicher, linguistisch basierter Abgleich gegen den existierenden Bestand ÜDL(LSP)  TMS + TDB = PM + Ü+T AG  TDB, ev. TMS = T + PM* Was er definitiv braucht: TDB. Das gilt immer Was er u. U. braucht TMS. Das gilt für bestimmte Konstellationen. Weiter: AA am RS, im CMS = Autor wie gehabt Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 15

Beispiel [linguistisch] Term Freq. Status Contexts PoS Speicher 3 Proposed noun Hintergrundbeleuchtung 2 Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse … Messergebnis Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse… Arbeitshandschuh 1 Einfache Bedienung, auch mit Arbeitshandschuhen ATEX-Kennzeichnung Eigensicher (ATEX-Kennzeichnung [Ex] II 2 G Ex ib IIC T4) Benutzerfreundlichkeit Beständigkeit Geprüfte Beständigkeit der probenberührenden Teile gegen Batteriesäure und sämtliche gängigen… Datenaustausch IrDA-Schnittstelle für Datenaustausch mit dem PC und Datenexport an den Drucker Datenexport Energiesparmodus Gehäuse Robustes, dichtes Gehäuse IIC IrDA-Schnittstelle kabellos Kabellose adj LC-Display Großes LC-Display mit Hintergrundbeleuchtung für optimale Sichtbarkeit der Messergebnisse Messeinstellung RFID-Schnittstelle für einfachen Wechsel der Messeinstellungen durch Einlesen von RFID-Tags Messmethoden Speicher für bis zu 20 Messmethoden probenberührend Probenidentifizierung Speicher für bis zu 100 Proben-IDs zur einfachen Probenidentifizierung Proben-IDs Pumpeneinheit Einfacher und schneller Austausch der gesamten Pumpeneinheit RFID-Schnittstelle RFID-Tag Robustheit Sichtbarkeit Sichtfenster Messzelle mit Sichtfenster und Hintergrundbeleuchtung Stromverbrauch Energiesparmodus zur Senkung des Stromverbrauchs Zugänglichkeit Problemloses Messen auch bei schwerer Zugänglichkeit der Proben Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 16

A Ü R Workflowszenario [A] TDB ein repräsentativer Terminologiebestand existiert neue Terminologie entsteht mit neuen Technologien und neuen Produkten Vorschlagsgremium Terminologiekreis  technische Tool-Unterstützung bei einer Extraktion ist nicht zwingend erforderlich  Agieren der Prozessbeteiligten in einem TDB-System A Ü Schritte im Prozess: Kreieren neuer Terme im Terminologiekreis (mindestens Quelle, Kontext, Definition) Übertragung in Zielsprachen inhaltliche Freigabe durch z. B. Tochtergesellschaften Strukturelle Freigabe im Gesamtbestand TDB R Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 17

A Ü R Workflowszenario [B] Tf(R) = Tf(Ü) =Redakteure sehen Terminologie durch andere Brillen als Übersetzer Zusätzlich ein Vorschlagswesen seitens des Übersetzers ist sinnvoll. Daher gibt es hier auch: Termharvesting/Termextraktionsprozesse. Schwierigkeit: Termarbeit parallel zum Übersetzungsprozess  zeitkritische Freigabeprozesse  potenzielle Inkonsistenzen in Memory und CMS zusätzlicher Termbestand beim Übersetzungsdienstleister  Nutzung des acrolinx-Kontepts non-Terme A Schritte im Prozess: Kreieren neuer Terme und Zielvorschläge im Übersetzungsprozess Termantrag an Terminologiekreis strukturelle Freigabe oder Abweisung a) Aufnahme in Gesamtbestand b) Aufnahme in zusätzlichen Termbestand beim Übersetzungsdienstleister ggf. inhaltliche Freigabe durch Tochtergesellschaft Ü TDB TDB TDB R Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 18

es existiert kein repräsentativer Terminologiebestand Workflowszenario [C] es existiert kein repräsentativer Terminologiebestand daher: Termharvesting/Termextraktion Probleme im Ablauf:  Projektlaufzeit  Freigabeprozess  im Memory abgebildete potenziell ungültige Terminologie  dito im CMS Schritte:  Termharvesting/Termextraktion  Klassifizieren [zeitextensiv, aber unabdingbar und einmalig]  Übertragen  Freigeben Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 19

III. Ein Blick in die Praxis Fallstricke Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 20

Komplexe Anforderungen wegen mehrerer Systeme: Vorsicht 1 Komplexe Anforderungen wegen mehrerer Systeme: Datenbankstrukturen müssen komplexe Anforderungen über mehrere Prozesse abbilden Rollen/Rechte-Konzept muss bis auf die Sprachebene geregelt werden Definieren eines Termbanksystems als das führende Definieren von Synchronisierungsmechanismen bzw. Austauschritualen zwischen den Systemen Unausweichliche Notwendigkeit eines Terminologiekonzepts: strukturellen Anforderungen Prozessbeschreibungen Beschreibung der Arbeitsteiligkeiten/Verantwortlichkeiten Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 21

Schwierigkeiten im Prozessablauf bei parallelen Termprozessen Vorsicht 2 Schwierigkeiten im Prozessablauf bei parallelen Termprozessen geharvestete* Terme, die ganz neu sind geharvestete* Terme, die erfasst sind, aber noch nicht kategorisiert wurden geharvestete* Terme, die für eine andere Sprachrichtung bereits als valide Terme kategorisiert wurden und noch keine zielsprachige Entsprechung haben  … müssen gleichzeitig, aber unterschiedlich behandelt werden * Unwort Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 22

Verführerisches Feature Schnelleingabe von Termen * Vorsicht 3 Verführerisches Feature Schnelleingabe von Termen * Die Erfassung von Termen direkt aus dem Editor kann in streng konzipierten Prozessen unter Umständen zum ineffizienten Bummerang werden: Die Auswahl neuer Terme erfolgt seriell. non-Terme werden nicht erfasst. Eine konsequente Erfassung von Terminologie findet also nicht statt [= valide Terme + Unworte + non-Terme]. Damit ist die Terminologie im acrolinx-Sinne [Terminologie 2.0] nicht repräsentativ. Da non-Terme nicht bekannt sind, werden bei der Prüfung von Inhalten potenziell mehr Fehler ausgegeben. Dies kann bei strengen Prozessritualen [Freigabe von Dokumenten auf der Basis der acrolinx-Bewertung] zu unerwünschten Effekten führen. * Nachtrag, unter Eindruck der Vorträge aus dem acrolinx-Labor auf der UserKonferenz Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 23

Brücke zur MÜ: Quelltextoptimierung und maschinelle Übersetzung IV. Neue Perspektiven Brücke zur MÜ: Quelltextoptimierung und maschinelle Übersetzung Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 24

regelbasierte MÜ-Systeme * steuerbare Prozesse Ansätze regelbasierte MÜ-Systeme * steuerbare Prozesse linguistische Synergien via Terminologie RS TMS TDB AA TDB MÜ * Terminologie auch nutzbar in statistisch basierten MÜ-Szenarien, aber mit vergleichsweise geringerem Potenzial zur Prozesssteuerung TDB Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 25

Forschungsprojekt taraXŰ Innovation Forschungsprojekt taraXŰ Prototyp eines selbsttarierenden Übersetzungssystems  automatisierte Übersetzungsprozesse  integrierte Quelltextbewertung  intelligente Prozesssteuerung  Integration von TM-Technologie, regelbasierter MÜ und statistischer MÜ  umfangreiche Evaluierungsrunden im Projekt Konsortium: acrolinx + DFKI + euroscript + yocoy gefördert vom Land Berlin Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 26

Fazit Terminologiearbeit berührt aktuell meist mehrere Bereiche in den komplexen Prozessketten des Managens von Inhalten in einem Unternehmen. Weitere Ansatzpunkte [MÜ] liegen nahe. Die aktuellen Systeme sind noch nicht für die Abbildung aller Anforderungen ausgestattet. Daher sind aktuell Architekturen mit mehreren Terminologiekomponenten durchaus sinnvoll [Schwerpunkt Autorenunterstützung, Schwerpunkt Übersetzungsprozess, Schwerpunkt maschinelle Übersetzung]. Synergien über diese Systeme hinweg können aber bereits jetzt eingelöst werden. Dies wird die Basis sein für eine technologische Assimilation dieser Ansätze… … und ein Zusammenwachsen der Systeme. Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 27

Danke für die Aufmerksamkeit! horst.liebscher@euroscript.de Horst Liebscher, 14.10.2010, alxUserForum Karlsruhe. – v1-0, slide 28