Möglichkeiten und Grenzen des Automatisches Übersetzens

Slides:



Advertisements
Ähnliche Präsentationen
Verben 1 Verben 2 Modal s 1 Präsens Modal 2 Imperfekt Translate!
Advertisements

Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Inhaltlich orientierter Zugriff auf unstrukturierte Daten
Grundbegriffe der Kontaktlinguistik
Year 10 personal pronouns
Personal Pronouns in the Dative Kapitel 10 Lektion B
The Verbs sein and heißen
Deutsch 1 Frau Spampinato
Parser generieren Yet Another Compiler – Compiler YACC.
Die Nutzung von ERP-Daten für die firmenweite Terminologieverwaltung
Integrierte Übersetzungsprozesse
SYSTRAN Information and translation technologies.
Computergestützte Übersetzung
Die Nutzung und Erstellung von WebQuests im Englischunterricht.
Sprachen im Internet von Julia Mai Gliederung Verschiedene Formen: 1. Ausländische Websites (.ch,.fr,.uk,.it) 2. Online-Wörterbücher 3. Automatische.
Multimedia Retrieval SS 2007 Speech Recognition
Hallo/Hi – inf. , (Hello/Hi) Grüß Gott (AUT)/Guten Tag (DE) – f
Maschinelles Lernen und automatische Textklassifikation
1000 Km bis zum Meer. “1000 Km to the sea” Luxuslärm
The German Future Tense
Relative clauses What is a relative clause?
Dativ/Akkusativ Präpositionen
GERM 1013 Guten Morgen.
Lesen Seite
Powerpoints bestellen - Mail an: My Family Photo. On the left is my wife, in the middle is my Mother in Law, besides her.
common mistakes Morgen Habe Ich das buch fur dich.
Fasching.
The Nominative Case Forms/Endings of the personal pronouns.
You need to use your mouse to see this presentation © Heidi Behrens.
You need to use your mouse to see this presentation © Heidi Behrens.
sein (Englisch: to be) [Infinitiv]
ICT – Modul Textverarbeitung
4 Töchter.
Alles nur in meinem Kopf “All only in my head” Andreas Bourani
Wann reisst der Himmel auf “When will heaven rip open” Silbermond
English Grammar Die Zeiten der englischen Sprache für Franziska
“To be or not to be…” Bin, bist, ist, sind, seid.
Hinweise zur Folienpräsentation:
Der formelle Imperativ – the Imperative
Introducing the Voice Productivity Kit. Introducing the Voice Productivity Kit Discover the true productivity of your voice! Dictated. Documented. 5 Steps.
Mensch – Maschine - Kommunikation
Guten Morgen! Mittwoch den LB 5.3D-F (F = Aufzatz, 150 Wörter)
Äquivalenz.
Ich liege oft wach Abends und eine leise Klarheit Ich liege oft wach Abends und eine leise Klarheit I lie often awake in the evening and a quiet lucidity.
Learning Target / Lernziel: To be
LFG als Interlingua in der maschinellen Übersetzung
Lexikalische Semantik
Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme
What is a “CASE”? in English: pronouns, certain interrogatives
Museumsinsel Museum Island (German: Museumsinsel) is the name of the northern half of an island in the Spree river in the central Mitte district of Berlin,
GERMAN 1013 Kapitel 5 Review. terminology Word types: –nouns, pronouns, verbs, adjectives, prepositions … Functions: –subject, predicate, object … Form.
type / function / form type of words:
GERMAN 1013 Kapitel 5 1. translation verb in 2 nd position At seven thirty we drive to Wolfville. Um halb acht fahren wir nach Wolfville time – manner.
MS Word 2010 Word Texte eingeben und bearbeiten automatische und manuelle Korrekturen Text bearbeiten Word Texte eingeben und bearbeiten automatische und.
Vorstellen (informell: Christian, Mike, Sam)
Guten Tag! Montag den Hausaufgabe bis Dienstag den LB 5.4 A-B Unit 5 Culture Worksheet.
DA- und WO- Verbindungen Wie gut verstehst du sie?
Wie kann ich eine Beziehung zu Gott bekommen?. Our God is greater Water you turned into wine, opened the eyes of the blind there's no one like you, none.
DA- und WO- Verbindungen Wie gut verstehst du sie?
Fitness. An english presentation.
Deutsch I: Modal verb review….
D1: Die Familie Frau Spampinato
Hypertext 2015/2016.
Willkommen bei der Englisch-Abfrage von Grammar One bis Grammar Five
Ich will ihn kennenlernen. He likes to read (do not use MODAL)
ARBEITE N und FINDE N arbeiten = to work finden = to find ich
 Präsentation transkript:

Möglichkeiten und Grenzen des Automatisches Übersetzens Die Aufgaben des Übersetzers Texte aus einer Ausgangssprache in eine Zielsprache unter möglichst vollständiger Wahrung in Form, Inhalt und Stil zu übertragen (so dass sie ggf. an eine spezifizierte Zielgruppe angepasst sind). (Blanke 1973) Anforderungsdimensionen einer korrekten Übersetzung (I) 1. Berücksichtigung unterschiedlicher Ausdrucksformen syntaktisch (z.B. dt. “Es gefällt mir” -> engl. “I like it”, engl. “The man dropped the book” -> “Der Mann ließ das Buch fallen” engl. “He was injured” -> “Er verletzte sich”)

lexikalisch-semantisch (z.B. dt. “erheben [Gebühr, Anklage, Stimme, sich]” -> engl. “levy a charge, bring charges against, raise, rise” 2. Auflösung lexikalisch-grammatikalischer Bezüge Mehrdeutigkeiten (z.B. engl. “wall” -> dt. “Mauer” oder “Wand”, syntaktische Mehrdeutigkeit “Ich sehe den Mann mit dem Fernglas”) Referentielle Bezüge von Pronomina (z.B. dt. “Er trägt ihre große Tasche. Sie ist schwer.” -> engl. “He carries her big bag. It/She is heavy.”)

Anforderungsdimensionen einer korrekten Übersetzung (II) 3. Einhaltung des Sachbezugs Verwendung von Fachterminologie (z.B. dt. “Bankschalter” -> engl. “desk”, dt. “Postschalter” -> engl. “post office counter”, dt.“Abblendschalter” -> engl. “dip switch”, dt. “Blinkschalter” -> engl. “direction indicator” 4. Einhaltung pragmatischen und stilistischen Bezugs Verwendung von Ausdruckskonventionen (z.B. in deutschen wissenschaftlichen Texten oft “wir” (Plural modestiae), engl. “I”, Konventionen für Gruß- und Schlußformeln, usw.) 5. Berücksichtigung kulturellen Bezugs Verwendung von Welt- und Bildungswissen (z.B. dt. “Sein oder nicht sein” -> engl. “To be or not to be”, nicht “His or not his”)

Stand der Forschung Vollautomatische maschinelle Übersetzung (MT) Mainframe-Systeme seit 1954 kommerziell eingesetzt seit ca. 1970 heute verfügbar u.a. SYSTRAN, METAL, LOGOS, ATLAS, u.a. PC-Systeme seit Ende der 80er Jahre heute verfügbar u.a. GlobaLink, Power Translator, LMT Generelle Beschränkung Fachtexte mit eingeschränktem Vokabular und eingeschränkter Syntax

Systemtypen Vollautomatische Übersetzung: Übersetzungsprozess wird komplett maschinell abgearbeitet Maschinengestützte Übersetzung: Übersetzer / Terminologie erhält Werkzeuge, die ihn bei der Übersetzung unterstützen Satzarchive / Translation Memories elektronische Lexika, Terminologiewerkzeuge integrierte Systeme Anwendungsgebiete technische Dokumentation, insb. Großindustrie Behörden, insb. EU (derzeit 11 Amtssprachen) Lokalisationsindustrie

Maschinengestützte Übersetzung: kleine Übersetzungsbüros Lokalisationsindustrie Drei Arten von Systemen automatischer Übersetzung 1. Direkter Ansatz (Lexikon + endliche Automaten) 2. Indirekter Ansatz/Transfer Ansatz (Transformationen) 3. Indirekter Ansatz/ Interlingua Ansatz (Übersetzung und Generierung aus abstrakter semantischer Struktur)

Transfer und Interlingua „Pyramide“ Interlingua / Wissensrepräsentation Semantik Analyse Generierung Transfer Syntax Lexikon direkte Übersetzung Quelltext Zieltext

Translation Memory Systeme Grundprinzip: Recycling korrekter Übersetzungen I. d. R. satzbasierte Arbeitsweise: Abspeicherung von Satzpaaren aus Ausgangs- und Zielsprache Interaktiver Arbeitsprozess: Für jeden Satz der Ausgangssprache werden geeignete Entsprechungen im Satzarchiv gesucht Funktionsweise: Ähnlichkeitsfunktion für Sätze der Ausgangssprache Verwandtschaft mit named entity recognition: Typische Platzhalter wie Namen, Datums- und Zeitangaben sollen bei der Ähnlichkeitsanalyse erkannt werden Systemvorschläge für Sätze nur sinnvoll ab einer bestimmten Mindestähnlichkeit (i. d. R. konfigurierbar).

Kritische Würdigung Transfer-Systeme sind reif für den praktischen Einsatz Beschränkung auf eingeschränktes Vokabular und eingeschränkte Syntax erforderlich Erweiterung auf neue Sprachpaare, Lexika oder grammatische Strukturen aufwändig Nur bedingt Nutzung bestehender Sprachressourcen wie bilingualer Texte oder Wörterbücher

Modell zur automatischen Übersetzung Q U E L L T E X T Textdatei öffnen direkt eingeben über Zwischen-ablage einfügen    Eingabe Quelltext ggf. überarbeiten   Optionen Datei direkt übersetzen Übersetzungsweise Lexikon... Lexikon bearbeiten... F11 Schriftarten... Übersetzung steuern Übersetzen Benutzerlexikon bearbeiten Ausgabe Übersetzung ggf. überarbeiten   Deutsch-Engl. Lexikon Wort   in Textver-arbeitung kopieren   in Textdatei speichern Z I E L T E X T

Direktes Übersetzungsverfahren Quell- sprachen- Eingabe morpho- logische Analyse bilinguales Wörterbuch lokale Umstellung Ziel- Ausgabe (1) My trebuem mira. We require world. „We want peace.“ (2) Nam nuzno mnogo uglja, zeleza, elektroenergij. Tu us much coal is necessary, gland, electric power. „We need a lot of coal, iron and electricity. (3) Vcera my tselyi cas katalis‘ na lodke. Yesterday we the entire hour rolles themselves on a boat. „Yesterday we went out boating for a whole hour.“

Transfermodell mit zwei Sprachenpaaren Analyse französisch Transfer französisch-englisch Generierung englisch Analyse englisch Transfer englisch-französisch Generierung französisch

Modell mit sechs Sprachenpaaren ( im Allgemeinen n ( n - 1 ) Sprachmodule ) Transfer englisch-deutsch Analyse englisch Generierung deutsch Transfer französisch-deutsch Transfer englisch-französisch Analyse französisch Generierung französisch Transfer deutsch-französisch Analyse deutsch Generierung englisch Transfer französisch-englisch Transfer deutsch-englisch

Interlingua - Modell mit sechs Sprachenpaaren Analyse englisch Generierung englisch INTERLINGUA Analyse französisch Generierung französisch Analyse deutsch Generierung deutsch