Geschichte der Maschinellen Übersetzung

Slides:



Advertisements
Ähnliche Präsentationen
Statistische Aspekte der PSG
Advertisements

Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung
Der Roboter zum selber Bauen.
Arbeits- und Präsentationstechniken 1 Teil A: Wissenschaftstheoretische Grundlagen Prof. Dr. Richard Roth WS 2011/2012 APT 1 Prof. Dr. Richard Roth.
SIE wahren schon WEIT vor 1935 die ersten… AEG – ein echt deutscher Hersteller AEG-TELEFUNKEN – History Version 0.1; DE; 2010.
GESCHICHTE DER INFORMATIK
Geschichte der Maschinellen Übersetzung
SYSTRAN Information and translation technologies.
Übersetzung durch Mensch und Maschine Einleitung Einleitung Entwicklungsgechichte der MÜ Entwicklungsgechichte der MÜ Entwicklungsphasen der MÜ Entwicklungsphasen.
Computergestützte Übersetzung
Vorlesung Gestaltung von soziotechnischen Informationssystemen - RequirementsEngineering und Contextual Design- Thomas Herrmann, Lehrstuhl Informations-
Machine Learning Was wir alles nicht behandelt haben.
Knowledge Discovery mit Wordnet und Alembic Workbench
? Was ist Informatik? Was ist Informatik? Alexander Lange
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
Künstliche Intelligenz
Methoden Die klassische Methode der Psycholinguistik (genauso wie der experimentellen Psychologie im Allgemeinen) ist die Messung von Reaktionszeiten.
Agenten und Multi-Agenten-System
Die Potsdamer Konferenz
Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme
40 Tage – Leben mit Vision Rick Warren. Rick Warren Ließ sich nach seinem Studium südlich von Los Angeles im Saddleback-Valley nieder, um eine neue Gemeinde.
Ü BERSETZUNGSPROZESS (Z IEL UND P HASEN DES Ü BERSETZUNGSPROZESSES ) Monika Ondejčíková Katarína Ochodnická 3. AJ-NJ (PaT)
Patrick Richterich Lattwein GmbH Web Services Softwareentwicklung mit SOAP.
Thema und Fragestellung Kinder und Jugendliche erfahren in ihrer schulischen Laufbahn früher oder später das Erlernen einer Fremdsprache. Im bildungspolitischen.
Institut für Verkehrssystemtechnik Dipl.-Psych. David Käthner Telefon:0531 / Ein kognitives Fahrermodell:
Zehn Schritte zu Linux Der Weg in eine andere Welt...
GÜM Traditionelle Methode. GÜM » Der Ursprung der tradidionellen Methode, in Deutschland als Grammatik- Übersetzungsmethode (GÜM) bekannt, ist der Lateinunterricht,
Geschichte von Wahlmaschinen Stefan Bethge. Wahlen in der Antike Griechenland: Scherbengericht Kleroterion Venedig: Los-Wahl.
Projekt mobile Zeiterfassung für DATEV Anwalt Pro AdvoTools GmbH …make good things even better.
Tobias Sammet 8DY1 Programmieren Tobias Sammet 8DY2 Programmierung ● = das Schreiben eines Computerprogramms ● Dient zur Lösung eines.
Valentin N. Volonšinov Marxismus und Sprachphilosophie Grundlegende Probleme der soziologischen Methode in der Sprachwissenschaft 1. Teil: Die Bedeutung.
1 Das Dilemma des Architekten Ziel: ein gut designtes System, welches mit zukünftigen Anforderungen umgehen kann, ohne dass es zu Einschränkungen in der.
LERNT FREMDSPRACHEN Auf unserem Planeten gibt es ca verschiedene Sprachen und lokale Dialekte.
Alfred Wegener und seine Theorie
Выполнил: учитель иностранного языка Крамаренко Марина Анатольевна
Network for Educational Technology
Sozialwissenschaften
Programmieren und Problemlösen
Fachrichtung Theoretische Informatik
Infrastruktur - Digitalisierung Datenschutz
Gender Monitoring Anteile von Frauen und Männern in den Statusgruppen der RWTH Aachen University Stand: von 14.
1 Einführung in die Statistik
Wisdom of Crowds und Spiele
CPU Furkan Dogan.
„Virtueller Seminarraum“ - SS 2003 Laborprojekt / Forschungsprojekt
Vorlesung #4 Überführung des ER-Modells in das relationale Modell
Vorlesung zur Einführung in die Sprachwissenschaft
Historischer Hintergrund der Landwirtschaft
1.
Friederike Kleinfercher Abteilung Forschung und Entwicklung
Konzepte von Terminologie-Datenbanken
Mensch-Maschine-Interaktion
Wir sprechen Ihre Sprache.
10 Statistisches Schätzen
Digitaler Wandel – Chance oder Risiko
in Word 5 neue Arbeitsweisen Mit jedem zusammenarbeiten, überall
Wie werden Wörter in Wörterbüchern definiert?
Inhalt Sprachanwendungen
«Delegierter» Methoden Schablone Funktionszeiger
Vergleich von Terminologie-Datenbanksystemen
Robin App User manual - Deutsch
Eine Begriffserklärung
Von Wietlisbach, Lenzin und Winter
Beispielfolien zu Kapitel 4 in
IBM Software Cincom Systems Erwartete 20-prozentige Verkürzung der Markteinführungszeit mit dem IBM WebSphere Liberty-Profil Die Anforderung: Das für.
Beispielfolien zu Kapitel 4 in
05. – 07. September 2019 Titel 05. – 07. September 2019
Terminologie-Extraktion
Dies ist ein wissenschaftliches Poster – Im Format DIN A0 hoch.
 Präsentation transkript:

Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Einleitung MÜ als Modellierung des Übersetzungsprozesse MÜ als Mechanisierung menschlicher Tätigkeit Hochqualitative vollautomatische Übersetzung Maschinelle Übersetzung mit menschlicher Intervention Maschinenegestützte konventionelle Übersetzung Konventionelle Übersetzung durch Menschen

Übersetzen durch Mensch und Maschine human involvement mechanization fully automatic highquality translation (FAHQT) human-aided machine translation (HAMT) machine -aided human translation (MAHT) traditional human translation Computer-Assisted Translation (CAT)

Entwicklungsgeschichte der MÜ Ahnen Descartes, Leibniz (Wörterbücher auf der Grundlage eines universellen Zahlenkodes) Joh. J. Becher 1661 John Wilkins 1668 (Essay towards a Real Character and a Philosophical Language) Vorläufer George Artstruni 1933 Petr P. Smirnov-Trojanskij 1933 Pioniere Warren Weaver, Mathematiker, Translation (1949) Yehoshua Bar-Hillel, Logiker

Ahnen: Johannes Becher

Ahnen. Johannes Becher Kodierung

Ahnen: Johannes Becher Lexikon

Georges Artsouni (1933) Der Franco-Armenier Georges Artstruni entwarf 1933 eine Speichervorrichtung auf Papierband, mit der für ein beliebiges Wort die Entsprechung in einer anderen Sprache aufgefunden werden sollte. Sie wurde als Patent angemeldet und anscheinend wurde 1937 ein Prototyp dieser Vorrichtung vorgeführt.

Petr Smirnov-Troyanskii Die Vorschläge von Smirnov‑Troyanskij, ebenfalls als Patent angemeldet, waren aus heutiger Sicht weit bedeutsamer. Er sah drei Stadien der mechanischen Übersetzung vor Ein Editor, der nur die Ausgangssprache (AS) beherrschte sollte die 'logische' Analyse der Wörter im Ausgangstext (AT) in ihre Grundformen und syntaktischen Funktionen vornehmen. Die Maschine sollte Folgen von Grundformen und deren Funktionen in äquivalente Folgen in der Zielsprache (ZS) transformieren. Ein weiterer Editor, der nur die Zielsprache kannte sollte dann diesen Output in entsprechende normale Wortformen seiner eignen Sprache konvertieren. Troyanskij sah sowohl eine bilinguale als auch eine multilinguale Übersetzung vor. Obwohl sein Patent sich nur auf die Maschine bezog, die das zweite Stadium ausführte, glaubte Troyanskii, dass der Prozess der logischen Analyse selbst ebenefalls mechanisiert werden könne. Troyanskij war seiner Zeit weit voraus und war ausserhalb Russlands unbekannt.

Petr Smirnov-Troyanskij Maschine Im Prinzip ebenfalls mechanisierbar Editor der AS Text als Folge von Grundformen der AS mit Funktionen Text in AS Editor der ZS Text als Folge von Grundformen der ZS mit Funktionen Text in ZS

Pioniere Nur wenige Jahre nach der Erfindung des Computers, wurde die Möglichkeit diskutiert, Computer für die automatische Übersetzung einzusetzen, und zwar zuerst 1947 von Warren Weaver von der Rockefeller Foundation und von Andrew D. Booth, einem britischen Kristallographen. Nach seiner Rückkehr an das Birkbeck College (London), erforschte Booth die Mechanisierung eines zweisprachigen Wörterbuchs und initierte eine Zusammenarbeit mit Richard H. Richens (Cambridge), der unabhängig davon Lochkarten für die Erstellung von groben Wort-für-Wort-Übersetzungnen von wissenschaftlichen Texten verwendet hatte.

Pioniere: Warren Weaver und Andrew Booth

Pioniere: Andrew Booth mit Frau

Weaver Memorandum Es war jedoch ein Memorandum von Warren Weaver vom Juli 1949, das die Idee einer MÜ allgemein bekannt machte (Weaver 1949). Er skizzierte die Erfolgsaussichten und schlug verschiedene Methoden vor: die Verwendung von im Krieg entwickleten Dechiffrier-Techniken, statistische Methoden, Shannon's Informationstheorie, und die Erforschung der der Sprache zugrunde liegenden Logik und ihrer universellen Eigenschaften, 'the common base of human communication.‘

Weaver Memorandum Innerhalt weniger Jahre hatten an der Washington University (Seattle), der University of California (Los Angeles) und am Massachusetts Institute of Technology Forschungsarbeiten zur MÜ begonnen. Am MIT wurde auch im Jahre 1951 der erste Forscher ernannt, der sich hauptamtlich mit MÜ beschäftigte: Yehoshua Bar‑Hillel. Ein Jahr später rief er die erste MÜ-Konferenu zusammen, wo die Grundzüge der zukünftigen Forschungsaktivitäten herauskristallisierten. Es gab Vorschläge zur Behandlung der Syntax von Oswald und Bar­Hillel (seine Kategorialgrammatik), Vorschläge, den Ausgangstext in einer MÜ‑orientierten restringierten Sprache abzufassen bzw. zu bearbeiten, und Argumente für die Konstruktion von Subsprachensystemen. Es war offensichtlich, dass eine vollautomatische Übersetzung ohne langfristig angelegte Grundlagenforschung nicht möglich ist, und dass man in der Zwischenzeit ohne menschliche Intervention nicht auskommen konnte. Der Einsatz von Menschen war erfordlerlich, um entweder die Ausgangstexte für die Übersetzung aufzubereiten oder um den Output zu redigieren (damals schon bekannt als pre‑ und postediting).

MÜ und die Achterbahn der Geschichte

Entwicklungsgeschichte der MÜ Schneller Aufstieg und Ernüchterung Erste Konferenz über MÜ 1952 am MIT Georgetown University Experiment 1954 Übersetzungssysteme der ersten Generation ALPAC und seine Folgen Automatic Language Processing Advisory Committee (ALPAC) Bericht 1966 Konsolidierung Übersetzungssysteme der 2. Generation

Machine Translation Conference, Princeton Inn, July 1960

Association for Machine Translation and Computational Linguistics, Denver, Colorado, August 1963

Pioniere: Victor H. Yngve und Anthony G. Oettinger

Peter Toma: Erster Entwickler von Systran

Entwicklungsphasen Computerwissenschaft Computerlinguistik Künstliche Intelligenz Corpuslinguistik

Entwicklungsphasen: Computerwissenschaft MÜ als ingenieurwissenschaftliches Problem lokal begrenzter empirischer Ansatz linguistische Naivität verknüpft mit trickreicher Programmierung fehlende Modularität keine Trennung zwischen linguistischen Daten (Lexikon & Grammatik) und Verarbeitungsalgorithmen

Entwicklungsphasen: Computerlinguistik Zunehmende "Linguistisierung" MÜ primär als computerlinguistisches Problem Maximale Unabhängigkeit von Analyse und Synthese (Modularität) Maximale Trennung von linguistischen Daten und Algorithmen Indirekte Übersetzungsverfahren durch Stratifizierung und Transfer, evtl. Interlingua

Entwicklungsphasen: Künstliche Intelligenz Berücksichtigung von Hintergrundwissen Kontext kognitive Schemata Weltwissen

Typische Architekturen von MÜ Systemen Direkte Übersetzung Transfer-basierte Übersetzung Interlingua-basierte Übersetzung