Geschichte der Maschinellen Übersetzung

Slides:



Advertisements
Ähnliche Präsentationen
Statistische Aspekte der PSG
Advertisements

ALGOL ALGOrithmic Language.
Wissensanalyse von Aufgaben mit TKS Eine Methode zur Problemlösung
Der Roboter zum selber Bauen.
Seminar Textmining WS 06/07 Themen Übung 11 unsupervised vs. supervised Symbolfolgen, Kunstsprachen Page Rank.
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Möglichkeiten und Grenzen des Automatisches Übersetzens
Arbeits- und Präsentationstechniken 1 Teil A: Wissenschaftstheoretische Grundlagen Prof. Dr. Richard Roth WS 2011/2012 APT 1 Prof. Dr. Richard Roth.
Universität des Saarlandes Fachbereich Informatik Lehrstuhl Prof. Dr
Theoretische Informatik und Algorithmen Post und Kleene.
SIE wahren schon WEIT vor 1935 die ersten… AEG – ein echt deutscher Hersteller AEG-TELEFUNKEN – History Version 0.1; DE; 2010.
SIE wahren schon WEIT vor 1935 die ersten… AEG – ein echt deutscher Hersteller AEG-TELEFUNKEN – History Version 0.1; DE; 2010.
Java: Grundlagen der Sprache
Formale Sprachen – Mächtigkeit von Maschinenmodellen
Die Registervariablen: Tenor of Discourse
Philosophie der Logik nach Frege I
Datenbanken vs. Markup Manfred Thaller WS 2009/2010 Humanities Computing Linda Scholz.
GESCHICHTE DER INFORMATIK
Sprachkonstruktion I Konstruktion einer neuen Sprache Einladung zu einem Sprachexperiment Sie sind eingeladen, sich an einem Sprachexperiment zu beteiligen.
SYSTRAN Information and translation technologies.
Übersetzung durch Mensch und Maschine Einleitung Einleitung Entwicklungsgechichte der MÜ Entwicklungsgechichte der MÜ Entwicklungsphasen der MÜ Entwicklungsphasen.
handlungsorientierte Zugänge zur Algebra
Zhaohan Chen SS061 SIMULA-an Algol Based Simulation Language geschrieben von: Zhaohan Chen Betreuer: Prof. Dr. Rainer Manthey.
Computergestützte Übersetzung
Vorlesung Gestaltung von soziotechnischen Informationssystemen - RequirementsEngineering und Contextual Design- Thomas Herrmann, Lehrstuhl Informations-
Machine Learning Was wir alles nicht behandelt haben.
Internet (World Wide Web)
Grundlagen und Bildungsziele der Informatik in der Schule Wie auch andere Unterrichtsfächer muss sich die Informatik immer wieder legitimieren. Diese Aufgabe.
Knowledge Discovery mit Wordnet und Alembic Workbench
? Was ist Informatik? Was ist Informatik? Alexander Lange
Jette von Holst-Pedersen, Oktober, 2013
Entwicklung der Programmiersprachen
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Dynamische Programmierung mit Anwendung auf Sequence Alignment Problem
Anspruchsmerkmale und technische Äquivalente
Erfindervon Fuzzy Logic
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
In welchem Raum könnte für Sie ein Anliegen/Thema oder eine Lösung liegen ? In welchen Raum möchten Sie/sollten wir Fragen stellen? Systemisches Handeln.
MATHEMATISCHES DENKEN
Abteilung für automatische Sprachverarbeitung
Literatur Österreichs seit 1945
Künstliche Intelligenz
Philippe Blanchard Hans-Jürgen Eikmeyer Barbara Job Alexander Mehler Sprachliche Netzwerke texttechnologische Repräsentation computerlinguistische Synthese.
Wiss-Stadt Zentrum der Medizinischen Informatik, Klinikum der J.W.Goethe-Universität, © W.Giere 2001 Patient, Arzt und Wissenschaft Neue Möglichkeiten.
Die Geschichte der Entwicklung der Informations-Technologie
Methoden Die klassische Methode der Psycholinguistik (genauso wie der experimentellen Psychologie im Allgemeinen) ist die Messung von Reaktionszeiten.
2. Bereiche der maschinellen Bearbeitung von natürlichen Sprachen n n 1949 verschickt Warren Weaver, Direktor bei der Rockefeller Stiftung einen Aufruf.
Äquivalenz.
Agenten und Multi-Agenten-System
Mathematikunterricht mit Computern Einleitung: Von der EDV – Nutzung zur Medienvielfalt Karl Josef Fuchs, Universität Salzburg Johannes Kepler Universität.
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
Die Potsdamer Konferenz
Geschichte der Informatik
SS 2014 – IBB4B Datenmanagement Do 17:00 – 18:30 R Vorlesung #4 Überführung des ER-Modells in das relationale Modell.
LFG als Interlingua in der maschinellen Übersetzung
Lexikalische Semantik
Mathematik und Informatik: Eine Liebeserklärung
Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme
Das Internet Ein Netzwerk, das viele Rechner miteinander verbindet
Werkzeuge und Unterrichtsbeispiele Uwe Matthias Richter Universität Klagenfurt 30. Mai 2006.
Einführung in die Phonetik und Phonologie
+ Charles Babbage ( ). 2 + Kindheit und Werdegang Geboren 1791 in London als Sohn eines Bankers. War als Kind oft krank und hatte dadurch hauptsächlich.
Ü BERSETZUNGSPROZESS (Z IEL UND P HASEN DES Ü BERSETZUNGSPROZESSES ) Monika Ondejčíková Katarína Ochodnická 3. AJ-NJ (PaT)
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
ÜBERSETZUNGSWISSENSCHAFT URSACHEN VON ÜBERSETZUNGSVERFAHRE N.
Massen für die Literatur und andere Kunstmedien wer ist das Publikum und was erwartet es? Massenkultur – ihre Gesetze, ihre Kritik „Schreckbild der amorphen.
Geschichte der Maschinellen Übersetzung
Beispielfolien zu Kapitel 4 in
Beispielfolien zu Kapitel 4 in
 Präsentation transkript:

Geschichte der Maschinellen Übersetzung Einleitung Entwicklungsgeschichte der MÜ

Einleitung MÜ als Modellierung des Übersetzungsprozesse MÜ als Mechanisierung menschlicher Tätigkeit Hochqualitative vollautomatische Übersetzung Maschinelle Übersetzung mit menschlicher Intervention Maschinengestützte konventionelle Übersetzung Konventionelle Übersetzung durch Menschen

Übersetzen durch Mensch und Maschine human involvement mechanization fully automatic high quality translation (FAHQT) human-aided machine translation (HAMT) machine -aided human translation (MAHT) traditional human translation Computer-Assisted Translation (CAT)

Entwicklungsgeschichte der MÜ Ahnen Descartes, Leibniz (Wörterbücher auf der Grundlage eines universellen Zahlenkodes) Joh. J. Becher 1661 John Wilkins 1668 (Essay towards a Real Character and a Philosophical Language) Vorläufer George Artstruni 1933 Petr P. Smirnov-Trojanskij 1933 Pioniere Warren Weaver, Mathematiker, Translation (1949) Yehoshua Bar-Hillel, Logiker

Ahnen: Johannes Becher

Ahnen. Johannes Becher Kodierung

Ahnen: Johannes Becher Lexikon

Georges Artsouni (1933) Der Franco-Armenier Georges Artstruni entwarf 1933 eine Speichervorrichtung auf Papierband, mit der für ein beliebiges Wort die Entsprechung in einer anderen Sprache aufgefunden werden sollte. Sie wurde als Patent angemeldet und anscheinend wurde 1937 ein Prototyp dieser Vorrichtung vorgeführt.

Petr Smirnov-Troyanskii Die Vorschläge von Smirnov‑Troyanskij, ebenfalls als Patent angemeldet, waren aus heutiger Sicht weit bedeutsamer. Er sah drei Stadien der mechanischen Übersetzung vor Ein Editor, der nur die Ausgangssprache (AS) beherrschte sollte die 'logische' Analyse der Wörter im Ausgangstext (AT) in ihre Grundformen und syntaktischen Funktionen vornehmen. Die Maschine sollte Folgen von Grundformen und deren Funktionen in äquivalente Folgen in der Zielsprache (ZS) transformieren. Ein weiterer Editor, der nur die Zielsprache kannte sollte dann diesen Output in entsprechende normale Wortformen seiner eignen Sprache konvertieren. Troyanskij sah sowohl eine bilinguale als auch eine multilinguale Übersetzung vor. Obwohl sein Patent sich nur auf die Maschine bezog, die das zweite Stadium ausführte, glaubte Troyanskii, dass der Prozess der logischen Analyse selbst ebenfalls mechanisiert werden könne. Troyanskij war seiner Zeit weit voraus und war außerhalb Russlands unbekannt.

Petr Smirnov-Troyanskij Maschine Im Prinzip ebenfalls mechanisierbar Editor der AS Text als Folge von Grundformen der AS mit Funktionen Text in AS Editor der ZS Text als Folge von Grundformen der ZS mit Funktionen Text in ZS

Pioniere Nur wenige Jahre nach der Erfindung des Computers, wurde die Möglichkeit diskutiert, Computer für die automatische Übersetzung einzusetzen, und zwar zuerst 1947 von Warren Weaver von der Rockefeller Foundation und von Andrew D. Booth, einem britischen Kristallographen. Nach seiner Rückkehr an das Birkbeck College (London), erforschte Booth die Mechanisierung eines zweisprachigen Wörterbuchs und initiierte eine Zusammenarbeit mit Richard H. Richens (Cambridge), der unabhängig davon Lochkarten für die Erstellung von groben Wort-für-Wort-Übersetzungen von wissenschaftlichen Texten verwendet hatte.

Pioniere: Warren Weaver und Andrew Booth

Pioniere: Andrew Booth mit Frau

Weaver Memorandum Es war jedoch ein Memorandum von Warren Weaver vom Juli 1949, das die Idee einer MÜ allgemein bekannt machte (Weaver 1949). Er skizzierte die Erfolgsaussichten und schlug verschiedene Methoden vor: die Verwendung von im Krieg entwickelten Dechiffrier-Techniken, statistische Methoden, Shannons Informationstheorie, und die Erforschung der der Sprache zugrunde liegenden Logik und ihrer universellen Eigenschaften, 'the common base of human communication.‘

Weaver Memorandum Innerhalb weniger Jahre hatten an der Washington University (Seattle), der University of California (Los Angeles) und am Massachusetts Institute of Technology Forschungsarbeiten zur MÜ begonnen. Am MIT wurde auch im Jahre 1951 der erste Forscher ernannt, der sich hauptamtlich mit MÜ beschäftigte: Yehoshua Bar‑Hillel. Ein Jahr später rief er die erste MÜ-Konferenz zusammen, wo die Grundzüge der zukünftigen Forschungsaktivitäten herauskristallisierten. Es gab Vorschläge zur Behandlung der Syntax von Oswald und Bar­Hillel (seine Kategorialgrammatik), Vorschläge, den Ausgangstext in einer MÜ‑orientierten restringierten Sprache abzufassen bzw. zu bearbeiten, und Argumente für die Konstruktion von Subsprachensystemen. Es war offensichtlich, dass eine vollautomatische Übersetzung ohne langfristig angelegte Grundlagenforschung nicht möglich ist, und dass man in der Zwischenzeit ohne menschliche Intervention nicht auskommen konnte. Der Einsatz von Menschen war erforderlich, um entweder die Ausgangstexte für die Übersetzung aufzubereiten oder um den Output zu redigieren (damals schon bekannt als pre‑ und postediting).

MÜ und die Achterbahn der Geschichte

Entwicklungsgeschichte der MÜ Schneller Aufstieg und Ernüchterung Erste Konferenz über MÜ 1952 am MIT Georgetown University Experiment 1954 Übersetzungssysteme der ersten Generation ALPAC und seine Folgen Automatic Language Processing Advisory Committee (ALPAC) Bericht 1966 Konsolidierung Übersetzungssysteme der 2. Generation

Machine Translation Conference, Princeton Inn, July 1960

Association for Machine Translation and Computational Linguistics, Denver, Colorado, August 1963

Pioniere: Victor H. Yngve und Anthony G. Oettinger

Peter Toma: Erster Entwickler von Systran

Entwicklungsphasen Computerwissenschaft Computerlinguistik Künstliche Intelligenz Corpuslinguistik

Entwicklungsphasen: Computerwissenschaft MÜ als ingenieurwissenschaftliches Problem lokal begrenzter empirischer Ansatz linguistische Naivität verknüpft mit trickreicher Programmierung fehlende Modularität keine Trennung zwischen linguistischen Daten (Lexikon & Grammatik) und Verarbeitungsalgorithmen

Entwicklungsphasen: Computerlinguistik Zunehmende "Linguistisierung" MÜ primär als computerlinguistisches Problem Maximale Unabhängigkeit von Analyse und Synthese (Modularität) Maximale Trennung von linguistischen Daten und Algorithmen Indirekte Übersetzungsverfahren durch Stratifizierung und Transfer, evtl. Interlingua

Entwicklungsphasen: Künstliche Intelligenz Berücksichtigung von Hintergrundwissen Kontext kognitive Schemata Weltwissen

Typische Architekturen von MÜ Systemen Direkte Übersetzung Transfer-basierte Übersetzung Interlingua-basierte Übersetzung