SYSTRAN Information and translation technologies.

Slides:



Advertisements
Ähnliche Präsentationen
Nachweis digitaler Sammlungen im Kulturbereich M I C H A E L.
Advertisements

Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Wahlpflichtfach Französisch an der Realschule Oberwesel
Semantik und Wissensrepräsentation
Grundstudiumspraktikum “Maschinelle Übersetzung”
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Möglichkeiten und Grenzen des Automatisches Übersetzens
Prosodie unterhalb des Wortes
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/4 Manuelle Verfahren Klassifizierung Hier werden Dokumente in ein fest vorgegebenes System.
Flaches Parsing mit endlichen Automaten Referat und Implementierung Jutta Jäger
Integrierte Übersetzungsprozesse
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Anwendungen. © Prof. T. Kudraß, HTWK Leipzig Historie des WWW Grundlage Internet – Entwickelt Ende der 60er Jahre vom US-Militär (ARPA-Net) – Technische.
Explizite und editierbare Metainformationen für Software Muster.
Semantisch gestützte Suche im Internet
Was ist Lemmatisierung und wie wird sie maschinell durchgeführt?
NPGrammar NPGrammar. Nominalphrasenextraktion.
Sprachen im Internet von Julia Mai Gliederung Verschiedene Formen: 1. Ausländische Websites (.ch,.fr,.uk,.it) 2. Online-Wörterbücher 3. Automatische.
Diplomarbeitsvortrag Ontologien, Information Extraction und Information Retrieval – eine Synthese Marcus Heidmann in Zusammenarbeit mit AIFB &
Morphologiesystem MORPHY Für Deutsche Sprache:
Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen.
Grundelemente der Dependenzsyntax
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Die formalen Sprachen bei ETAP
Überblick Software Bestellungsver- waltungsprozess Dialogmanagement Simulation Sprachverarbeitung Verschiedene Arbeitsphasen Routengraphen Sprachverarbeitung:
Wo spricht man Deutsch?.
Knowledge Discovery mit Wordnet und Alembic Workbench
Grammatik: Satzbau und Wortbildung
Internet - Grundkurs - Einführung1 Inhalte Einführung in das Internet Zugang zum Internet Wie funktioniert das Internet? Das Programmpaket Internet Explorer.
Rechtliche Grundlagen
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Rechtliche Grundlagen
Diplomarbeit Magdalena Kaiser Karl-Franzens Universität Graz Mai 2010
Französisch-Slawische Korpuslinguistik Французско- славянская корпусная лингвистика Aigner Ruth Prenn Linde SE Korpuslinguistik O. Univ.-Prof. Dr. Branko.
Abteilung für automatische Sprachverarbeitung
Grammatik auf Deutsch.
Satzsemantik Verben, Aktionsarten und semantische Rollen -
Vorstellung: Personal Translator März 2007 Herzlichen Dank für die Einladung!
Übung zu Einführung in die LDV I
Die Lateinische Sprache
Quellen: Internet INTRANET Ausarbeitung von Sven Strasser und Sascha Aufderheide im Modul Netzwerktechnik, Klasse INBS Mai 2003.
Englisch Russisch Deutsch Italienisch Französisch
Kontrastive Untersuchung von Präpositionen (D-Fr)
Länder und Sprachen.
Theoretischer Hintergrund Systematische Wortschatzarbeit –
Tasks UNDERSTAND KNOW COMPREHEND know comprehend understandit ž, n, d, c, r, s, t, a, n, d w, t žn dcr stan dwt [žn] – [dcr] – [stan] – [dwt] SELECTION.
Die Länder, die Deutschen leben. Die Länder, die man Deutsch als Offiziell spricht. Außer den West-Europa spricht man Deutsch in der USA, Südafrika, Asian,
Welche Sprache sprichst du?
Online-Wörterbücher LEO "Link Everything Online"
Datenbanken im Web 1.
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
SPRACHEN.
LFG als Interlingua in der maschinellen Übersetzung
Tanja Eder Slawische Korpuslinguistik Prof. Tosovic, SS 2006 Lexikalische Datenbanken WordNet – RussNet EuroWordNet und Global WordNet Association.
Michael Waltisberg Moderne arabische Schriftsprache III Lektion 27.
Deutsche zusammengesetze Wörter
Nominationsprozesse in der polylingualen Welt. Olena Sydorenko Mariupol - Ukraine Darmstadt September 2015.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
GBIF NODES Committee Meeting Kopenhagen, Dänemark 4. Oktober 2009 Das GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer für.
Lerndesignarbeit: WAS – WIE sichtbarmachen – WER – WIE - Das Ziel ist das Ziel. Viele Wege führen nach Rom. Lern- & Lehr- prozesse vom Ende her ZIEL START.
Bildungs- und Fachsprache: Beispiele
Bildungs- und Fachsprache: Beispiele
Referat von Anna Schotterer, Julia Zeller und Lisa Breis
Recherche im Internet Was suche ich? Wo suche ich? Wie suche ich?
Bildungs- und Fachsprache: Beispiele
Bildungs- und Fachsprache: Beispiele
Partizpialkonstruktionen
 Präsentation transkript:

SYSTRAN Information and translation technologies

SYSTRAN Information and translation technologies Entwicklungsgeschichte Ende 1950 – Peter Toma entwickelt GAT System 1962 Toma arbeitet an Übersetzungssystemen für Atomwirtschaft und Medizin 1964Toma entwickelt Systran (SystemTranslation) Russisch-Englisch 1970Einsatz von Systran bei der US Air Force

SYSTRAN Information and translation technologies Entwicklungsgeschichte 1974/75 Systran arbeitet für das Apollo-Projekt der UDSSR und USA 1975Vorstellung eines Prototyps Englisch-Französisch bei der EG 1975/76 Vertrag mit der EU zur Entwicklung neuer Programmversionen für europäische Sprachen 1976Systran ersetzt das bei Euratom (European Atomic Energy Community) verwendete Übersetzungssystem

SYSTRAN Information and translation technologies Entwicklungsgeschichte 1980er Jahre Übernahme der mit Systran beschäftigten Unternehmen durch Gachot (Frankreich) 1990er Jahre Systran entwickelt Übersetzungs- Software für PCs 1998Systran und Altavista starten ersten computer-basierten Übersetzungsservice im Internet

SYSTRAN Information and translation technologies Systemgrundlagen Systemprogramme - Maschinencode (Assembler Code) - unabhängig von einer bestimmten Spache - technische Grundstruktur des Übersetzungsprogramms (zuständig z.B. für die Routine des Nachschlagens im Wörterbuch)

SYSTRAN Information and translation technologies Systemgrundlagen Übersetzungsprogramme - arbeiten mit einzelnen Programmodulen - einige Module sind unabhängig von bestimmten Sprachpaaren z.B. die Analyse- und Generierungsprogramme arbeiten mit jeder Quell- bzw. Zielsprache gleich

SYSTRAN Information and translation technologies Systemgrundlagen komplexe, bilinguale Wörterbücher - Idiomwörterbuch (Idiom dictionary) - begrenztes semantisches Wörterbuch - Wörterbuch der Homographe - begrenztes semantisches Konditional-Wörterbuch

SYSTRAN Information and translation technologies Übersetzungsprozess Präpositions- übersetzung Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Homographische Auflösung Phrasen- & Fall- Erkennung Vorbereitungs-Prozess Analyse Synthese Übertragung Morphologie- Generierung Lexikalische Routinen Primäre syntaktische Relationen Komposita- Erkennung Konditional- Idiome Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Wort- Übersetzung Syntaktische Umstellung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Homo- graphisches Wörterbuch Begrenztes semantisches Konditional - Wörterbuch

SYSTRAN Information and translation technologies Vorbereitungprozess Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Komposita- Erkennung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Text einlesen Formatierung identifizieren

SYSTRAN Information and translation technologies Vorbereitungprozess Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Komposita- Erkennung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Nachschlagen von Redewendungen invariante Ausdrücke identifizieren und Kategorien zuordnen

SYSTRAN Information and translation technologies Vorbereitungprozess Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Komposita- Erkennung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Nachschlagen im Hauptwörterbuch Identifizieren aller noch nicht zugeordneten Wörter

SYSTRAN Information and translation technologies Vorbereitungprozess Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Komposita- Erkennung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Morphologische Analyse Identifikation von Kombinationen {Wortstamm Endung}

SYSTRAN Information and translation technologies Vorbereitungprozess Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Komposita- Erkennung Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Identifizieren komplexer Nomen im Wörterbuch alle Ausdrücke, die im Wörterbuch auftauchen, werden als Komposita behandelt

SYSTRAN Information and translation technologies Analyse Homographische Auflösung Homo- graphisches Wörterbuch Phrasen- & Fall- Erkennung Primäre syntaktische Relationen Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Kategorisierung der Adjektive Bei Unentscheidbarkeit Überprüfung des nahen grammatikalischen Kontextes

SYSTRAN Information and translation technologies Analyse Homographische Auflösung Phrasen- & Fall- Erkennung Primäre syntaktische Relationen Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Homo- graphisches Wörterbuch Identifizierung von Sätzen und Phrasen durch Suche nach Satzzeichen, Konjugationen, Relativpronomen, etc. Satzanfang und -ende werden markiert

SYSTRAN Information and translation technologies Analyse Homographische Auflösung Phrasen- & Fall- Erkennung Primäre syntaktische Relationen Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Homo- graphisches Wörterbuch Identifizierung der syntaktischen Hauptrelationen sowie Zeit-Informationen, Negation, Komparative, Superlative Identifizierung des finiten Verbs

SYSTRAN Information and translation technologies Analyse Homographische Auflösung Phrasen- & Fall- Erkennung Primäre syntaktische Relationen Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Homo- graphisches Wörterbuch Identifizierung von koordinierten Strukturen in Sätzen Bei Unentscheidbarkeit Rückgriff auf semantische Informationen Mit Aufzählungen verwandte Wörter werden identifiziert

SYSTRAN Information and translation technologies Analyse Homographische Auflösung Phrasen- & Fall- Erkennung Primäre syntaktische Relationen Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Homo- graphisches Wörterbuch Subjekt und Prädikat werden identifiziert Sätze werden als Deklarativ-, Interrogativ- oder Imperativ-Sätze markiert

SYSTRAN Information and translation technologies Übertragung Präpositions- übersetzung Lexikalische Routinen Konditional- Idiome Begrenztes semantisches Konditional - Wörterbuch Lexikalische Übertragung der 'Konditional- Redewendungen' Aus Grundlage syntaktischer Beziehungen wie { Adjektiv Nomen } etc.

SYSTRAN Information and translation technologies Übertragung Präpositions- übersetzung Lexikalische Routinen Konditional- Idiome Begrenztes semantisches Konditional - Wörterbuch Übersetzung von Präpositionen, (soweit nicht schon bearbeitet) Referiert auf Wörterbuchinformationen Zuordnung zu den Verbformen und/oder Bindung an Regens- oder Dependenzwörter

SYSTRAN Information and translation technologies Übertragung Präpositions- übersetzung Lexikalische Routinen Konditional- Idiome Begrenztes semantisches Konditional - Wörterbuch Strukturelle Übertragung, wobei lexikalische Routinen benutzt werden

SYSTRAN Information and translation technologies Synthese Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Homo- graphisches Wörterbuch Morphologie- Generierung Wort- Übersetzung Syntaktische Umstellung Begrenztes semantisches Konditional - Wörterbuch Zuweisung der Standard-Übersetzung, wenn bis dahin keine andere Übersetzung gefunden wurde.

SYSTRAN Information and translation technologies Synthese Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Homo- graphisches Wörterbuch Morphologie- Generierung Wort- Übersetzung Syntaktische Umstellung Begrenztes semantisches Konditional - Wörterbuch Morphologische Generierung auf Grundlage von Struktur-Informationen

SYSTRAN Information and translation technologies Synthese Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Homo- graphisches Wörterbuch Morphologie- Generierung Wort- Übersetzung Syntaktische Umstellung Begrenztes semantisches Konditional - Wörterbuch Generierung der Wortstellung innerhalb des Satzes in der Zielsprache

SYSTRAN Information and translation technologies Übersetzungsprozess Idiom- Wörterbuch Begrenztes semantisches Wörterbuch Haupt- Wörterbuch Homo- graphisches Wörterbuch Präpositions- übersetzung Morphologische Analyse Eingabe-Prä- Prozessor Nachschlagen im... Homographische Auflösung Phrasen- & Fall- Erkennung Vorbereitungs-Prozess Analyse Synthese Übertragung Morphologie- Generierung Lexikalische Routinen Primäre syntaktische Relationen Komposita- Erkennung Konditional- Idiome Stuktur- Koordination Subjekt-/ Prädikaten- Erkennung Wort- Übersetzung Syntaktische Umstellung Begrenztes semantisches Konditional - Wörterbuch

SYSTRAN Information and translation technologies Sprachpaare französisch deutsch spanisch italienisch portugiesisch griechisch holländisch deutsch spanisch italienisch portugiesisch griechisch holländisch englisch französisch Verfügbar In Planung Westeuropa (für SYSTRAN Personal 4.o)

SYSTRAN Information and translation technologies Sprachpaare z.Z. alle nur für WEB-Server-Version 4.1 verfügbar Osteuropa & Asien (für SYSTRAN Personal 4.o) alle in Planung englisch russisch vereinfachtes chinesischisch japanisch traditionelles chinesischisch koreanisch

SYSTRAN Information and translation technologies SYSTRAN im Internet