LFG als Interlingua in der maschinellen Übersetzung

Slides:



Advertisements
Ähnliche Präsentationen
Kulturtransfer und Translation Einige Begriffe – Einige Anwendungen
Advertisements

Vorlesung Compilertechnik Sommersemester 2008
Semantik und Wissensrepräsentation
Lexikalisch-Funktionale-Grammatik
Objektorientierte Datenbanken
Gliederung 1. Grundlagen der Bottom-Up-Syntaxanalyse
Linguistische Grundlagen
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Art der Arbeit (Projekt-/Studien-/Diplomarbeit/
Friedhelm Meyer auf der Heide 1 HEINZ NIXDORF INSTITUT Universität Paderborn Algorithmen und Komplexität Grammatiken beschreiben Sprachen L µ *, indem.
Kapitel 4 Syntaktische Analyse: LR Parsing.
Maschinelle Übersetzung I
On a Buzzword: Hierachical Structure David Parnas.
Parser generieren Yet Another Compiler – Compiler YACC.
FH-Hof Grammatiken Richard Göbel. FH-Hof Begriffe Eine Grammatik definiert die Struktur (Syntax) einer Zeichenkette Eine Grammatik definiert nicht die.
Philosophie der Logik nach Frege I
Flaches Parsing mit endlichen Automaten Referat und Implementierung Jutta Jäger
Sprachwissenschaftliches Institut Einführung in die HPSG Grammatiktheorie 4./11. Mai 2004.
SYSTRAN Information and translation technologies.
Lexikalisch-Funktionale-Grammatik
Lexikalisch-Funktionale Grammatik
Teil 3 Grammatikmodelle
Teil 8 Lexical Functional Grammar Einführung
1 Grundlagen und Anwendung der Extensible Markup Language (XML ) Peter Buxmann Institut für Wirtschaftsinformatik Johann Wolfgang Goethe-Universität Frankfurt.
CIDOC CRM aus der Sicht von Ontologienutzern. CIDOC CRM - (Formale) Ontologie für die Dokumentation in den Kulturwissenschaften – ISO 21127: A Reference.
IMSLex – ein NLP Lexikon
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Überblick Software Bestellungsver- waltungsprozess Dialogmanagement Simulation Sprachverarbeitung Verschiedene Arbeitsphasen Routengraphen Sprachverarbeitung:
Zwischen Geeks,Trolls, Nerds und Lurkern (Herausforderungen für die Schule der digital natives)
Eignung von Grammatik-basiertem Layout für grafische Programmiersprachen Seminar Layout-Algorithmen für Graphen Institut für Informatik Christian-Albrechts.
Jette von Holst-Pedersen, Oktober, 2013
Project Perseus Der volle Projektname lautet Perseus Digital Library Project. Das Projekt begann in 1985 als Experiment zur Digitalisierung von Bibliotheken.
Perfektion ist eine Lüge, Perfection is a lie, die auch irgendwie wichtig ist. That is also somehow important. Jeder, der nach ihr strebt, Everyone who.
Adjectives provide additional information about nouns and pronouns.
CEF 2001, New Haven Genetic Neural Fuzzy Explorer GENEFER Konzeption, Technologien und Einsatzmöglichkeiten Eric Ringhut Muenster Institute for Computational.
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
AE Goldberg, Trends in Cognitive Sciences 2003
You need to use your mouse to see this presentation © Heidi Behrens.
Diplomverteidigung Ulrich Dinger Thema: Untersuchung und Entwicklung von Ansätzen und Techniken zur Realisierung einer (Web) Service Language.
Passiv What are these sentences expressing?
Äquivalenz.
Research-guided Teaching Representation in the Biology Curriculum.
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
Literary Machines, zusammengestellt für ::COLLABOR:: von H. Mittendorfer Literary MACHINES 1980 bis 1987, by Theodor Holm NELSON ISBN
Lexikalisch-Funktionale-Grammatik  Formaler Aufbau der F-Strukturen  Funktionale Beschreibungen  Funktionale Annotationen  Von der K-Struktur zur F-Struktur.
Merkmale und Merkmalstrukturen
Lexikalisch-Funktionale-Grammatik
Komponentenanalyse.
Lexikalische Semantik
Aufbau von Systemen Direkte Systeme Transfersysteme Interlinguasysteme
Rules of Play - Game Design Fundamentals by Katie Salen and Eric Zimmerman Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung.
What is a “CASE”? in English: pronouns, certain interrogatives
What is a “CASE”? in English: pronouns, certain interrogatives
type / function / form type of words:
Kapitel 4 Grammar INDEX 1.Ordinal Numbers 2.Relative Pronouns and Relative Clauses 3.Conditional Sentences 4.Posessive: Genitive Case.
Ü BERSETZUNGSPROZESS (Z IEL UND P HASEN DES Ü BERSETZUNGSPROZESSES ) Monika Ondejčíková Katarína Ochodnická 3. AJ-NJ (PaT)
On the case of German has 4 cases NOMINATIVE ACCUSATIVE GENITIVE DATIVE.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
Adjektiven und Adverbien Endungen. Das prädikativ gebrauchte Adjektiv Predicate adjectives follow the verbs sein, werden or bleiben. The modify the subject.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
CASES the full set including der die das ein eine ein pronouns
Grundlagen Englisch Passive voice HFW Bern.
Aspect-Oriented Programming: Fad or the Future
Students have revised SEIN and HABEN for homework
type / function / form type of words:
The Possessives.
Beispielfolien zu Kapitel 4 in
 Präsentation transkript:

LFG als Interlingua in der maschinellen Übersetzung Referat von Zuzana Pesselová am Mittwoch, den 05.02.2003

Typen der MÜ („designs“) direkte MÜ minimale Analyse transfer-basierte MÜ zunehmende Analyse kontrastive Basis interlingua-basierte MÜ maximale Analyse universelle Basis

Interlingua Ziel Eine Repräsentation soll Hierarchien von Substrukturen abbilden, dabei jedoch klare Zwischenbeziehungen zeigen. gewünschtes Ergebnis Eine Repräsentation des Textes, die unabhängig von einer Einzelsprache existiert (= Basis für die Generierung des zielsprachigen Textes). Nachteile Analyse und Generierung müssen streng getrennt sein Während der Generierung ist es nicht möglich, auf den Originaltext zurückzugreifen.

strukturelle Repräsentation in den Interlingua-Systemen Propositionale Logik Any government is dependent on its supporters. All(X), government (X), indefinite (Y), plural (Y), support (Y, X, T), depend on (X, Y, T), timeless (T) Wertung Problemlose Analyse, Generierung beinahe unmöglich, da keine syntaktische Information vorhanden. Lösungen: „multilingual paraphrasing“ Every governmet has supporters which it depends on. People who support all governments are depended on by them. All governments depend on people who support them.

strukturelle Repräsentation in den Interlingua-Systemen LFG Zusammenfassung mehrerer Sprachen beim gleichzeitigen Ausgleich deren Unterschiede.

lexikalische Repräsentation in den Interlingua-Systemen Konzepte sprachunabhängige lexikalische Einheiten „meanings derived from the process of understanding of texts“ Text (sein linguistischer Inhalt), über Phänomene (Einheiten, Aktionen, Begebenheiten) außerhalb des Textes (außersprachliche Realität)

Definition von Interlingua Eine Interlingua ist keine Sprache in herkömmlichen Sinne, sondern eine Art der Repräsentation (der Struktur). Üblicherweise wird sie gezielt bei ausgewählten Sprachpaaren oder bei mehreren verwandten Sprachen angewandt.

Die Interlingua-Grammatiken Generative Transformationsgrammatik (Chomsky, seit 1955) 50.-90. Jahre Oberflächenstruktur vs. Tiefenstruktur Transformationen, die eine TS in eine OS überführen Die Annahme, dass es sich um eine sprach-unabhängige Basis für die semantische Interpretation handelt, hat sich nicht bestätigt.

Die Interlingua-Grammatiken 2. Kasusgrammatik (Fillmore, 1968) Vermutung, dass die Repräsentationen der Kasusstruktur die Syntaxuniversalien abbilden oft benutzt worden in bilingualen transfer-basierten Systemen (z.B. Japanisch) Problem: Kasusrollen nicht standardisiert („no widely agreed set of case relations“)

Maschinelle Übersetzung mit LFG 70. Jahre (Bresnan, Kaplan) als Kritik an GTG zwei Ebenen der syntaktischen Repräsentation C-Struktur (constituent-structure) F-Struktur (functional-structure) werden erzeugt über die Phrasenstrukturregeln zusätzlich Funktionen (als Grundbegriffe) Lexikoneinträge (mit lexikalischen Regeln)

C-Struktur und F-Struktur Beispiel

C-Struktur und F-Struktur Phrasenstrukturbaum geordnete Aufstellung der Wörter und Phrasen des Satzes kontextfreie Notation F-Struktur hierarchische Funktion enspricht den grammatischen Funktionen (S, O, etc.) umfaßt auch morphosyntaktische Merkmale (Case, Num, Tense)

Transfer mit F-Strukturen Einlesen des Quellsprachensatzes (Parser) Ergebnis ist/sind F-Struktur(en) der Quellsprache Übersetzung der F-Struktur(en) mithilfe von Transfer-Lexikon (inkl. Subkategorisierung) Top-Down-Verfahren Ergebnis ist/sind F-Struktur(en) der Zielsprache Generieren der Oberfläche (Generator)

Top down beim Transfer mit F-Strukturen Suche von PRED (zunächst das vom Wurzelknoten dominierte PRED) Überfprüfung der Valenz in der vorliegenden F-Struktur Suche vom Eintrag mit der gleichen Valenz Eintrag = Grundlage für die F-Struktur der Zeilsprache anschl. PRED der nächste niedrigen Stufe wird gesucht

Transfer mit F-Strukturen Beispiel

Funktionen in der LFG Description-by-analysis Die Struktur kann nur diejenigen Eigenschaften haben, die aus der Information abgeleitet wurde, die in der vorliegenden Struktur explizit identifiziert wurde. Codescription Diese Beschreibungen lassen zu, dass die endgültige Struktur Eigenschaften hat, die in der F-Struktur nicht vorhanden sein können.

Funktionen in der LFG Funktionen signalisieren das Überführen der Strukturen in andere Strukturen (z.B. von C-Strukturen zu F-Strukturen, von F-Strukturen zu semantischen Strukturen).

Vorgehensweise bei der MÜ mit LFG (Stufe 2) Die Beschreibung der zielsprachigen Strukturen ist von den quellsprachigen Strukturen mittels Analyse und Codescription abgeleitet. Dabei werden zusätzliche Vermerke auf der Basis der C-Strukturen und der lexikalischen Einheiten gemacht. Dies dient als Input für die Generierung der zielsprachigen Version.

Beispiel für die Leistungsfähigkeit The student is likely to work. Il est probable que l´etudiant travaillera.

Beispiel für die Leistungsfähigkeit Berücksichtigung der Tempuskonkordanz

Fazit des Ansatzes von Kaplan „an approach to machine translation that exploits the potential of simultaneous correspondences between different levels of linguistic representation“ it allows „partial specification“ and „multi-level-transfer“

Kommerzielle Nutzung XLE (Xerox Linguistic Environment) Xerox Palo Alto Research Center in California Xerox Research Center in Europe (Grenoble) Institut für maschinelle Sprachverarbeitung (Stuttgart) FUJITSU (Japan) NEC (Japan)