Grundelemente der Dependenzsyntax

Slides:



Advertisements
Ähnliche Präsentationen
8. Termin Teil B: Wiederholung Begriffe Baum
Advertisements

Semantik und Wissensrepräsentation
Informatik 12 | DAES Compilerbau Wintersemester 2010 / 2011 Dr. Heiko Falk Technische Universität Dortmund Lehrstuhl Informatik 12 Entwurfsautomatisierung.
spezielle Nutzersichten formale Ebene (deskriptive Regeln)
Zugehörigkeitsfunktion (Wahrheitsfunktion) m
B-Bäume.
7. Natürliche Binärbäume
R. Der - Vorlesung Algorithmen und Datenstrukturen (Magister)
Imperative Programmierung
Zum Nutzen der kontrastiven Linguistik
Maschinelle Übersetzung I
Tina John Mehrfache Ketten in Sprachdatenbanken. Mehr als eine Kette wird benötigt wenn wir nicht alle Ebenen miteinander assoziieren wollen. zB möchten.
FH-Hof Deadlocks Richard Göbel. FH-Hof Deadlock - Definition Menge von Prozessen ist an einem Deadlock beteiligt: wenn jeder Prozess in dieser Menge auf.
Baumstrukturen Richard Göbel.
Topologische Dependenzgrammatik fürs Arabische
Bäume als Datenmodelle
Fallend-steigende Konturen: Englisch und Deutsch
Philosophie der Logik nach Frege I
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (17 – Bäume: Grundlagen und natürliche Suchbäume) Prof. Th. Ottmann.
Union-Find-Strukturen
Algorithmen und Datenstrukturen
SYSTRAN Information and translation technologies.
Lexikalisch-Funktionale-Grammatik (LFG)
Lexikalisch-Funktionale-Grammatik
Grundlegende Analysen & Zwischendarstellungen
NP-Bewegung & wh-Bewegung
Lexikalisch-Funktionale Grammatik
Schiller-Gymnasium Hof Manuel Friedrich OStR,
Teil 8 Lexical Functional Grammar Einführung
Der Supermarkt: Eine beispielhafte Erklärung für die fünf untersten Schichten des Semantic Web Protocol Stack Nicola Henze.
Mehrsprachigkeit aus psycholinguistischer Sicht
FH-Hof Algorithmen und Datenstrukturen - Einführung Richard Göbel.
Multimedia Retrieval SS 2007 Speech Recognition
Die verschiedenen Arten von Dependenzen zwischen Wordformen Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen.
Mögliche Kombinationen von Typen der syntaktischen Dependenzen zwischen 2 Wortformen in dem Satz CIS - Centrum für Informatik- und Sprachverarbeitung.
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Die formalen Sprachen bei ETAP
Semesterplan Syntax und Morphosyntax (6) Was ist Syntax?
Grammatik: Satzbau und Wortbildung
Information und Kommunikation
1.2 Trennung von Struktur und Inhalt
AE Goldberg, Trends in Cognitive Sciences 2003
Übung zu Einführung in die LDV I
Automaten, formale Sprachen und Berechenbarkeit II SoSe 2004 Prof. W. Brauer Teil 1: Wiederholung (Vor allem Folien von Priv.-Doz. Dr. Kindler vom WS 2001/02.
1 Albert-Ludwigs-Universität Freiburg Rechnernetze und Telematik Prof. Dr. Christian Schindelhauer Informatik III Christian Schindelhauer Wintersemester.
Information Retrieval, Vektorraummodell
Tasks UNDERSTAND KNOW COMPREHEND know comprehend understandit ž, n, d, c, r, s, t, a, n, d w, t žn dcr stan dwt [žn] – [dcr] – [stan] – [dwt] SELECTION.
Mensch – Maschine - Kommunikation
(Pronomina, Fürwörter)
7. Formale Sprachen und Grammatiken
EINFÜHRUNG IN DIE MORPHOLOGIE Morphologie = Formenlehre
Eine kurze Geschichte der Graphentheorie
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
Spiegelbild “Reflection” Unheilig
Funktionale Unifikations-Grammatik (FUG)   Hauptmerkmale der FUG.
Funktionale Unifikations-Grammatik (FUG)  Hauptmerkmale der FUG.
Lexikalisch-Funktionale-Grammatik  Formaler Aufbau der F-Strukturen  Funktionale Beschreibungen  Funktionale Annotationen  Von der K-Struktur zur F-Struktur.
Merkmale und Merkmalstrukturen
Lexikalische Semantik
Zeit, Tempus und Aspekt im Englischen
Sprachprodukttechnologie SS 2001G. Heyer 1 Sprachstatistik  Grundlegende Definitionen  Alphabet Sei NL eine natürliche Sprache und sei A eine Menge von.
Vorlesung Grundlagen der computergestützten Produktion und Logistik W1332 Fakultät für Wirtschaftswissenschaften W. Dangelmaier.
VORLESUNG 1 Sprachbau Sememe Sätze Redeteilen Wortformen Wortgruppe Morpheme (Begriffe)
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Konjunktiv II Konjunktiv II: Wären, hätten und würden.
Punkt-in-Landkarte II
Phrasenfinale Längung, keine Pause
Endstand Endstand Disziplin Spieler 1 Spieler 2 Disziplin Spieler 1
 Präsentation transkript:

Grundelemente der Dependenzsyntax Ludwig-Maximilians-Universität München Hauptseminar: Syntaxanalyse des Russischen im maschinellen Übersetzungssystem ETAP-3 WiSe 2007/2008 16.05.2008 Dozenten: R.Zangenfeind, PD Dr. Franz Guenthner Referentin: Mariya Donska

Einführende Hinweise Dependenztheorie (dependency theorie) vs. Pharsenstrukturtheorie (phrase-structure theorie) Ziel: eine künstliche formale Sprache (formalism) für Beschreibung der naturalen Sätzen auf der syntaktischen Ebene vorzuschlagen. These: Dependenzen sind besser dafür geeignet, um die syntaktischen Strukturen zu beschreiben, als Komponentmethoden.

D-Bäume vs. PS-Bäume 5 Unterschiede (PS vs. D als Methoden der Beschreibung der syntaktischen Struktur): Bestandteile vs. Dependenzen (hierarchische Bindungen zwischen Elementen, Binärbeziehungen) Kategorisierung ung Ihre Funktion (syntaktische Klassen als Knoten vs. specielle Namen für syntaktische Funktionen) Nicht endständige vs. endständige Knoten (D-Bäume: Wortformen&Knoten – one-to-one relations) Lineare Reihenfolge der Knoten (Linearität vs. 2-Dimensionalität) Markierung der syntaktischen Rolle (D-Bäume: Schwerpunkt liegt auf detallierter Beschreibung syntaktischer Relationen)

PS-Struktur She lov’d me for the dangers I had pass’d, And I lov’d her that she did pity them (Shakespeare) 61 Knoten für 18 Wörter

D-Struktur She lov’d me for the dangers I had pass’d, And I lov’d her that she did pity them (Shakespeare) 18 Knoten für 18 Wörter

Darstellung der syntaktischen Struktur Non-lexikalische Mitteln syntaktische Relationen auszudrücken: Lineare Reihenfolge der Wortformen Prosodie Morphologie Syntaktische Mitteln der naturalen Sprache müssen aus der Darstellung der SyntS ausgeschlossen werden + die sind doppeldeutig => Darstellung SyntS als: Menge aller Wortformen, die im Satz vorkommen (genauer D(eep)-Morph(ological) R(epresentations) = DMorphRs der Wortformen) Menge der n-ary Relationen zwischen Wortformen => Binäre Relationen.

Darstellung der syntaktischen Struktur Vorschlag: Binäre SyntRel zwischen Wortformen als einziges Mittel für Darstellung der syntaktischen Struktur naturaler Sätze zu verwenden. Antisymmetrisch Antireflexiv Antitransitiv Unterscheidbar (жена-врач vs. жена врача) = syntaktische Dependenzen, graphisch representiert als X regiert Y; Y hängt von X ab; auf Englisch: X – (syntactic) governor of Y, Y – (syntactic) dependant of X

Aufbau der SyntS Connected directed labeled graph – zusammenhängender gerichteter gekennzeichneter Graph: Knoten – DMorphRs der Wortformen Pfeilen – Namen der syntaktischen Relationen Prinzipien des D-Baumes: Oberer Knoten (root) Kein Knoten kann gleichzeitig von 2 Knoten abhängen

Täuschungen in Bezug auf syntaktische Dependenzen „Double Dependency“ Мы нашли зал пустымMASC.SG.INST. Morphologisch, aber nicht syntaktisch abhängig vom Substantiv. Журнал, которыйMASC. SG. ACC. мы читаем 2. „Mutual Dependency“ Hauptverb (Prädikat) vs. Grammatisches Subjekt 3. „No dependency“ Koordinierte Satzglieder (John and Mary = Mary and John) Aber keine Umkehrbarkeit (Я споткнулся и упал vs. Я упал и споткнулся) Rechtes Glied ist weglassbar (John, but not Mary, come)

Mängel der Dependenztheorie Modifikation-Strukturen Bob and Dick’s novels vs. Bob’s and Dick’s novels Eingruppierung – ein ganzer Subbaum als Gesamtheit genommen. Ähnlich zu PS-Struktur, aber keine lineare Reihenfolge Dependenzen sind explizit kein oberer Knoten für die Eingruppierung

Vorteile der syntaktischen Dependenzen Syntaktische Typologie der Sprachen Kategorie des Genus Wortfolge. Die Mehrheit der Sätze sind projectiv. Non-projective Sätze sind emphatisch, stylistisch, komunnikativ oder sonst markiert Möglichkeit lexikalische Funktionen zu integrieren