Linguistische Grundlagen

Slides:



Advertisements
Ähnliche Präsentationen
Einführung in die Germanistische Linguistik
Advertisements

Vorlesung Compilertechnik Sommersemester 2008
Semantik und Wissensrepräsentation
Teil 9 Lexical Functional Grammar (2) Übung
Lexikalisch-Funktionale-Grammatik
für Kommunikation, Informationstechnik und Ergonomie
8. Formale Sprachen und Grammatiken
Finale Semantik und beobachtbares Verhalten
8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie
Kapitel 4 Datenstrukturen
Syntax der Aussagenlogik
Maschinelle Übersetzung I
Grammatikentwicklung
Anfragesprachen – Dipl. Ing. Ulrich Borchert / FH Merseburg1/7 Datenbanken werden als Anhäufung von Werten eines Wertebereiches aufgefasst und Datenbankabfragen.
Philosophie der Logik nach Frege I
Kapitel 2 Die rationalen und die irrationalen Zahlen.
Prof. Dr. rer.nat. Ralph Großmann Fakultät Informatik / Mathematik Sommersemester 2012 Internet-Technologien XML-basierte Techniken Teil Metasprache der.
Sprachwissenschaftliches Institut Einführung in die HPSG Grammatiktheorie 4./11. Mai 2004.
Datentyp  Zusammenfassung von Mengen von "Werten" mit auf
Beispiele für Ausdrucksalgebren
Grammatik als Deduktionssystem
Lexikalisch-Funktionale-Grammatik (LFG)
Lexikalisch-Funktionale-Grammatik
Einführung in die Syntax
NP-Bewegung & wh-Bewegung
Lexikalisch-Funktionale Grammatik
Lexikalisch-Funktionale Grammatik
Teil 3 Grammatikmodelle
Was bedeutet "Weiche drei schalten"?
Teil 8 Lexical Functional Grammar Einführung
§9 Der affine Raum – Teil 2: Geraden
§9 Der affine Raum – Teil 2: Geraden
Grundelemente der Dependenzsyntax
Titelmasterformat durch Klicken bearbeiten Formatvorlage des Untertitelmasters durch Klicken bearbeiten Die formalen Sprachen bei ETAP Teil II.
Semesterplan Grammatische Theorien Generative Grammatik
Formale Sprachen Grundbegriffe für formale Sprachen
© Wortstellung im Deutschen Norbert Fries.
Information und Kommunikation Hartmut Klauck Universität Frankfurt SS
§3 Allgemeine lineare Gleichungssysteme
Der ideale Mitarbeiter
Formale Sprachen Grammatiken und die Chomsky-Hierarchie
AE Goldberg, Trends in Cognitive Sciences 2003
Thema: Die Phrasenstrukturgrammatik
Übung zu Einführung in die LDV I
ENDLICHE KÖRPER RSA – VERFAHREN.
Teil II: Phrasen und Phrasenstruktur
Tasks UNDERSTAND KNOW COMPREHEND know comprehend understandit ž, n, d, c, r, s, t, a, n, d w, t žn dcr stan dwt [žn] – [dcr] – [stan] – [dwt] SELECTION.
Mensch – Maschine - Kommunikation
7. Formale Sprachen und Grammatiken
2 Grundlagen In diesem Abschnitt werden die Grundbegriffe und Methoden der Theorie der formalen Sprachen und der Automaten wiederholt, soweit diese ben.
Folie 1 §21 Das Produkt von Matrizen (21.1) Definition: Für eine (m,n)-Matrix A und eine (n,s)-Matrix B ist das (Matrizen-) Produkt AB definiert als (21.2)
Funktionale Unifikations-Grammatik (FUG)   Hauptmerkmale der FUG.
Grammatik als Deduktionssystem Theorie, Grammatik, Grammatiktheorie Grammatik Sprache Hypothese Sprachtheorie Theorie Erklärung Theoretisches Konstrukt.
Funktionale Unifikations-Grammatik (FUG)  Hauptmerkmale der FUG.
Lexikalisch-Funktionale Grammatik   Kontrollphänomene   Funktionale Kontrolle   Anaphorische Kontrolle.
Lexikalisch-Funktionale Grammatik   Subsumption   Unifikation   Von der K-Struktur zur F-Struktur.
Optimalitätstheorie  Theorie – Grammatik – Grammatiktheorie  Kategorien vs. Relationen  Grammatische Kategorien  Funktionen  Syntaktische Relationen.
Lexikalisch-Funktionale-Grammatik  Formaler Aufbau der F-Strukturen  Funktionale Beschreibungen  Funktionale Annotationen  Von der K-Struktur zur F-Struktur.
Merkmale und Merkmalstrukturen
Lexikalisch-Funktionale-Grammatik
LFG als Interlingua in der maschinellen Übersetzung
Der PATR II Formalismus
Lexikalische Semantik
Syntax, Semantik, Spezifikation - Grundlagen der Informatik R. Hartwig Kapitel 3 / 1 Algebraische Hülle und Homomorphie A = [A, F ] sei  -Algebra. Eine.
Merkmale und Merkmalstrukturen   Merkmale   Merkmalstrukturen   Unifikation.
 Sortigkeit oder Arität
Lexikalisch-Funktionale-Grammatik  Architektur der LFG  K-Strukturen  Funktionale Beschreibungen  F-Strukturen.
Unifikationsgrammatiken
© Regine Eckardt blabla Thomas Ede Zimmermann (Frankfurt, SS 2001) Kontentextabhängigkeit.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
 Präsentation transkript:

Linguistische Grundlagen Repräsentationsformen Dependenz Konstituenz Merkmalstrukturen Modelle Dependenzgrammatik Kategorialgrammatik Phrasenstrukturgrammatik – Transformationen Unifikationsgrammatiken

Dependenz Eine Dependenzgrammatik (DG) ist eine Grammatik, in der die syntaktische Struktur primär in Form von Dependenzrelationen (Abhängigkeitsbeziehungen) zwischen den Basiselementen (den Wörtern) ausgedrückt wird. Eine Dependenzrelation ist eine zweistellige gerichtete Relation zwischen zwei Elementen der gleichen Strukturebene in einem Satz. Eines der Elemente (das Dependens)  hängt morphologisch, syntaktisch oder semantisch von dem anderen (dem Regens) ab.

Dependenzgrammatik Der Begriff der Abhängigkeit findet sich bereits in den Arbeiten der frühesten bekannten Grammatiker, z.B. der griechischen Gelehrten Thrax und Apollonius und danach Römischer Gelehrter wie Priscian. Der Dependenzbegriff findet sich auch in den Schriften Europäischer Gelehrter des Mittelalters, insbesondere bei den Modisten und Vertretern der spekulativen Grammatik, so z.B. bei Thomas von Erfurt. Die wichtigste Rolle in der Entwicklung der DG spielte jedoch Lucien Tesnière, der als erster Sprachwissenschaftler einen Formalismus zur Darstellung von Dependenzstrukturen herausgearbeitet hat. Seine Ideen wurden in dem 1959 posthum erschienenen Werk Eléments de syntaxe structurale dargelegt. Viele Arbeiten zur Dependenzgrammatik in den USA in den sechziger Jahren zielten darauf ab, Probleme der maschinellen Übersetzung zu lösen. Nach einer Pause von 20 Jahren, in der nur in wenigen MÜ-Projekten DG verwendet wurde, lebte das Interesse in den 1980 Jahren wieder auf. Es entstanden mehrere größere Projekte, die DG verwendeten, darunter EUROTRA und DLT.

Dependenz A very tall professor with grey hair wrote this boring book professor wrote book professor wrote a tall with book very hair this boring grey

Dependenz A very tall professor with grey hair wrote this boring book N(professor) V(wrote) D(a) A(tall) P(with) N(book) Adv(very) N(hair) D(this) A(boring) A(grey)

Dependenz N V D A P N Adv N D A A A very tall professor with grey hair wrote this boring book

Dependenz Fin N V D A P N Adv N D A A A very tall professor with grey hair wrote this boring book

Dependenzregeln Fin  N * V N  D (A) * (P) V  * (N) (N) (P) P  * N A  Adv * D  {a, this} N  {professor, hair, book …} V  {wrote, … } A  {tall, boring, …} P  {with, … }

Eine regierende Kategorie X zusammen mit allen abhängigen konstituiert eine X-Phrase (XP), wobei X = N, V, A, P Dependenz Satz Fin NP N VP V NP D A PP P N AP NP AP Adv N D A A A very tall professor with grey hair wrote this boring book

Konstituentenregeln (Phrasenstrukturregeln) S  NP VP NP  D (AP) N (PP) VP  V (NP)(PP) PP  P NP AP  Adv A D  {a, this} N  {professor, hair, book …} V  {wrote, … } A  {tall, boring, …} P  {with, … }

Phrasenstruktur- und Transformationsgrammatik PSG und TG sind beides Grammatikformalismen, die im wesentlichen aus dem Forschungsrahmen der generativen Grammatik (im engeren Sinne) entstammen (Chomsky). Entwicklung: Die bis in die 50er Jahre zurückreichende generative Grammatik hat über die Zeit verschiedene Entwicklungsstufen durchlaufen. Die mit diesem Ansatz assoziierten Grammatikmodelle haben entsprechend unterschiedliche Bezeichnungen: Standardtheorie (60er Jahre) Rektions- und Bindungstheorie (80er Jahre) Minimalist Program (90er Jahre bis heute). Obwohl steter und z.T. drastischer Modifikation unterzogen, haben sich doch bestimmte grammatiktheoretische Annahmen konstant gehalten.

Generative Transformationsgrammatik Die Konstrukte 'Oberflächen-' und 'Tiefenstruktur', die bereits in den Anfängen der generativen Grammatik Verwendung fanden, finden sich - in modifizierter Form, z.B. mit leicht unterschiedlicher Funktion - auch in modernen Theorievarianten wieder. Das verbindende Element zwischen der Oberflächen- und der Tiefenstruktur sind die Transformationen, die eine gegebene TS in eine OS überführen.

GTG – Standardtheorie In der Standardtheorie ist man davon ausgegangen, daß jeder Satz über zwei Strukturebenen verfügt: die Ebene der Tiefenstruktur und die Ebene der Oberflächenstruktur. Grund für diese Annahme waren ua. sprachliche Phänomene wie die Beziehung Aktiv/Passiv: hier wird derselbe außer-sprachliche Sachverhalt in zwei verschiedenen Formen wiedergegeben. John kicked the dog / The dog was kicked by John Solche Sätze wurden zueinander in Beziehung gesetzt, indem die unter-schiedlichen Oberflächenstrukturen aus einer gemeinsamen Tiefenstruktur abgeleitet wurden. Diese TS wurde in Form eines Phrasemarkers repräsentiert, der selber das Ergebnis der Anwendung von Phrasenstrukturregeln war. In anderen Fällen verhielt es sich umgekehrt: zwei gleiche Oberflächenstrukturen entsprangen unterschiedlichen Tiefenstrukturen. Dieses ist beispielsweise bei struktureller Mehrdeutigkeit der Fall: The boy tied the man with a tie

Architektur der GTG Basiskomponente PS–Regeln Lexikon Lexikonregel Strikte Subkategorisierung Architektur der GTG Tiefenstruktur semantische Komponente semantische Repräsentation Transformations- komponente Transformations- regeln Oberflächen- struktur phonologische Komponente phonologische Repräsentation

Kategorialgrammatik Der Terminus 'Kategorialgrammatik' umfaßt eine ganze Reihe von Theorien über algorithmische Verfahren zur syntaktischen und semantischen Analyse von Sätzen. Entwicklung: Anfänge in den 20er Jahren (Lesniewski, Ajdukiewicz) erste Anwendung auf natürliche Sprachen in den 50er Jahren (Bar-Hillel) verlor in den 60er Jahren stark an Bedeutung neues Interesse an kategorialgrammatischen Ansätzen in den 70er Jahren (Stichwort: Montague-Grammatik, ROSETTA) stete Erweiterung und Modifikation seit Mitte der 80er Jahre(Steedman)

Kategorialgrammatik Grundelemente der KG sind die KATEGORIEN, die sich jedoch bezüglich ihrer Form und ihres Informationsgehaltes fundamental von 'herkömmlichen' Kategorien (N, V, PP, AP usw.) unterscheiden. Kerngedanke hinter der Struktur der Kategorien ist die Annahme, bestimmte syntaktische und semantische Information, die mit einem Lexem verbunden ist, direkt in der Kategorie zu kodieren. Beispiel: einem intransitiven Verb, wie z.B. died, würde in der Kategorialgrammatik eine Kategorie zugewiesen, aus der klar ablesbar ist, daß sich dieser Ausdruck zusammen mit einem NP-artigen Ausdruck zu einem Satz verbindet.

Kategorialgrammatik Die klassische Kategorialgrammatik kennt zwei Basiskategorien: S und N. Diese Basiskategorien können über die folgende Regel zu einer komplexen Kategorie kombiniert werden: wenn A eine Kategorie ist und B eine Kategorie ist, dann ist auch A/B eine Kategorie. Damit wären als Kategorien etabliert: S/N und N/S. Da eine komplexe Kategorie aber selber wieder Input für eine komplexe Kategeorie sein kann, ist das kategoriebildende Potential einer KG praktisch unbegrenzt:   

Kategorien der KG A B A/B S N S/N (S/N)/N ((S/N)/N)/S (S/N)/S

Regel der KG Auf der Basis dieser Kategorien reicht eine einzige Syntax-Regel, um Phrasen bzw. Konstituenten abzuleiten. Diese Regel wird Funktionsanwendung genannt und hat die folgende Form: Ist a von der Kategorie A/B und b von der Kategorie B, dann ist ab von der Kategorie A Ist a von der Kategorie A und b von der Kategorie A\B, dann ist ba von der Kategorie A. (Tip: die Multiplikation eines Bruches mit dem Wert des Nenners ergibt den Zähler: 1/2 x 2 = 1; 3/8 x 8 = 3 usw.) Beispiel: John (ein Eigenname) ist von der Kategorie N, jumped (ein intransitives Verb) ist von der Kategorie S\N. Nach der zweiten Regel gilt dann: John jumped ist von der Kategorie S (ein Satz).

Kategorie - Funktionsanwendung Definition 'Kategorie: Es gibt eine endliche Menge von Basiskategorien, z.B. N (= Name) und S (= Satz) Es gibt einen Operator in den beiden Ausprägungen '/' und '\'. Jede Basiskategorie ist eine Kategorie Wenn A und B Kategorien sind, sind auch A/B und A\B Kategorien Regel: Funktionsanwendung Wenn x von der Kategorie A/B ist und y von der Kategorie B dann ist xy von der Kategorie A Wenn x von der Kategorie A\B ist und y von der Kategorie B dann it yx von der Kategorie A.

Lexikon Zur Beschreibung unseres Satzes a very tall professor with grey hair wrote this boring book benötigen wir folgende Kategorien: Basiskategorien Det (a, this) Appelativa (professor, hair, book) Adjektive (tall, grey, boring) Gradadverb (very) Transitives Verb (wrote) Präposition (with) S und N N/(N/N) N/N (N/N)/(N/N) ((N/N)/(N/N))/((N/N)/(N/N)) (S\N)/N ((N/N)\(N/N))/N

((N/N)/(N/N))/((N/N)/(N/N)) Parsing mit KG ? N/(N/N) a very tall professor with grey hair wrote this boring book N/(N/N) ((N/N)/(N/N))/((N/N)/(N/N)) (N/N)/(N/N) N/N ((N/N)\(N/N))/N (N/N)/(N/N) N/N (S\N)/N N/(N/N) (N/N)/(N/N) N/N N/N (N/N)\(N/N) N N (N/N)/(N/N) N/N S\N N/N N/N S

Kategorialgrammatik Wesentliche Merkmale einer KG: synchroner Aufbau von syntaktischer und semantischer Strukturbeschreibung Kodierung syntaktischer/semantischer Information in den Kategorien. Die Art der Kategorisierung lexikalischer und syntaktischer Kategorien hat Auswirkungen auf das Verhältnis zwischen den einzelnen Komponenten der Grammatik. Die traditionelle KG kommt mit einer einzigen Syntax Regel aus. Durch diesen radikalen Lexikalismus, hier also die Angabe der syntaktischen Merkmale eines Lexems bereits im Lexikon, wäre es redundant, diese Art der Restriktion nochmals durch Syntax Regeln zu erfassen. Der Nachteil aber ist, daß die Kategorienkomponente, wie gesehen, extrem aufgebläht werden muß, um den möglichen syntaktischen Kombinationen, die ein lexikalisches Element eingehen kann, Rechnung zu tragen.

Unifikationsgrammatiken Unifikationsgrammatik steht für eine Reihe moderner Grammatikformalismen, bei denen Merkmalstrukturen und deren Unifikation für die Ableitung grammatisch korrekter Formen eine zentrale Rolle spielt. Dazu gehören u.a. die LFG (= Lexical-Functional Grammar) die GPSG (= Generalized Phrase Structure Grammar) die HPSG (=Head-Driven-Phrase-Structure Grammar)

Merkmalstrukturen Eigenschaften linguistischer Objekte (Linguistische Elemente wie z.B. Wörter oder Phrasen) werden in einer Unifikationsgrammatik als Bündel von Merkmalen verstanden. Diese Merkmalstrukturen haben die Form von Attribut-Wert Paaren, wobei die Werte entweder atomare Symbole oder aber selber wieder Merkmalstrukturen sein können.

Unifikation Unifikation ist eine formale Operation, bei der zwei kompatible Merkmalsstrukuren zu einer neuen Merkmalsstruktur vereinigt werden können:

Unifikation Stimmen allerdings die Werte jeweils gleicher Attribute nicht überein, können die Merkmalstrukturen nicht unifiziert werden:

LFG Erste Anfänge der LFG finden wir Ende der siebziger Jahre (Bresnan, Kaplan), z.T. motiviert aus der Kritik an der damaligen Modellvariante der generativen Transformationsgrammatik. Im Unterschied zu selbiger haben in der LFG z.B. die grammatischen Funktionen den Status von Grundbegriffen, sind also nicht aus bestimmten Strukturen abgeleitet. Phänomene, die in der TG über Transformationen erklärt wurden, werden hier als primär lexikalisch behandelt und also durch entsprechende Lexikoneinträge bzw. lexikalische Regeln beschrieben. In einer LFG werden zwei Ebenen der syntaktischen Repräsentation unterschieden: die C- (=Constituent)-Structure und die F(=Functional)-Structure Diese werden parallel über die Phrasenstrukturregeln der Grammatik erzeugt werden.

Standard Theorie Prädikaten- Logik Präsuppositions-Logik Sprechakt-Theorie Funktionale Satz-Perspektive Standard Theorie Interpretative Semantik Generative Semantik Lexikalisch-Funktionale Grammatik Kasus Grammatik Relationale Grammatik Erweiterte Standard-Theorie

phonologische Interpretation semantische Interpretation Architektur der LFG Grammatik Erweiterte PSG K-Strukturen Grammatik Lexikon Lexikonregeln F-Strukturen phonologische Interpretation semantische Interpretation phonologische Repräsentation semantische Repräsentation

F-Strukturen in LFG Die F-Struktur ist eine Merkmalsstruktur, deren Attribute sowohl die grammatischen Funktionen (SUBJ, PRED) wie auch morphosyntaktische Merkmale wie z.B. CASE, NUM oder TENSE umfassen.

Transfer mit F-Strukturen John likes the dog Der Hund gefällt John   (PRED) = 'like <(SUBJ:$1) (OBJ:$2)>' ß Transfer Ý (PRED) = 'gefallen <(SUBJ:$2) (OBJ:$1)>'

Transfer mit F-Strukturen

PRED 'write <(Subj)(Obj)>' F-Struktur Spec [Det Indef] Mod Spec [PRED 'very'] PRED 'tall' PRED 'professor' Qual PRED 'with' Obj Mod [PRED 'grey'] PRED 'hair' Subj PRED 'write <(Subj)(Obj)>' Tense Past Obj Spec [ ] Mod [PRED 'boring'] PRED 'book'