Signaling coherence relations in text generation

Slides:



Advertisements
Ähnliche Präsentationen
Business Engineering Philipp Osl, Alexander Schmidt
Advertisements

Prüfung objektorientierter Programme -1
V - Modell Anwendung auf große Projekte
IT-Projektmanagement
Zur Rolle der Sprache bei der Modellierung von Datenbanken
Informatik 12 | DAES Compilerbau Wintersemester 2010 / 2011 Dr. Heiko Falk Technische Universität Dortmund Lehrstuhl Informatik 12 Entwurfsautomatisierung.
Gliederung 1. Grundlagen der Bottom-Up-Syntaxanalyse
Konjunktionen.
8 Behandlung von Begriffen 8.1 Grundlagen aus Logik und Psychologie
Diskursmarker in der Jugendsprache
Stiftungsprofessur Entrepreneurship 17. EXIST Workshop EXIST Workshop Beratung und Coaching IT Beratungsfall der Universität Oldenburg – Coaching.
On a Buzzword: Hierachical Structure David Parnas.
Parser generieren Yet Another Compiler – Compiler YACC.
Die Registervariablen: Tenor of Discourse
An Ideomotor Approach to Imitation
1 Ein Computermodell zur Bestimmung von Begriffstypen Christof Rumpf Heinrich-Heine-Universität Tag der Forschung
Grundkurs Linguistik Programm der Vorlesung Oktober
Übersetzung durch Mensch und Maschine Einleitung Einleitung Entwicklungsgechichte der MÜ Entwicklungsgechichte der MÜ Entwicklungsphasen der MÜ Entwicklungsphasen.
Grundlegende Analysen & Zwischendarstellungen
Diskussion Fundamentalkategorien nach Aristoteles Seminar I-Prax: Inhaltserschließung visueller Medien, Spree WS 2005/06 Diskusion Fundamentalkategorien.
Nebensätze (c)deutsch.digitale-schule-bayern.de.
Forschungsprozess Car
1 Teil 4 Übung: Uhr. 2 Zielsetzung Ziel ist es, mit Hilfe objektorientierter Modellierung ein System zu entwickeln, mit dem eine einfache Uhr simuliert.
Sportwissenschaftliche Forschungsmethoden Altenberger / Lames, SS Einführung.
Tutorium
Projekt: Routeninstruktionen mit Sprache und Skizzen
Objektorientierte Modellierung und Simulation technischer Systeme Vertiefungsveranstaltung im Studiengebiet SSG WS2006/2007 André Nordwig, Christoph Nytsch-Geusen.
Gradierte Grammatikalität SS 2003 Einheit 1. Quelle des Übels Klassische Linguistik Korpusorientiert (Tote Sprachen/ Literatur- sprachliche Norm) Dialektforschung.
Objektorientierte Modellierung
Prof. Dr. Gerhard Schmidt pres. by H.-J. Steffens Software Engineering SS 2009Folie 1 Objektmodellierung Objekte und Klassen Ein Objekt ist ein Exemplar.
Input / Wahrnehmung Control / Bewusstsein Output / Motorik Information.
25 Jahre Ein Blick zurück – Jahr für Jahr…
Die Geschichte des Computers
Nebensätze.
Zusammenfassung von Martin Riesen (2013) - Entwurf
25 Jahre Jägerzug „Junge Eiche“ Laach
Am Anfang war die Vision... Träume werden Wirklichkeit, sobald wir handeln.
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Einführung in die Programmierung Wintersemester 2013/14 Prof. Dr. Günter Rudolph Lehrstuhl für Algorithm Engineering Fakultät für Informatik TU Dortmund.
Texttyp - Textsorte - Vertextungsmuster
Nebensätze.
Definitionen der SWT (1)
Erfindervon Fuzzy Logic
Kompetenz -, Lern - und Prüfungsbereiche Anforderungsbereiche
Temporalsätze wenn und als
NDK Enterprise Technologien Informationen Infrastruktur und Fallstudie Daniel Nydegger Studienleiter Enterprise System Entwicklung.
Lexikalische Semantik
Black Box Algorithmen Hartmut Klauck Universität Frankfurt SS
Lernprogramm zur Bestimmung der Wortarten
Warum nur Deutschland Europameister 2004 werden kann!
Satzsemantik Verben, Aktionsarten und semantische Rollen -
Zur Problematik der Konnektoren im Satz und im Text aus der Perspektive der Textverständlichkeit Eva Bajerová, Universität Ostrava.
Card Shot Funktion. Um die Card Shot Funktion zu benutzen wählen Sie den Reiter Anwendungen im Kopiermenü aus Wählen Sie dann die Card Shot Funktion um.
Eike Schallehn, Martin Endig
Perfektně německy E 12 – Teil VIII EL
Kohärenz Brückenkurs HKK.
FC Bayern München Renato Jovnaš VIII 1.
Inhalt Einordnung und Funktion der lexikalische Analyse Grundlagen
Konjunktionen Notizen
2. Sitzung Forschungsprozess als Abfolge von Entscheidungen
Methoden der Sozialwissenschaften
Nebensätze.
Funktionale Unifikations-Grammatik (FUG)   Hauptmerkmale der FUG.
Lexikalische Semantik
Die Wahl zum „Grazer des Jahres 2015“ Gewinnspielkooperation
Konnektoren Dezember 2015.
VO#1: Lexikologie als sprachwissenschaftliche Disziplin Lexikologie, Matej-Bel-Univeristät in Banská Bystrica, Z. Tuhárska.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
Bindewörter Konjunktionen.
E-Aufgaben in Stud.IP mit ViPS – erste Schritte –
 Präsentation transkript:

Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Motivation (1) Warten bis der Motor kalt ist, dann den Kühlerdeckel im Gegenuhr-zeigersinn bis zum Anschlag drehen. BEIM DREHEN DEN DECKEL NICHT NIEDERDRÜCKEN. Nachdem der Druck abgelassen ist, den Deckel durch Niederdrücken und Drehen im Gegenuhrzeiger-sinn abnehmen. Kühlmittel nachfüllen bis der Kühler voll ist, dann den Deckel wieder aufschrauben. Fest andrehen. Den Reservetank bis zur oberen Pegellinie “MAX” bei kaltem Motor auffüllen. a. {Nachdem | Sobald} der Druck abgelassen ist, den Deckel abnehmen. b. Den Druck ablassen, bevor Sie den Deckel abnehmen. c. Den Druck ablassen. Dann den Deckel abnehmen. Ich schaue morgen vorbei, {obwohl | obzwar | wenn (ich) auch | und das, obwohl} ich eigentlich keine Zeit habe. 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Motivation (2) Diskursmarker: lexikalische Einheiten, welche die Art der semantischen/ rhetorischen Beziehung zwischen benachbarten Textsegmenten auf der sprachlichen Oberfläche anzeigen  Beschreibung der Form und Funktion von Diskursmarkern Textgenerierung:  genaue und richtige Auswahl der Diskursmarker SEQUENCE PURPOSE Kühlmittel nachfüllen Tank voll Deckel aufschrauben 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Stand der Forschung (1) Repräsentation und Wahl von Diskursmarkern 1:1 Abbildung Kohärenzrelation - Diskursmarker Diskursmarkerwahl als “Nebeneffekt” anderer Entscheidungen der Satzplanung (Reiter/Dale 2000) isolierte Einzelstudien kleine Menge an Markern kausale (z.B. Delin et al. 1996), konzessive (z.B. Scott 1999), temporale (z.B. Dorr/Gaasterland 1995), … ad hoc Studien Englisch  bisher nur unzureichende Lösungen für korrekte Auswahl  keine linguistisch fundierte Ressource für Wissen um Gebrauch von Diskursmarkern 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Stand der Forschung (2) Studien zu Form und Funktion von Diskursmarkern Genauigkeit (z.B. König 1991 (konzessiv), Sinn 1991 (temporal) vs. Abdeckung (z.B. Knott 1996, Martin 1992, Pasch et al. 2003) Fokus auf syntaktischen und semantischen Eigenschaften Ausnahme: Halliday/Hasan 1976, Martin 1992: Funktionale Beschreibung, Conjunctive Relations Temporale Diskursmarker des Deutschen einzelne Diskursmarker (z.B. während, Clement/Thümmel 1996) Lexika (Pasch et al. 2003, Schröder 1990) semantische Studien (Steube 1980, Herweg 1990, Bäuerle 1995) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Ziele der Arbeit linguistisch-deskriptiv Beschreibung der Funktion deutscher kohärenzstiftender Ausdrücke mit temporaler Bedeutung  theoretischer Rahmen: Conjunctive Relations (Martin 1992) Modellierung der Diskursebene computerlinguistisch Ressource für Wissen über Funktion und Gebrauch von Diskurs-markern Modell für die Diskursmarkerwahl in der Text-generierung Untersuchungsgegenstand temporale Diskursmarker Deutsch; Englisch nur ansatzweise technische Instruktionen: geschriebener, monologischer Text 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Vorgehen Sieben Schritte: Identifikation der Diskursmarker in deutschen (und englischen) technischen Instruktionen Bestimmung der Dimensionen der Diskursmarker-beschreibung detaillierte Analyse einer Gruppe von Diskursmarkern funktionale Beschreibung der Diskursmarker Modellierung der Repräsentationsebene, auf der Diskurs-markerwahl operiert uniforme Beschreibungsebene von Diskursmarkern für MLG prototypische Architektur für Diskursmarkerwahl in MLG 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Schritt 1: Menge der Diskursmarker Ziel: Identifikation der Lexeme im Text, die als Diskursmarker fungieren  Definition der Klasse der Diskursmarker Wortklasse Temporale Diskursmarker Präposition ab, bei, bis, mit, nach, seit, vor, während subordinierende Konjunktion als, bevor, bis, ehe, kaum dass, nachdem, seitdem, sobald, solange, sooft, sowie, während, wenn Konjunktive danach, dann, daraufhin, davor, währenddessen, zuvor 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Schritt 2: Dimensionen temporaler Diskursmarker Ziel: Bestimmung der Eigenschaften, welche für die Beschreibung temporaler Diskurs-marker relevant sind Quellen: Forschungsliteratur Betrachtung temporaler Marker in Korpora Substitution test (Knott, Mellish 1996) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Beschreibungs-dimension Werte Temporale Relation temporale Relationen (Allen 1984) prox, imm, next, dur (nach Herweg 1990) Intentionen inform, convince (Hovy 1988) Präsuppositionen presupposed, not-presupposed (Lascarides, Asher 1993) Situationstyp state, activity, event (Sinn 1991, Stede 1999) Aktionsart stative, semelfactive, durative, transformative, resultative, causative, iterative (Bußmann 1990) Aspekt imperfective, perfective Verbzeit Basic Tense Structure Konstellation E,R, S (Reichenbach 1947) Abfolge der Relata postponed, topicalised, verb-first,preposed (Schilder 1997) Position des DM Vorfeld, Mittelfeld, Vorvorfeld (Eisenberg 1994) Wortklasse PP, Pronominaladverb, koord. Konj., subord. Konj., Präp. Temporale Quantifier modifizierbar, nicht modifizierbar (Quirk et al. 1972) Stil formal, archaisch, knapp, neutral 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Schritt 3: Analyse temporaler Diskursmarker Ziel: umfassende Beschreibung von Bedeutung und Verwendung deutscher temporaler Diskursmarker 27 temporale Marker (Schritt 1) werden entlang der Dimensionen (Schritt 2) beschrieben Analyse neutral bzgl. der linguistischen Theorie keine Neuanalyse sondern Integration der Ergebnisse der zahlreichen Einzelstudien 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Beispiel “nachdem” Zwei Lesarten von nachdem (Herweg 1991) Precedence: (6a) Nachdem Peter sich in seinen Sessel gesetzt hatte, griff er nach der Zeitung. Overlap: (6b) Nachdem Peter in seinem Sessel saß, griff er nach der Zeitung.: nachdem (precedence) Temporal relation after(Sitm,Sits) and prox(Sitm,Sits), or meets(Sitm,Sits) Conditions of use Sits is presupposed Sits is r-bounded or lr-bounded (egressive) Sitm is l-bounded or lr-bounded (ingressive) clause denoting Sits has a perfective aspect clause denoting Sitm has an imperfective aspect tense sequence; E(Sits)<E(Sitm) where E(Sits)<=S hypotactic clause complex, subord. conjunction 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote preferred ordering is preposed discourse marker takes front position and can be modified clause denoting Sits is positive and not hypothetical nachdem(overlap) Temporal relation finishes(Sitm,Sits) or overlaps(Sitm,Sits) or during(Sitm,Sits) in terms of precedence: after(Sitm,ingr(Sits)) and prox(Sitm,ingr(Sits)), or meets(Sitm,ingr(Sits)) Conditions of use Sits is presupposed Sits is l-bounded or lr-bounded (ingressive) verb denoting Sits is stative/resultative clause denoting Sitm has an imperfective aspect same tense; E(Sits)=E(Sitm) where E(Sits)<=S and E(Sitm)<=S hypotactic clause complex, subord. Conjunction preferred ordering is preposed discourse marker takes front position and can be modified clause denoting Sits is positive and not hypothetical 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Schritt 4: Funktionale Beschreibung Ziel: funktionale Klassifikation der analysierten temporalen Diskursmarker im Sinne von Martin (1992) Repräsentation in Netzwerken:temporal conjunctive relation networks für das Deutsche Diskursmarker als eine Realisierungsmöglichkeit Repräsentation der Gemeinsamkeiten und Unterschiede zwischen Diskursmarkern Aussagen zu Kriterien für die Wahl Hyponymie-Relationen zwischen Diskursmarkern 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Deutsche temporale „anterior conjunctive relations“ 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Computerlinguistische Anwendung Einsatz der linguistischen Beschreibung in der automatischen Textgenerierung erfordert Spezifikation der Repräsentationsebene, auf der Diskursmarkerwahl-Prozeduren operieren  Diskursebene (Schritt 5) generische Ressource für das Wissen um Bedeutung und Gebrauch von Diskursmarkern  Diskursmarkerlexikon (Schritt 6) Architektur für die Auswahl konkreter Kohärenzausdrücke in der automatischen Textgenerierung  Auswahlprozedur (Schritt 7) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Schritt 6: Entwicklung des Diskursmarkerlexikons Ziel: Entwicklung einer allgemeinen Ressource zur Spezifikation von Wissen um Bedeutung und Gebrauch von Diskursmarkern Diskursmarkerwahl als lexikalische Entscheidung Repräsentation des lexikalischen Wissen im Lexikon lexikalisches Wissen ungleich syntaktisches Wissen Beeinflussung syntaktischer Entscheidungen durch lexikalische Information Textgenerierung: Diskursmarkerwahl interagiert mit anderen Satzplanungsentscheidungen uniforme Repräsentation und allgemeine Verfügbarkeit 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Organisation des Lexikons Definition Lexikon als Verzeichnis der Wörter einer Sprache, hier der funktional motivierten Klasse der Diskursmarker Zwei Ebenen der Beschreibung (in Anlehnung an EAGLES 1999) flat layer: einzelne Lexikoneinträge structuring layer: Beziehungen zwischen Lexikoneinträgen (lexiko-semantische Beziehungen, Vererbungshierarchien) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Definition “Diskursmarker” (1) discourse-marker-entry  [-ORTHOGRAPHY: string -WORD-SENSE-ID: word-sense-ID -LANGUAGE: (German | English) EXAMPLE: string -SEMANTIC-RELATION: ideational-relation* -INTENTION: interpersonal-relation* -NUCLEARITY: (S0-nucleus | S1-nucleus | multinuclear) -PRESUPPOSITION: (presupposed | not-presupposed) -STATUS: (internal | external) PART-OF-SPEECH: (conj | pronadv | coordc | subc | prep) ORDERING: ordering-type* POSITION: position-type* MODIFICATION: (modifiable | not-modifiable) POLARITY: (positive | negative) HYPOTHETICAL: (realized | unrealized) -STYLE: stylistic-preferences* SYNONYMS: word-sense-id* ANTONYMS: word-sense-id* HYPONYMS: word-sense-id* ] 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Definition “Diskursmarker” (2) ideational-relation  (occasion | expansion) occasion  [IDEATION: ideation-type POLARITY: (positive | negative) MODALIZATION: (realis | irrealis) MODALITY: (certain | possible)] ideation-type  (additive | temporal | causal) temporal  (preceding | co-occuring) preceding  (before | meets) co-occuring  (equals|starts|finishes|overlaps|during) position-type  (initial | front | middle | end) stylistic-preferences -> [FORMALITY: (highfalutin | neutral | colloquial) USAGE: (neutral | archaic | rare) BREVITY: (concise | non-consice) ] 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Definition “temporale Diskursmarker” temporal-marker-entry  [DISCOURSE-MARKER-INFO: discourse-marker-entry -SEMANTIC-RELATION: temporal-information -BOUNDEDNESS-SIT-M: boundedness-type* -BOUNDEDNESS-SIT-S: boundedness-type* -SITUATION-TYPE: situation-type* -AKTIONSART-MC: aktionsart-type* -ASPECT-MC: aspectual-type* -ASPECT-SC: aspectual-type* TENSE: tense-information* ] temporal-information  [-TEMPORAL-RELATION: temporal CONSTRAINTS: proximity* EXTENSION: (dur | not-dur) proximity  (prox | next |imm | same-place) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Zusammenfassung Motivation Probleme bei Diskursmarkerwahl in der Textgenerierung fehlende linguistische Beschreibungen Diskursmarkeranalyse und – repräsentation Dimensionen der Beschreibung Analyse temporaler Diskursmarker funktionale Repräsentation Diskursmarkerlexikon Struktur des Lexikons Definition eines allgemeinen Lexikoneintrags Generierungslexikon und Beispieleinträge 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Beitrag der Arbeit (1) Definition der Klasse der Diskursmarker Test zur Identifikation deutscher Diskursmarker Beschreibung temporaler Diskursmarker Bestimmung der relevanten Beschreibungsdimensionen detaillierte Analyse deutscher temporaler Diskursmarker Integration vorhandener Einzelstudien funktionale Klassifikation Netzwerk deutscher temporaler Conjunctive Relations Vorarbeiten zu multilingualer Ressource Kohärenzrelationen allgemeine Strategie zur Bestimmung genre-spezifischer Kohärenzrelationen paradigmatische Beschreibung für den Texttyp 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote

Kolloquiumsvortrag Brigitte Grote Beitrag der Arbeit (2) Diskursmarkerlexikon Systematisierung der Beschreibungen einzelner Diskursmarker  einheitliche Repräsentation im Diskursmarkerlexikon Definition der Lexikoneinträge entlang der EAGLES-Richtlinien Strategie zur Herleitung von Lexikoneinträgen Spezifikation von temporalen Lexikoneinträgen Automatische Diskursmarkerwahl Bereitstellung der Ressourcen Beschreibung der Auswahlprozedur Natural Language Processing deklaratives Diskursmarkerlexikon 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote