Signaling coherence relations in text generation A case study of German temporal discourse markers Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Motivation (1) Warten bis der Motor kalt ist, dann den Kühlerdeckel im Gegenuhr-zeigersinn bis zum Anschlag drehen. BEIM DREHEN DEN DECKEL NICHT NIEDERDRÜCKEN. Nachdem der Druck abgelassen ist, den Deckel durch Niederdrücken und Drehen im Gegenuhrzeiger-sinn abnehmen. Kühlmittel nachfüllen bis der Kühler voll ist, dann den Deckel wieder aufschrauben. Fest andrehen. Den Reservetank bis zur oberen Pegellinie “MAX” bei kaltem Motor auffüllen. a. {Nachdem | Sobald} der Druck abgelassen ist, den Deckel abnehmen. b. Den Druck ablassen, bevor Sie den Deckel abnehmen. c. Den Druck ablassen. Dann den Deckel abnehmen. Ich schaue morgen vorbei, {obwohl | obzwar | wenn (ich) auch | und das, obwohl} ich eigentlich keine Zeit habe. 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Motivation (2) Diskursmarker: lexikalische Einheiten, welche die Art der semantischen/ rhetorischen Beziehung zwischen benachbarten Textsegmenten auf der sprachlichen Oberfläche anzeigen Beschreibung der Form und Funktion von Diskursmarkern Textgenerierung: genaue und richtige Auswahl der Diskursmarker SEQUENCE PURPOSE Kühlmittel nachfüllen Tank voll Deckel aufschrauben 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Stand der Forschung (1) Repräsentation und Wahl von Diskursmarkern 1:1 Abbildung Kohärenzrelation - Diskursmarker Diskursmarkerwahl als “Nebeneffekt” anderer Entscheidungen der Satzplanung (Reiter/Dale 2000) isolierte Einzelstudien kleine Menge an Markern kausale (z.B. Delin et al. 1996), konzessive (z.B. Scott 1999), temporale (z.B. Dorr/Gaasterland 1995), … ad hoc Studien Englisch bisher nur unzureichende Lösungen für korrekte Auswahl keine linguistisch fundierte Ressource für Wissen um Gebrauch von Diskursmarkern 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Stand der Forschung (2) Studien zu Form und Funktion von Diskursmarkern Genauigkeit (z.B. König 1991 (konzessiv), Sinn 1991 (temporal) vs. Abdeckung (z.B. Knott 1996, Martin 1992, Pasch et al. 2003) Fokus auf syntaktischen und semantischen Eigenschaften Ausnahme: Halliday/Hasan 1976, Martin 1992: Funktionale Beschreibung, Conjunctive Relations Temporale Diskursmarker des Deutschen einzelne Diskursmarker (z.B. während, Clement/Thümmel 1996) Lexika (Pasch et al. 2003, Schröder 1990) semantische Studien (Steube 1980, Herweg 1990, Bäuerle 1995) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Ziele der Arbeit linguistisch-deskriptiv Beschreibung der Funktion deutscher kohärenzstiftender Ausdrücke mit temporaler Bedeutung theoretischer Rahmen: Conjunctive Relations (Martin 1992) Modellierung der Diskursebene computerlinguistisch Ressource für Wissen über Funktion und Gebrauch von Diskurs-markern Modell für die Diskursmarkerwahl in der Text-generierung Untersuchungsgegenstand temporale Diskursmarker Deutsch; Englisch nur ansatzweise technische Instruktionen: geschriebener, monologischer Text 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Vorgehen Sieben Schritte: Identifikation der Diskursmarker in deutschen (und englischen) technischen Instruktionen Bestimmung der Dimensionen der Diskursmarker-beschreibung detaillierte Analyse einer Gruppe von Diskursmarkern funktionale Beschreibung der Diskursmarker Modellierung der Repräsentationsebene, auf der Diskurs-markerwahl operiert uniforme Beschreibungsebene von Diskursmarkern für MLG prototypische Architektur für Diskursmarkerwahl in MLG 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Schritt 1: Menge der Diskursmarker Ziel: Identifikation der Lexeme im Text, die als Diskursmarker fungieren Definition der Klasse der Diskursmarker Wortklasse Temporale Diskursmarker Präposition ab, bei, bis, mit, nach, seit, vor, während subordinierende Konjunktion als, bevor, bis, ehe, kaum dass, nachdem, seitdem, sobald, solange, sooft, sowie, während, wenn Konjunktive danach, dann, daraufhin, davor, währenddessen, zuvor 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Schritt 2: Dimensionen temporaler Diskursmarker Ziel: Bestimmung der Eigenschaften, welche für die Beschreibung temporaler Diskurs-marker relevant sind Quellen: Forschungsliteratur Betrachtung temporaler Marker in Korpora Substitution test (Knott, Mellish 1996) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Beschreibungs-dimension Werte Temporale Relation temporale Relationen (Allen 1984) prox, imm, next, dur (nach Herweg 1990) Intentionen inform, convince (Hovy 1988) Präsuppositionen presupposed, not-presupposed (Lascarides, Asher 1993) Situationstyp state, activity, event (Sinn 1991, Stede 1999) Aktionsart stative, semelfactive, durative, transformative, resultative, causative, iterative (Bußmann 1990) Aspekt imperfective, perfective Verbzeit Basic Tense Structure Konstellation E,R, S (Reichenbach 1947) Abfolge der Relata postponed, topicalised, verb-first,preposed (Schilder 1997) Position des DM Vorfeld, Mittelfeld, Vorvorfeld (Eisenberg 1994) Wortklasse PP, Pronominaladverb, koord. Konj., subord. Konj., Präp. Temporale Quantifier modifizierbar, nicht modifizierbar (Quirk et al. 1972) Stil formal, archaisch, knapp, neutral 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Schritt 3: Analyse temporaler Diskursmarker Ziel: umfassende Beschreibung von Bedeutung und Verwendung deutscher temporaler Diskursmarker 27 temporale Marker (Schritt 1) werden entlang der Dimensionen (Schritt 2) beschrieben Analyse neutral bzgl. der linguistischen Theorie keine Neuanalyse sondern Integration der Ergebnisse der zahlreichen Einzelstudien 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Beispiel “nachdem” Zwei Lesarten von nachdem (Herweg 1991) Precedence: (6a) Nachdem Peter sich in seinen Sessel gesetzt hatte, griff er nach der Zeitung. Overlap: (6b) Nachdem Peter in seinem Sessel saß, griff er nach der Zeitung.: nachdem (precedence) Temporal relation after(Sitm,Sits) and prox(Sitm,Sits), or meets(Sitm,Sits) Conditions of use Sits is presupposed Sits is r-bounded or lr-bounded (egressive) Sitm is l-bounded or lr-bounded (ingressive) clause denoting Sits has a perfective aspect clause denoting Sitm has an imperfective aspect tense sequence; E(Sits)<E(Sitm) where E(Sits)<=S hypotactic clause complex, subord. conjunction 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote preferred ordering is preposed discourse marker takes front position and can be modified clause denoting Sits is positive and not hypothetical nachdem(overlap) Temporal relation finishes(Sitm,Sits) or overlaps(Sitm,Sits) or during(Sitm,Sits) in terms of precedence: after(Sitm,ingr(Sits)) and prox(Sitm,ingr(Sits)), or meets(Sitm,ingr(Sits)) Conditions of use Sits is presupposed Sits is l-bounded or lr-bounded (ingressive) verb denoting Sits is stative/resultative clause denoting Sitm has an imperfective aspect same tense; E(Sits)=E(Sitm) where E(Sits)<=S and E(Sitm)<=S hypotactic clause complex, subord. Conjunction preferred ordering is preposed discourse marker takes front position and can be modified clause denoting Sits is positive and not hypothetical 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Schritt 4: Funktionale Beschreibung Ziel: funktionale Klassifikation der analysierten temporalen Diskursmarker im Sinne von Martin (1992) Repräsentation in Netzwerken:temporal conjunctive relation networks für das Deutsche Diskursmarker als eine Realisierungsmöglichkeit Repräsentation der Gemeinsamkeiten und Unterschiede zwischen Diskursmarkern Aussagen zu Kriterien für die Wahl Hyponymie-Relationen zwischen Diskursmarkern 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Deutsche temporale „anterior conjunctive relations“ 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Computerlinguistische Anwendung Einsatz der linguistischen Beschreibung in der automatischen Textgenerierung erfordert Spezifikation der Repräsentationsebene, auf der Diskursmarkerwahl-Prozeduren operieren Diskursebene (Schritt 5) generische Ressource für das Wissen um Bedeutung und Gebrauch von Diskursmarkern Diskursmarkerlexikon (Schritt 6) Architektur für die Auswahl konkreter Kohärenzausdrücke in der automatischen Textgenerierung Auswahlprozedur (Schritt 7) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Schritt 6: Entwicklung des Diskursmarkerlexikons Ziel: Entwicklung einer allgemeinen Ressource zur Spezifikation von Wissen um Bedeutung und Gebrauch von Diskursmarkern Diskursmarkerwahl als lexikalische Entscheidung Repräsentation des lexikalischen Wissen im Lexikon lexikalisches Wissen ungleich syntaktisches Wissen Beeinflussung syntaktischer Entscheidungen durch lexikalische Information Textgenerierung: Diskursmarkerwahl interagiert mit anderen Satzplanungsentscheidungen uniforme Repräsentation und allgemeine Verfügbarkeit 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Organisation des Lexikons Definition Lexikon als Verzeichnis der Wörter einer Sprache, hier der funktional motivierten Klasse der Diskursmarker Zwei Ebenen der Beschreibung (in Anlehnung an EAGLES 1999) flat layer: einzelne Lexikoneinträge structuring layer: Beziehungen zwischen Lexikoneinträgen (lexiko-semantische Beziehungen, Vererbungshierarchien) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Definition “Diskursmarker” (1) discourse-marker-entry [-ORTHOGRAPHY: string -WORD-SENSE-ID: word-sense-ID -LANGUAGE: (German | English) EXAMPLE: string -SEMANTIC-RELATION: ideational-relation* -INTENTION: interpersonal-relation* -NUCLEARITY: (S0-nucleus | S1-nucleus | multinuclear) -PRESUPPOSITION: (presupposed | not-presupposed) -STATUS: (internal | external) PART-OF-SPEECH: (conj | pronadv | coordc | subc | prep) ORDERING: ordering-type* POSITION: position-type* MODIFICATION: (modifiable | not-modifiable) POLARITY: (positive | negative) HYPOTHETICAL: (realized | unrealized) -STYLE: stylistic-preferences* SYNONYMS: word-sense-id* ANTONYMS: word-sense-id* HYPONYMS: word-sense-id* ] 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Definition “Diskursmarker” (2) ideational-relation (occasion | expansion) occasion [IDEATION: ideation-type POLARITY: (positive | negative) MODALIZATION: (realis | irrealis) MODALITY: (certain | possible)] ideation-type (additive | temporal | causal) temporal (preceding | co-occuring) preceding (before | meets) co-occuring (equals|starts|finishes|overlaps|during) position-type (initial | front | middle | end) stylistic-preferences -> [FORMALITY: (highfalutin | neutral | colloquial) USAGE: (neutral | archaic | rare) BREVITY: (concise | non-consice) ] 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Definition “temporale Diskursmarker” temporal-marker-entry [DISCOURSE-MARKER-INFO: discourse-marker-entry -SEMANTIC-RELATION: temporal-information -BOUNDEDNESS-SIT-M: boundedness-type* -BOUNDEDNESS-SIT-S: boundedness-type* -SITUATION-TYPE: situation-type* -AKTIONSART-MC: aktionsart-type* -ASPECT-MC: aspectual-type* -ASPECT-SC: aspectual-type* TENSE: tense-information* ] temporal-information [-TEMPORAL-RELATION: temporal CONSTRAINTS: proximity* EXTENSION: (dur | not-dur) proximity (prox | next |imm | same-place) 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Gliederung Motivation Stand der Forschung Ziele und Vorgehen Linguistische Beschreibung Computerlinguistische Anwendung Zusammenfassung 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Zusammenfassung Motivation Probleme bei Diskursmarkerwahl in der Textgenerierung fehlende linguistische Beschreibungen Diskursmarkeranalyse und – repräsentation Dimensionen der Beschreibung Analyse temporaler Diskursmarker funktionale Repräsentation Diskursmarkerlexikon Struktur des Lexikons Definition eines allgemeinen Lexikoneintrags Generierungslexikon und Beispieleinträge 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Beitrag der Arbeit (1) Definition der Klasse der Diskursmarker Test zur Identifikation deutscher Diskursmarker Beschreibung temporaler Diskursmarker Bestimmung der relevanten Beschreibungsdimensionen detaillierte Analyse deutscher temporaler Diskursmarker Integration vorhandener Einzelstudien funktionale Klassifikation Netzwerk deutscher temporaler Conjunctive Relations Vorarbeiten zu multilingualer Ressource Kohärenzrelationen allgemeine Strategie zur Bestimmung genre-spezifischer Kohärenzrelationen paradigmatische Beschreibung für den Texttyp 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote
Kolloquiumsvortrag Brigitte Grote Beitrag der Arbeit (2) Diskursmarkerlexikon Systematisierung der Beschreibungen einzelner Diskursmarker einheitliche Repräsentation im Diskursmarkerlexikon Definition der Lexikoneinträge entlang der EAGLES-Richtlinien Strategie zur Herleitung von Lexikoneinträgen Spezifikation von temporalen Lexikoneinträgen Automatische Diskursmarkerwahl Bereitstellung der Ressourcen Beschreibung der Auswahlprozedur Natural Language Processing deklaratives Diskursmarkerlexikon 12. Januar 2004 Kolloquiumsvortrag Brigitte Grote