Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Richtlinien für die Annotation von Koreferenzen Kerstin Kunz.

Ähnliche Präsentationen


Präsentation zum Thema: "Richtlinien für die Annotation von Koreferenzen Kerstin Kunz."—  Präsentation transkript:

1 Richtlinien für die Annotation von Koreferenzen Kerstin Kunz

2 I) Koreferenz als kognitives Kohärenzmittel

3 Kognition Informationsverarbeitung Vernetzungen von Wissenssystemen Interdependenz und Interaktion von kognitiven Prozessen Konzeptualisierung: Repräsentation von Realitätsbereichen Sprache als kognitives Subsystem Textrezeption: Repräsentation des Textes im Textweltmodell

4 Kohärenz Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang Explizite Verknüpfungsstrategien Textoberfläche: z.B. temporal, lokal, pronominal Kohäsion Implizite Verknüpfungsstrategien Schlussfolgerung des Rezipienten Aktivierung des Kontextwissen Aktivierung des Weltwissen => Inferenzen => Koreferenz: explizite und implizite Relationen

5 Koreferenz Textinterner und textexterner Referenzbezug Textextern: Antezedent, Anapher(n) – Referent Textintern: Antezedent - Anapher(n) Referenzidentität Begriffserweiterung: direkte und indirekte anaphorische Relationen

6 AntezedentAnaphern Ein Mann.... Er.... Der Mann.... Der Mensch... Ein anderer Mann Koreferenz Referent

7 Direkte Anaphern Referenzidentität: Antezedent, direkte Anaphern => außerprachlicher Referent Fortführung des Themas Relationstypen Rekurrenz Synonymie Hyponymie – Hyperonymie Pronominale Wiederaufnahme

8 Indirekte Anaphern Keine Referenzidentität zwischen Anker und indirekter Anapher Beibehaltung der Referenzdomäne durch semantische und konzeptuelle Relationen Thematische Rhematisierung Relationstypen Semantische Relationen Aktivierung von Wissen aus dem mentalen Lexikon Meronymie-basiert: Teil-von Beziehungen Konzeptuelle Relationen Aktivierung von Wissen aus dem Weltwissensspeicher Schema-basiert: Aktivierung eines expliziten Schemas Inferenz-basiert: implizite Weltwissensaktivierung

9 II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX

10 Annotieren mit dem MMAX DTD Attribut-Fenster Markables Pointer Set membership Search-Fenster Kappa-Statistik

11 Das Attributfenster

12 Das Search-Fenster

13 Das Textkorpus Wirtschaftsmeldungen der Frankfurter Rundschau Insgesamt: 326 Meldungen; Token Tigerkorpus

14 Das Annotationsschema 1)Antezedent Bezugsausdruck für direkte und indirekte Anaphern 2) Typen direkter Anaphern Rekurrenz: total, partiell IS-A-Relationen: Synonymie, Hyperonymie, Hyponymie Pronominaler Bezug: PPER, PDS, PPOS

15

16 Das Annotationsschema 3) Typen indirekter Anaphern Meronymie: Part-whole, entity-attribute, entity-member, place-area Schema-basiert: Conceptual, inferral

17 Probleme bei der Annotation 1)Restriktionen durch das Tool Repräsentation mentaler Textrezeption durch maschinelles Annotationstool Eindimensionalität Pointing relation Unterscheidung zwischen Anker und Antezedent Zuordnung anaphorische Relation - Antezedent Membership Relation

18 Probleme bei der Annotation 2) Restriktionen durch Klassifizierung Eindeutige Festlegung der einzelnen Relationstypen Mischtypenproblematik Subjektivität des Annotierers

19 Ausblick Textsortenvergleich Multilingualer Vergleich Annotation durch mindestens zwei Annotierer


Herunterladen ppt "Richtlinien für die Annotation von Koreferenzen Kerstin Kunz."

Ähnliche Präsentationen


Google-Anzeigen