Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Katarina Wentz Geändert vor über 9 Jahren
1
Richtlinien für die Annotation von Koreferenzen
Kerstin Kunz
2
I) Koreferenz als kognitives Kohärenzmittel
3
Kognition Informationsverarbeitung Vernetzungen von Wissenssystemen
Interdependenz und Interaktion von kognitiven Prozessen Konzeptualisierung: Repräsentation von Realitätsbereichen Sprache als kognitives Subsystem Textrezeption: Repräsentation des Textes im Textweltmodell
4
Kohärenz Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang Explizite Verknüpfungsstrategien Textoberfläche: z.B. temporal, lokal, pronominal Kohäsion Implizite Verknüpfungsstrategien Schlussfolgerung des Rezipienten Aktivierung des Kontextwissen Aktivierung des Weltwissen => Inferenzen => Koreferenz: explizite und implizite Relationen
5
Koreferenz Textinterner und textexterner Referenzbezug
Textextern: Antezedent, Anapher(n) – Referent Textintern: Antezedent - Anapher(n) Referenzidentität Begriffserweiterung: direkte und indirekte anaphorische Relationen
6
Antezedent Anaphern Ein Mann .... Er .... Der Mann .... Der Mensch ... Ein anderer Mann Koreferenz Referent
7
Direkte Anaphern Referenzidentität:
Antezedent, direkte Anaphern => außerprachlicher Referent Fortführung des Themas Relationstypen Rekurrenz Synonymie Hyponymie – Hyperonymie Pronominale Wiederaufnahme
8
Indirekte Anaphern Keine Referenzidentität zwischen Anker und indirekter Anapher Beibehaltung der Referenzdomäne durch semantische und konzeptuelle Relationen Thematische Rhematisierung Relationstypen Semantische Relationen Aktivierung von Wissen aus dem mentalen Lexikon Meronymie-basiert: Teil-von Beziehungen Konzeptuelle Relationen Aktivierung von Wissen aus dem Weltwissensspeicher Schema-basiert: Aktivierung eines expliziten Schemas Inferenz-basiert: implizite Weltwissensaktivierung
9
II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX
10
Annotieren mit dem MMAX
DTD Attribut-Fenster Markables Pointer Set membership Search-Fenster Kappa-Statistik
11
Das Attributfenster
12
Das Search-Fenster
13
Das Textkorpus Wirtschaftsmeldungen der Frankfurter Rundschau
Insgesamt: 326 Meldungen; Token Tigerkorpus
14
Das Annotationsschema
Antezedent Bezugsausdruck für direkte und indirekte Anaphern 2) Typen direkter Anaphern Rekurrenz: total, partiell IS-A-Relationen: Synonymie, Hyperonymie, Hyponymie Pronominaler Bezug: PPER, PDS, PPOS
16
Das Annotationsschema
3) Typen indirekter Anaphern Meronymie: Part-whole, entity-attribute, entity-member, place-area Schema-basiert: Conceptual, inferral
17
Probleme bei der Annotation
Restriktionen durch das Tool Repräsentation mentaler Textrezeption durch maschinelles Annotationstool Eindimensionalität Pointing relation Unterscheidung zwischen Anker und Antezedent Zuordnung anaphorische Relation - Antezedent Membership Relation
18
Probleme bei der Annotation
2) Restriktionen durch Klassifizierung Eindeutige Festlegung der einzelnen Relationstypen Mischtypenproblematik Subjektivität des Annotierers
19
Ausblick Textsortenvergleich Multilingualer Vergleich
Annotation durch mindestens zwei Annotierer
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.