Richtlinien für die Annotation von Koreferenzen

Slides:



Advertisements
Ähnliche Präsentationen
Wiederaufnahme
Advertisements

Assoziative Anaphern Nico Kimm, MA
PG Intelligence Service
Referentielle Progression
Indirkte Anaphorik Ruprecht- Karls Universität Heidelberg
Zur Rolle der Sprache bei der Modellierung von Datenbanken
Generalisierung/Spezialisierung (1)
Die Definitionsphase -Objektorientierte Analyse - Das statische Modell
Seminar Textmining WS 06/07 Themen Übung 9 Multilingualität Weitere Termine: 13.7.Symbolfolgen und PageRank Findlinks mitstreiter gesucht!
Text-, Gesprächs- und Kommunikationsanalyse am Beispiel des Italienischen
kognitive und kommunikative Grundlagen der Sprachverarbeitung
Referenz 2010/2011.
Wiederaufnahme Oktober 2013.
Textlinguistik Entstehung, Entwicklung, Richtungen
Textlinguistik - Entwicklung, Richtungen, Isotopie -
Formale Sprachen – Mächtigkeit von Maschinenmodellen
MULI Multilinguale Informationsstruktur
Was ist ein kognitives System?
Hypertextualisierung mit Topic Maps Ein Ansatz zur Unterstützung des Textverständnisses bei der selektiven Rezeption von Fachtexten.
Modularization of XHTML™
Referent: Jan Kretzschmar1 Seminar Informationsverwaltung in Netzen Thema: RDF - Beschreibungen und Peer - To - Peer Routing Referent: Jan Kretzschmar.
Lexikalisch-Funktionale-Grammatik
Grundannahmen und die Stufen der sozialen Informationsverarbeitung
Explizite und editierbare Metainformationen für Software Muster.
Kohäsion vs. Kohärenz Universität Heidelberg Computerlinguistik
4 Philologische Methoden Vorlesung 1
-> Sprachpsychologie -> Blickbewegungen
Kognition und Lernen.
Silke Berger & Stephanie Haug
Teil 8 Lexical Functional Grammar Einführung
Deixis; Koreferenz, Anapher; Definitheit
Was versteht man unter XML Schema?
Körper und Wissen – Embodied Knowledge 3. Geist und Natur – Lebendiges und Unbelebtes Universität Augsburg HS, SS 2007 Philosophisch-Sozialwissenschaftliche.
Semantische Sprachverarbeitung Vorlesung 7 Diskursrepräsentationstheorie.
Entwicklung der Textlinguistik
Wissenserwerb mit Texten, Bildern und Diagrammen nach Wolfgang Schnotz
Beispiele der Textdefinitionen
Kohäsion und Kohärenz
Methoden der Textanalyse
Lexikalische Semantik
Context-awareness Andreas Bossard, Matthias Hert.
Beispiele von Objektkatalogen
Relationentheorie AIFB SS Relationen in 1NF und relationale Datenbanken(1/5) Attribut a Wertebereichdom(a) (domain) AttributemengeA = {a 1,...,
Das relationale Modell
Übung zu Einführung in die LDV I
© 2001 Sven Dammann1 Aufbau Integrierter Informationssysteme XML Bearbeitung und relationale Abbildung Sven Dammann Martin-Luther-Universität Halle-Wittenberg.
1 Polymorphe Konsistenzbedingungen (1) Polymorphe Konsistenzbedingungen legen fest, welche Arten von Zustandsbeschränkungen nach einer Konkretisierung.
Wiederaufnahme November 2014.
Textlinguistik Entstehung, Entwicklung, Richtungen
Bedeutungsbeziehungen
Lexikalische Semantik.
Agenten und Multi-Agenten-System
Semantic Web.
Theorien der Medienwirkung
Erweiterung bzgl. der Kardinalität. (1|9)
XML Schema Universität zu Köln Historisch-Kulturwissenschaftliche Informationsverarbeitung WS2011/2012 Hist.-kult.wiss. Informationsverarbeitung (Teil.
1 Relationale Datenbasisschemata (1) Substitution der Variablen zu Tupel- und Relationstypen. Für das Beispiel: Typ tupel EineArtikelArt ( ANr:Zeichen(8),
Leseförderung: Gliederung
Der Leseprozess.
Lesestrategien im kompetenzorientierten Literaturunterricht
Theoretische Schlüsselkonzepte
Rel-Modell Einige Definitionen (1|2) Kartesisches Produkt: W 1, W 2, …, W n beliebige Mengen. W 1  W 2  …  W n ::= {(w 1, w 2, …,
Gerhard Röhner September 2012
SS 2015 – IBB4C Datenmanagement Fr 17:00 – 18:30 R Vorlesung #2 Datenbankentwurf.
Konnektoren Dezember 2015.
Datenbankentwurf Gerhard Röhner September Modellierung.
Vo#1:Semantik als Wissenschaft Semantik I Matej-Bel-Universität in Banská Bystrica Zuzana Tuhárska.
13.Dezember 2006–1Elektronisches Publizieren: Schemasprachen — Relax NG Schemasprachen für XML — Relax NG — Anne Brüggemann-Klein TU München.
Wiederaufnahme und Referenz
Überschrift, nur Text Aus sprachwissenschaftlicher Sicht ist ein Text die sprachliche Form einer kommunikativen Handlung. Texte werden einerseits.
 Präsentation transkript:

Richtlinien für die Annotation von Koreferenzen Kerstin Kunz

I) Koreferenz als kognitives Kohärenzmittel

Kognition Informationsverarbeitung Vernetzungen von Wissenssystemen Interdependenz und Interaktion von kognitiven Prozessen Konzeptualisierung: Repräsentation von Realitätsbereichen Sprache als kognitives Subsystem Textrezeption: Repräsentation des Textes im Textweltmodell

Kohärenz Verbindung von Sätzen zu einem inhaltlich-logischen Zusammenhang Explizite Verknüpfungsstrategien Textoberfläche: z.B. temporal, lokal, pronominal Kohäsion Implizite Verknüpfungsstrategien Schlussfolgerung des Rezipienten Aktivierung des Kontextwissen Aktivierung des Weltwissen => Inferenzen => Koreferenz: explizite und implizite Relationen

Koreferenz Textinterner und textexterner Referenzbezug Textextern: Antezedent, Anapher(n) – Referent Textintern: Antezedent - Anapher(n) Referenzidentität Begriffserweiterung: direkte und indirekte anaphorische Relationen

Antezedent Anaphern Ein Mann .... Er .... Der Mann .... Der Mensch ... Ein anderer Mann Koreferenz Referent

Direkte Anaphern Referenzidentität: Antezedent, direkte Anaphern => außerprachlicher Referent Fortführung des Themas Relationstypen Rekurrenz Synonymie Hyponymie – Hyperonymie Pronominale Wiederaufnahme

Indirekte Anaphern Keine Referenzidentität zwischen Anker und indirekter Anapher Beibehaltung der Referenzdomäne durch semantische und konzeptuelle Relationen Thematische Rhematisierung Relationstypen Semantische Relationen Aktivierung von Wissen aus dem mentalen Lexikon Meronymie-basiert: Teil-von Beziehungen Konzeptuelle Relationen Aktivierung von Wissen aus dem Weltwissensspeicher Schema-basiert: Aktivierung eines expliziten Schemas Inferenz-basiert: implizite Weltwissensaktivierung

II) Annotationsschema für die manuelle Annotation von Koreferenzen im MMAX

Annotieren mit dem MMAX DTD Attribut-Fenster Markables Pointer Set membership Search-Fenster Kappa-Statistik

Das Attributfenster

Das Search-Fenster

Das Textkorpus Wirtschaftsmeldungen der Frankfurter Rundschau Insgesamt: 326 Meldungen; 125646 Token Tigerkorpus

Das Annotationsschema Antezedent Bezugsausdruck für direkte und indirekte Anaphern 2) Typen direkter Anaphern Rekurrenz: total, partiell IS-A-Relationen: Synonymie, Hyperonymie, Hyponymie Pronominaler Bezug: PPER, PDS, PPOS

Das Annotationsschema 3) Typen indirekter Anaphern Meronymie: Part-whole, entity-attribute, entity-member, place-area Schema-basiert: Conceptual, inferral

Probleme bei der Annotation Restriktionen durch das Tool Repräsentation mentaler Textrezeption durch maschinelles Annotationstool Eindimensionalität Pointing relation Unterscheidung zwischen Anker und Antezedent Zuordnung anaphorische Relation - Antezedent Membership Relation

Probleme bei der Annotation 2) Restriktionen durch Klassifizierung Eindeutige Festlegung der einzelnen Relationstypen Mischtypenproblematik Subjektivität des Annotierers

Ausblick Textsortenvergleich Multilingualer Vergleich Annotation durch mindestens zwei Annotierer