Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

eine Plattform für annotierte Korpora in XML

Ähnliche Präsentationen


Präsentation zum Thema: "eine Plattform für annotierte Korpora in XML"—  Präsentation transkript:

1 eine Plattform für annotierte Korpora in XML
Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut UNIVERSITÄT AUGSBURG

2 LeaP Korpus erstellt 2001 bis 2003; Universität Bielefeld; Learning Prosody Projekt Lernerkorpus: L2 Englisch und L2 Deutsch (plus einige Muttersprachler) Gesamtgröße: 12 h; 131 Sprecher mit 32 unterschiedlichen L1s; vier Sprechstile vielfältige Annotationen und Metadaten (IMDI Format); Text-Ton-aligniert Datenformat XML-basiert (TASX)

3 Annotationen im LeaP Korpus
8 tiers Intonationsphrasen und nicht-sprachliche Ereignisse orthographische Transkription von Wörtern phonemische Transkription in SAMPA von Silben Segmente (Konsonanten und Vokale) Intonation (ToBI), Tonumfang Lemmata, POS Reliabilität der manuellen Annotationen überprüft (Gut & Bayerl 2004)

4 Pacx – Platform for annotated corpora in XML
Integrierte Plattform zur Korpusannotation (in XML), -suche und -distribution Eclipse, Vex, Versionskontrolle (Subversion) Spezifikation von Annotationsschema Annotation mit XML-Editor Vex Build-Corpus-Skript: führt Anfragen und Tests durch, erzeugt Korpus und Webpage mit Links zu Rohdaten und Transkriptionen Integration von ELAN geplant (Annotation von gesprochener Sprache)


Herunterladen ppt "eine Plattform für annotierte Korpora in XML"

Ähnliche Präsentationen


Google-Anzeigen