eine Plattform für annotierte Korpora in XML

Slides:



Advertisements
Ähnliche Präsentationen
Vortrag Code-Dokumentation
Advertisements

Zur SCORM-Fähigkeit konventioneller XML-unterstützender eLearning Developer Tools im Projekt I-can-EIB OFFIS Oldenburger Forschungs- und Entwicklungsinstitut.
Hauptseminar im Sommersemester 2004
1 Jahr Digitization Lifecycle Überblick & Ausblick.
Modellgetriebene Softwareentwicklung
Workshop Squeak-Etoys
Dipl. Phys. Julika Mimkes Institute for Science Networking Oldenburg
LiLi und die Lernplattform
EXMARaLDA Grundlagen.
EXMARaLDA Überblick.
Dr. Christian Hänger, Magnus Pfeffer
S uchmaschinennetzwerk im i nternationalen n aturwissenschaftlichen n etz sinn Michael Hohlfeld: IuK 2003, Osnabrück,
Julika Mimkes ISN Oldenburg LiLi Links zu Lerninhalten der Physik Eine Datenbank zu verteilten Quellen Julika Mimkes Institute.
Dr. Helmuth Sagawe WS 2010/11 Universität Heidelberg
Korpusanalyse und Forschungsfrage Korpusbasierte Wissenserschließung (Übung)  im WS 2010/11 von Dr. phil. Helmuth Sagawe M.A.
BSZ Volker Conradt Bibliotheksservice-Zentrum Baden-Württemberg (BSZ) Ein Datenmodell für digitale Bibliotheken auf Basis der Dublin Core Empfehlungen.
Digitalisierung und Aufbereitung von Sprachdaten
Referat von Thomas Frenz auf der kostenlosen Veranstaltung zur Realschullehrerfortbildung an der Universität Passau 2003 © Th. Frenz Passau 2003.
Das AM Modell der Intonation
Die Phonetik und Sprachverarbeitung
Die Prosodie Jonathan Harrington Felicitas Kleber.
Intonationsunterschiede zwischen dem Nord- und Süddeutschen
Sprachaufnahmen und automatische (Vor-)Segmentierung
Transkription der Intonation mit GTOBI
Benötigte Applets Startseite: in HTML-Format Applet auf der Startseite Das Applet, das auf der Startseite geladen wird, wird die vier Buttons und die eine.
Werkzeuge und Softwareumgebung von Christian Michele.
Das Build-Tool ANT ETIS SS05. ETIS SS05 - Nadine FröhlichANT 2 Gliederung Motivation Build - Datei –Allgemeiner Aufbau –Project –Target –Task –Properties.
Die Verschriftung der Sprache
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Concurrent Versions System
Dipl. Phys. Marisela Bohne Universität Bremen Dipl. Phys. Julika Mimkes ISN Oldenburg.
Kategoriale Wahrnehmung
ELearning-Innovationen für den modernen Fremdsprachenunterricht STZ Sprachlernmedien The BACKBONE project has been funded with support by the EU Lifelong.
Anglo-Amerikanische Korpuslinguistik Anglo-American Corpus Linguistics Erstellt von Gudrun Krenn Slawische Korpuslinguistik SE SS 2006 Dr. Branko Tošović
Transkription ausgeben
Tag der Lehre Forschendes Lernen zum Thema 'LehrerInnenbildung im Sprachenbereich' Wilfried Wieden Universität Salzburg.
Bernd-Kristian Kaczenski Humboldt-Universität zu Berlin
Annotationen in Lernerkorpora am Beispiel des FALKO-Korpus
Transkriptionsbeispiel
XML-Lösungen für Geoinformationen
Melanie Andresen und Dagmar Knorr
1 Hauptziele Ihrer Schule Hauptziel 1 Bessere Leistungen der Schüler und Schülerinnen (hier Hauptziel 1 eintragen) Hauptziel 2 Bessere Leistungen der Schüler.
Kontrastive Untersuchung von Präpositionen (D-Fr)
Übungsaufgaben November 2007 Aufgabe 1
Eclipse – PHP Tool Integration (PTI) Sven Kiera, TWT Interactive GmbH.
Symposium: Die phonetisch-phonologischen, orthoepischen und orthographischen Unterschiede zwischen dem Bosnischen/Bosniakischen, Kroatischen und Serbischen.
Physik multimedial: LiLi und die Lernplattform physik multimedial Lehr- und Lernmodule für das Studium der Physik als Nebenfach Julika Mimkes:
XML in der Praxis: Electronic Bill Presentment (EBP) Institut für Wirtschaftsinformatik J. W. Goethe-University J. W. Goethe University Institute of Information.
GATE/Annie Zara Kanaeva, November 2002, Information Extraction.
Test 1 Test 2 Test 3. Test 4 Test 5 Test 6 Test 7 Test 8 Test 9.
Seminararbeit Release Management von Web-Systemen Minh Tran Lehrstuhl für Software Engineering RWTH Aachen
Einführung in die Phonetik und Phonologie SS 2010 Bistra Andreeva Sitzung 1: Einführender Überblick.
Phonetik und Phonologie
Phonetik und Phonologie
Technische und soziale forschungsinfrastrukturen für die humanities das beispiel dagaare – english – cantonese dictionary eveline wandl-vogt1, adams bodomo2,
Spracherkennung mit dynamisch geladenen, spezifischen Akustikmodellen
Test.
Phonetische Transkription Sitzung 2
© Skript IHK Augsburg in Überarbeitung Christian Zerle
Das AM Modell der Intonation
 Präsentation transkript:

eine Plattform für annotierte Korpora in XML Das LeaP Korpus und Pacx - eine Plattform für annotierte Korpora in XML Ulrike Gut UNIVERSITÄT AUGSBURG

LeaP Korpus erstellt 2001 bis 2003; Universität Bielefeld; Learning Prosody Projekt Lernerkorpus: L2 Englisch und L2 Deutsch (plus einige Muttersprachler) Gesamtgröße: 12 h; 131 Sprecher mit 32 unterschiedlichen L1s; vier Sprechstile vielfältige Annotationen und Metadaten (IMDI Format); Text-Ton-aligniert Datenformat XML-basiert (TASX) http://www.philhist.uni-augsburg.de/lehrstuehle/anglistik/applied/Research/leap/

Annotationen im LeaP Korpus 8 tiers Intonationsphrasen und nicht-sprachliche Ereignisse orthographische Transkription von Wörtern phonemische Transkription in SAMPA von Silben Segmente (Konsonanten und Vokale) Intonation (ToBI), Tonumfang Lemmata, POS Reliabilität der manuellen Annotationen überprüft (Gut & Bayerl 2004)

Pacx – Platform for annotated corpora in XML Integrierte Plattform zur Korpusannotation (in XML), -suche und -distribution Eclipse, Vex, Versionskontrolle (Subversion) Spezifikation von Annotationsschema Annotation mit XML-Editor Vex Build-Corpus-Skript: führt Anfragen und Tests durch, erzeugt Korpus und Webpage mit Links zu Rohdaten und Transkriptionen Integration von ELAN geplant (Annotation von gesprochener Sprache) http://pacx.sourceforge.net/