Grundlagen der Analyse von Sprachdatenbanken Tina John
Sprachdatenbanken Was sind Sprachdatenbanken? Sammlung von Sprechdaten Hierzu können gehören: Zeitsignale (digital): akustische, artikulatorische Aus dem Zeitsignal abgeleitete Signale z.Bsp. spektrale Daten Etikettierungen der Signale: Verknüpfung von Signalteilen an Symbole
Sprachdatenbanken heutzutage 1. Mehrere Sprachdatenbanken sind heutzutage vorhanden, z.B. Linguistic Data Consortium (LDC) . Bavarian archive for speech signals . Tones and Break Indices (für prosodische Etikettierung) . IPDS Kiel corpus of spontaneous speech . 2. ‘Open-source’ Software für die Analyse von Sprachdatenbanken und für die digitale Sprachverarbeitung kann jetzt vom Netz heruntergeladen werden.
Aufbau & Funktion von Sprachdatenbanken Erstellung Analyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale (z.B. spektrale Daten) Die Signale davon Abfrage Graphik Statistik Weitere Signalverarbeitung p << 0.001 Signale Etikettierung Eine Liste ausgewählter Symbole mit Zeiten Abfrage
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, 1998- http://www.praat.org EMU: Ein System für die Analyse von Sprachdatenbanken 1988- Macquarie Universität, Sydney und IPDS, Kiel http://emu.sourceforge.net/ R: Eine allgemeine Programmiersprache. Das ‘open-source’ Äquivalent von der ‘S’ (‘Splus’) Programmiersprache. 1988- http://www.r-project.org/
1. Sprachdatenbank Erstellung EMU: Hierarchisches Etikettieren
1. Sprachdatenbank Erstellung Signalverarbeitung: EMU-tkassp z.B. alle wav-Dateien einer Sprachdatenbank
2. Sprachdatenbank Abfrage EMU z.B. Alle Vokale in Wortinitialen Silben und deren ersten 2 Formanten zum zeitlichen Mittelpunkt finden x
3. Sprachdatenbank Analyse R Programmiersprache + EMU Funktionen in R z.B. F1 x F2 Verteilung von [I a U] in einer Sprachendatenbank 200 I A I U 300 U U U U U U U U U U U U U U U U U U A U U U U 400 A U A U F1 (Hz) A A U A A A A A A A A A A A 500 A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A A 600 A A A A A A A A A A A A A A A A A A A A 700 A A A 2500 2000 1500 1000 F2 (Hz)