Abfragen aus einer Sprachdatenbank Jonathan Harrington
Aufbau & Funktion von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale (z.B. spektrale Daten) Eine Segmentliste Abfrage Die Signale davon Abfrage Signale Etikettierung Praat, EMUEMU R
Der Kern einer Abfrage Welche Ebene?Welche Einheiten? Phonetik u: (Alle u: Einheiten der Phonetik Ebene) WortDuden (Alle Duden Einheiten der Wort Ebene) = =
Welche Ebene?Welche Einheiten? Phonetic u: Findet Nicht nur in dieser Äußerung sondern in der gesamten Sprachdatenbank... =
Das Ergebnis einer Abfrage ist eine Segmentliste EtikettierungStartzeitEndzeitÄußerung
Beziehung: Segmentliste und Signale
Wie wird eine Abfrage durchgeführt? Database operations -> Query database
* wav bedeutet: alle Äußerungen mit dieser Extension abfragen *01* lab wäre: alle Äußerungen mit Extension.lab abfragen, die 01 in der Dateiname enthalten Alle "i:" Einheiten der Phonetic-Ebene
Das Ergebnis ist eine Segmentliste Als Text-Datei speichern: File -> Save, dann n.txt, in eigene Dateien (n ist ein beliebiger Name).
Die Text-Datei
starten > library(emu) > read.emusegs("H:/n.txt") angenommen, die Text-Datei ist n.txt und befindet sich in eigene Dateien Read 6 items Read 2 records segment list from database: timetable query was: Phonetic = i labels start end utts 1 i: HPTE003 2 i: HPTE003 Verbindung zur R-Programmiersprache
Oder die Abfrage direkt in R mit der emu.query() Funktion durchführen emu.query("timetable", "*", "Phonetic=i:") Welche Sprachdatenbank? Welche Äußerungen? Welche Abfrage? Siehe S. 8
1. Query database 2. Graphical query
Beziehung zwischen Graphical Query und Etikettierungen
Phonetic u: (Alle u: Einheiten der Phonetic Ebene)
* wav bedeutet: alle Äußerungen mit dieser Extension abfragen *01* lab wäre: alle Äußerungen mit Extension.lab abfragen, die 01 in der Dateiname enthalten
Ergebnis: Segmentliste save (Dateiname aussuchen)
Aufgabe Eine Textdatei aller Duden Einheiten der Word-Ebene speichern Ergebnis
Weitere Abfragen 1.1 Kernfragen 1. Abfragen aus einer Ebene 1.2 Reihenfolge (NB aus einer Ebene) [u:] Einheiten der Phonetik Ebene [u:] und [i:] Einheiten der Phonetik Ebene Einfach: Mehrere Einheiten: Einheiten außer irgendwelchen Einheiten Alle Einheiten außer Duden und Diele der Wort Ebene /b/ Phoneme vor /i:/ Phonemen (also /b/ in /bi:/) Duden der Word Ebene gefolgt von ist der Word Ebene (also Reihenfolgen von Duden ist) 2. Abfragen aus mehreren Ebenen /u:/ Phoneme in starken Silben /u:/ und /i:/ Phoneme vor /g/ Phoneme in starken Silben
Mehrere Einheiten Alle Einheiten außer einer/mehreren Einheiten 1.1 Kernfragen
/g i:/ Phoneme 1.2 Reihenfolge (NB aus einer Ebene)
H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene 2. Abfragen aus mehreren Ebenen
H-Phonetic Einheiten in /d/ Phonemen in L-Einheiten der Type Ebene Ergebnis
H Einheiten in /d/ Phonemen in Wörtern von Type L
Phoneme Einheiten /d/ Phoneme in Wörtern von Type L,die H Phonetic Einheiten dominieren
Fragen: siehe Lehre > Seminar EMU R > Query Übung