Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.

Slides:



Advertisements
Ähnliche Präsentationen
Aufbau, Abfrage, Analyse von Sprachdatenbanken
Advertisements

Spektrale Analysen in EMU-R: eine Einführung
Jonathan Harrington H*, L+H*, !H*, H+L*, L*+H Zuerst: A-M Modell (zur Erinnerung…)
Dynamische Seiten mit Dreamweaver Zugriff auf (mysql) Datenbank mit PHP.
Digitalisierung und Aufbereitung von Sprachdaten
Die Satzprosodie Phrasengrenzen, Akzentuierung, Intonation.
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die phonetischen Merkmale von Vokalen
Spektra von periodischen Signalen. Resonanz.
Formant-Analysen von Vokalen
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
Tina John Ebenen und Links in Sprachdatenbanken. Ebenen = Symbole werden mit der Zeit in einer Ebene verbunden. Namen der Ebenen Symbole der Word-Ebene.
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale.
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
Automatische Etikettierung in Sprachdatenbanken Tina John.
Grundlagen der Analyse von Sprachdatenbanken
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:
Spektrogramm und Spektrum
Anschließen des Rekorders n Anschließen des Kassetten- oder DAT -Recorders: n Die beiden Ausgänge (line out) des Rekorders werden mit den Eingängen (line.
Voice Onset Time (VOT) n ip006rb.001 laden Die Lallphase dauert nicht lange ip001rb.001 laden Peter tippt auf die Kieler - Wie unterscheidet sich [d] in.
Einführung in die Phonetik und Phonologie
Spektrogramm und Spektrum Sitzung 8 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht.
Aufnahmen n An dem ersten CSL-Gerät ist keine Aufnahme möglich Sitzung 2.
Starten von Multi-Speech Starten des Systems: n PC einschalten n Icon für Multi-Speech auf dem Desktop anklicken n Multi-Speech Main Program wählen Sitzung.
Phonetische Dauermessungen n c:\daten\instrpho\ip006rb.001 in Fenster A laden Die Lallphase dauert nicht lange c:\daten\instrpho\ip001rb.001 in Fenster.
Übung Akustische Phonetik
Logische Vektoren in R Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.
Formant-Analysen von Vokalen
Spektrale Analysen in EMU-R: eine Einführung
Anwendung von Emu-TCL Jonathan Harrington.
Formant-Analysen von Vokalen (2) Jonathan Harrington 1, 2 Struktur und Abbildung einer Trackdatei 3, 4. Anwendung von vorhandenen und eigenen Funktionen.
Berechnung von digitalen Signalen
Berechnung von digitalen Signalen Jonathan Harrington.
Sprachproduktion- und Sprachperzeption
Spektrale Analysen in EMU-R: eine Einführung
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
1. Satzbetonung, Töne, und Grundfrequenz
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Frequenz- und Zeitauflösung
Parametrisierung von Spektra
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Grundlagen der Analyse von Sprachdatenbanken
Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Jonathan Harrington H*, L+H*, H+L*, L*+H H*, H+L*, L*+H unterscheiden sich akustisch in der Synchronisierung des f0-Gipfels mit dem (primär betonten)
So animieren Sie Kreisdiagramme mit der Eingangs-Animation „Rad“
Tipps und Tricks für Word 2000 Aytac, Felix, Steffen 04/05.
HLSyn – eine Kurzeinführung
PDF-Datei erstellen Wir wollen nicht auf Papier drucken, sondern in eine PDF-Datei. (Portable Document Format) Wir öffnen das heruntergeladene Dokument.
Auf Wunsch einer einzelnen Dame
Die synchronen Grundlagen des Lautwandels Jonathan Harrington.
Zusammenfassung von Hombert et al (1979) und Löfqvist (1989)
Plosive [a d a] [a t a] [a th a]
Maya Kindler 5c. 1.Voraussetzungen für die Installation 2.Installation 3.Template lade, installieren und anpassen 4.Kategorie und Inhalt 5.Menü.
Maya Kindler 5c. 1.Voraussetzungen für die Installation 2.Installation 3.Template lade, installieren und anpassen 4.Kategorie und Inhalt 5.Menü.
Verbindung zwischen Praat und EMU Tina John. Etikettierungen: Praat zu EMU labeller 1. Praat Etikettierung4. EMU Etikettierung 2. labConvert: Konvertiert.
3. Sitzung K3.1 Phonetik und Phonologie II
Etikettierungsstrukturen und Abfragen in Emu Jonathan Harrington.
Sommersemester 2012 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einführung in die Instrumentalphonetik.
Integrated Product Development
Einf. in die Instrumentalphonetik Sommersemester 2015 Bistra Andreeva FR 4.7 Computerlinguistik & Phonetik Universität des Saarlandes
Phonetische Dauermessungen n ip006rb.wav laden “Die Lallphase dauert nicht lange” ip001rb.wav laden “Peter tippt auf die Kieler” - Wie unterscheidet sich.
Plosive [a d a] [a t a] [a th a]
 Präsentation transkript:

Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale (z.B. spektrale Daten) Eine Liste ausgewählter Symbole mit Zeiten Abfrage Die Signale davon Abfrage Signale Etikettierung Graphik Statistik Weitere Signalverarbeitung p << Praat, EmuEmu R

Ziele für die nächsten 2 Wochen Fünf einfache Äußerungen segmentieren und etikettieren. (Webseite, guten.zip) Verbindungen zwischen den 3 Softwaresystemen Praat, Emu, R durch diese Daten feststellen. Die Sprechdaten für A. Dauermessungen und VOT aufnehmen. (Webseite Aufgabe A) Siehe auch Video Demo (Link auch in der Webseite) -> Video Tutorials -> Chapter 2

1. Jede Äußerung mit Praat etikettieren

2 Dieselben Daten mit Emu darstellen

3. Eine sogenannte 'Segmentliste' in R erstellen Read 1 records segment list from database: new query was: Wort!=x labels start end utts 1 guten gam001

Die Forschungsfragen Ist die Überlappung zwischen /t/ und /d/ größer in dreisilbigen im Vergleich zu einsilbigen Wörtern? Liegt VOT von / ʃ t/ zwischen den VOT-Werten von /t/ und /d/, oder eher näher an /d/?

Die Forschungsfragen und Datenbank Wie soll die Datenbank aufgebaut werden, um diese Fragen beantworten zu können? Einige allgemeine Prinzipien Nur so viel etikettieren, wie von den Forschungsfragen verlangt wird. Nur Zeitgrenzen setzen, wenn erforderlich (Etikettieren ohne Zeitgrenzen zu setzen ist möglich in Emu, nicht in Praat). Die Etikettierungen der Sprachdatenbank so konstruieren, dass die benötigten Informationen problemlos abgefragt werden können. Das Setzen von Etikettierungsgrenzen ist teilweise arbiträr (weil Sprachlaute miteinander zeitlich überlappen). Man kann nur versuchen, konsistent zu sein

Die Datenbank: Signale VOT als Segment markieren. Linke Grenze = Verschlusslösung Rechte Grenze = Vokal-Onset (Periodizität) Vielleicht werden wir VOT proportional berechnen wollen (zB VOT in /t/ ist 60% vom Verschluss + Lösung). Daher die Lösung auch als (davorkommendes Segment markieren).

VOT in /t, d, ʃ t/ muss getrennt abfragbar sein. Wir müssen in der Abfrage zwischen 1 und 3 silbigen Wörtern differenzieren können. Vielleicht sind einige Wörter bezüglich VOT irgendwie 'seltsam'. Wir werden daher auch die Wort-Etikettierungen markieren. Es schadet nie, einen Sprecherkürzel zu setzen (sollten wir später alle Daten aus allen Sprechern zusammentun wollen). Die Datenbank: Etikettierungen

Verschluss: t oder d oder St VOT: h Signale und Etikettierungen

Dauer von Tanzboden bzw. jmh bzw. 3 in dieser Äußerung Etikettierungsstruktur Bedeutet: Der Segment Tanzboden besteht aus einer Reihenfolge von t und h Bedeutet: jmh und 3 sind Merkmale (Beschreibungen) von Tanzboden } Tanzboden (daher auch jmh und 3 ) hat keine eigene Dauer: sie erbt die Dauern aus der Phonetik Ebene.

Emu Templates definieren die Eigenschaften einer Datenbank. eine Template pro Datenbank. Extension.tpl Bitte ein Verzeichnis erzeugen (wenn noch nicht geschehen) in dem alle Templates in dieser Veranstaltung gespeichert werden sollen. Samba-Benutzer: mkdir ~username/TEM Windows: C:\Dokumente\TEMMac: /usr/Desktop/TEM Alle Verzeichnisnamen für alle Emu Aufgaben relativ 'einfach' machen. Beispiele: nicht empfehlenswert c:\Übungen-in-der-Phonetik\1st sem aufg\ 4\xy _5å \usw.\meine templates hier\2009

Emu Templates Damit Emu die Templates (und daher die Datenbanken) findet, bitte den von Ihnen ausgewählten Pfad für die Speicherung der Templates im Configuration Editor eintragen.

Die zip-Datei 'VOT' Daten in ein Verzeichnis auspacken*. H: ist der Name von diesem Verzeichnis (zB wenn Sie die zip Datei in c:\meine Daten auspacken, dann ist H: c:/meine Daten) Andere Benutzer Die wav-Daten sind in H:/vot/signale Samba-Benutzer H: ist /vdata/Seminare/Dbank H: ist ein Pfad. Die Signale *NB: Alle Verzeichnisnamen für alle Emu Aufgaben relativ 'einfach' machen...

Etikettierungen Ein Verzeichnis erzeugen, um die Etikettierungen zu speichern*. Windows Benutzer: C:\Dokumente\votlabs Mac-Benutzer: /usr/Desktop/votlabs zB Samba-Benutzer mkdir ~name/votlabs *NB: Alle Verzeichnisnamen für alle Emu Aufgaben relativ 'einfach' machen...

Signale und Etikettierungen Bitte den Pfad der Signale und Etikettierungen in einem textedit/notepad usw. Fenster für cut-and- paste bereit halten – da wir sie für die Erstellung der Template-Datei brauchen werden. NB: Samba-Benutzer. Die Signale sind in /vdata/Seminare/Dbank/Rdaten/vot/signale

Die Signalverarbeitung Das Ziel in diesem Fall, ist ein Signal zu bekommen, womit wir besser einschätzen können, wo die Grenze zwischen dem Frikativen und Verschluss liegt ?

Der Frikativ hat wesentlich mehr Energie zwischen ca. 2-9 kHz als der Verschluss. Wir könnten daher das Signal ca. in diesem Frequenzbereich filtern (sodass alle Teile vom Signal außerhalb dieses Frequenzbereichs herausgefiltert werden) und dann die Intensität von diesem gefilterten Signal berechnen. Diese Intensität müsste dann ziemlich steil (hoffentlich!) umkippen an der Grenze zwischen diesen Lauten. Vorschlag

Gefiltertes Signal und Intensität davon

Vorgang 3. wav Dateien filtern und in 1. speichern. 4. Die Intensität dieser gefilterten Dateien berechnen und auch 1. speichern 5. Die Template-Datei modifizieren, sodass nur das Spektrogramm + berechnetes Intensitäts-Signal sichtbar sind. 1. Ein Verzeichnis erzeugen (beliebiger Name): hier werden alle von den wav-Dateien abgeleiten Signale (wie die gefilterten Signale) gespeichert. 2. Verzeichnis-Name bitte notieren!

Berechnung von Formanten Akustisch lässt sich Vokalqualität durch die ersten zwei Formanten unterscheiden. F1 niedrig hoch F2 hochniedrig iu a e o

Unser Ziel ist festzustellen, ob wir eine ähnliche Verteilung für mehrere Vokale aus einer Sprachdatenbank bekommen...

Zwei Sprecher, Standarddeutsch, 4 verschiedene Vokale, gelesene Sprache

Sprachdatenbank second herunterladen

Vorgang 1. Signalverarbeitung fuer die Formantberechnung anwenden Weibliche Stimmen: Nominal Frequency auf 600 Hz setzen. 3. Verzeichnis auswählen (wo die Formanten gespeichet werden).

2. Template-Datei ändern damit die Formanten in Emu sichtbar sind Vorgang zu beachten: Der Track muss fm sein.

3. F1 und F2 in R dem zeitlichen Mittelpunkt von jedem Vokal entnehmen siehe formant.doc, pdf in der Webseite Vorgang

Wir entnehmen den Vokale Werte zum zeitlichen Mittelpunkt, weil hier der Vokal am wenigsten vom Kontext beeinflusst wird Spektrogramm von 'drüben' mit F2 markiert

Vorgang 4. Vokale-Ellipsen in R abbilden

5. ggf Formantfehler korrigieren 1. Formanten manuell korrigieren 2. Formantfehler Vorgang

Sprachdatenbank: second 1-5 für den Sprecher gam durchführen. Dann 1-5 für die Sprecherin gbr (Beide Sprecher: Standarddeutsch) Wie müssten sich (laut Theorie) die Formanten vom Sprecher und Sprecherin derselben Varietät unterscheiden? Vorgang

Ein Sprecher, eine Sprecherin Standarddeutsch, gemittelte Vokale, gelesene Sätze