Aufbau, Abfrage, Analyse von Sprachdatenbanken

Slides:



Advertisements
Ähnliche Präsentationen
Spektrale Analysen in EMU-R: eine Einführung
Advertisements

Vorname Nachname Titel Ihres Themas Unterthema 1 Unterthema 2 Unterthema 3 Unterthema 4 Hauptthema.
Berechnete Felder in Abfragen Mittels Abfragen können einfache, aber auch komplexe Informationen aus einer Tabelle gewonnen werden. Eine Besonderheit bieten.
Einführung in die neuen Medien Multimedia. I. Multimedia aus informationstechnischer Sicht II. Medientypen III. Die drei Ebenen von Multimedia IV. Medieneinsatz.
Lichtwellenleiter (LWL)
Die Soundkarte Von Patrick Gaschler.
Die akustische Analyse von Sprachlauten.
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale.
Software Praat: Doing Phonetics by Computer. Phonetik Institut, Amsterdam, EMU: Ein System für die Analyse von Sprachdatenbanken Macquarie.
Automatische Etikettierung in Sprachdatenbanken Tina John.
Grundlagen der Analyse von Sprachdatenbanken
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Übung Akustische Phonetik
Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Spektrale Analysen in EMU-R: eine Einführung
Berechnung von digitalen Signalen
Berechnung von digitalen Signalen Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Grundlagen der Analyse von Sprachdatenbanken
Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Eine objektorientierte Einführung in den Umgang mit Datenbanken
Informatik Klasse 7 Grundlagen.
Access starten Mit Datenbanken arbeiten.
Kubische Bézier Kurven
Datenbanken 2: Einfache Aufgaben mit TabCalc
Tracking & Tracing Deutschland
Muster zum Erstellen einer Abfrage mit der interaktiven Datenbank
Input / Wahrnehmung Control / Bewusstsein Output / Motorik Information.
EXCEL PROFESSIONAL KURS
Übung zur Vorlesung Signalverarbeitung Einführung
Abfragen definieren Beispiele für Abfragen: Microsoft Query:
Digitale Regelungstechnik für Dummies
3. Datensätze sortieren und filtern1 l Hauptdokument öffnen l Symbol in der Symbolleiste Seriendruck anklicken l Im Dialogfenster Seriendruckempfänger.
Lernhilfe zur Kommunikationsanlagen
MATHEMATIK UND AKUSTISCHE SIGNALVERARBEITUNG
Computerorientierte Physik VORLESUNG und Übungen VORBESPRECHUNG Zeit: Mo , Uhr Ort: Hörsaal 5.01, Institut für Experimentalphysik, Universitätsplatz.
Sirius MES Das modulare System für Ihre Logistik (steuern mit Klick oder Pfeiltasten)
Eigene Listen Muster Blatt 1 v.7 Zum Start empfiehlt sich die Auswahl einer Musterliste, die dann angepasst werden kann. 2 1.
Aggregatsfunktion SQL = Structured Query Language.
Akustische Modelle der Sprachproduktion
Kalibrierung eines Mikrofons unter DASYLab
Tonhöhenwahrnehmung Wozu?
Was heißt ‘ ‘? Visuelles Management
Plosive [a d a] [a t a] [a th a]
Structured Query Language
Vorstellung Web-Service Wellemöbel GmbH. Erste Anforderungen Lieferzeiten für Programme im Handel sehr oft fix hinterlegt (6-8 Wochen) Lieferlisten werden.
Verbindung zwischen Praat und EMU Tina John. Etikettierungen: Praat zu EMU labeller 1. Praat Etikettierung4. EMU Etikettierung 2. labConvert: Konvertiert.
Oracle – XSQL in der Anwendung Thomas Matzke, 99IN.
Brain Sound II EEG & Sonifikation Abteilung für Epileptologie
Alexander Krischan 8C. Vorraussetzungen zur Installation mit VestaCP Anmelden…
4. Analog-Digital-Umsetzer Analog-Digital-Converter (ADC)
Aufbau eines nationalen GBIF Knotens für Prokaryonten und Viren bei DSMZ Digitalisierung des Datenbestandes und Harmonisierung der Datenerhebung in Deutschen.
Etikettierungsstrukturen und Abfragen in Emu Jonathan Harrington.
Arbeitsblatt I: Workshop Naturwissenschaften – Welche fachspezifischen Elemente sind bei der Umsetzung Forschenden Lernens zu berücksichtigen? Titel Modul/
Stochastische Signale
Einführung in die Phonetik und Phonologie SS 2010 Bistra Andreeva Sitzung 1: Einführender Überblick.
Gt177 / / Messung und Berechnung Sequenz 1 Erfassung der Quellendaten 7 mobile Stationen für Tonaufzeichnung.
Layout "Titel mit Bildern"
Kamerabasierte Zeit- und Geschwindigkeitsmessung
 Präsentation transkript:

Aufbau, Abfrage, Analyse von Sprachdatenbanken Erstellung Analyse Abfrage R Praat, Emu Emu Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen Signalverarbeitung abgeleitete Signale (z.B. spektrale Daten) Die Signale davon Abfrage Graphik Statistik Weitere Signalverarbeitung p << 0.001 Signale Etikettierung Eine Liste ausgewählter Symbole mit Zeiten Abfrage

Ziele für die nächsten 2 Wochen Fünf einfache Äußerungen segmentieren und etikettieren. (Webseite, guten.zip) Verbindungen zwischen den 3 Softwaresystemen Praat, Emu, R durch diese Daten feststellen. (On-line Demo, Webseite, Demo1. Die Sprechdaten für A. Dauermessungen und VOT aufnehmen. (Webseite Aufgabe A)

1. Jede Äußerung mit Praat etikettieren

2 Dieselben Daten mit Emu darstellen

3. Eine sogenannte 'Segmentliste' in R erstellen Read 1 records segment list from database: new query was: Wort!=x labels start end utts 1 guten 371.64 776.06 gam001

Die Forschungsfragen Ist die Überlappung zwischen /t/ und /d/ größer in dreisilbigen im Vergleich zu einsilbigen Wörtern? Liegt VOT von /ʃt/ zwischen den VOT-Werten von /t/ und /d/, oder eher näher an /d/?

Die Forschungsfragen und Datenbank Wie soll die Datenbank aufgebaut werden, um diese Fragen beantworten zu können? Einige allgemeine Prinzipien Nur so viel etikettieren, wie von den Forschungsfragen verlangt wird. Die Etikettierungen der Sprachdatenbank so konstruieren, dass die benötigten Informationen problemlos abgefragt werden können. Nur Zeitgrenzen setzen, wenn erforderlich (Etikettieren ohne Zeitgrenzen zu setzen ist möglich in Emu, nicht in Praat). Das Setzen von Etikettierungsgrenzen ist teilweise arbiträr (weil Sprachlaute miteinander zeitlich überlappen). Man kann nur versuchen, konsistent zu sein

Die Datenbank: Signale VOT als Segment markieren. Linke Grenze = Verschlusslösung Rechte Grenze = Vokal-Onset (Periodizität) Vielleicht werden wir VOT proportional berechnen wollen (zB VOT in /t/ ist 60% vom Verschluss + Lösung). Daher die Lösung auch als (davorkommendes Segment markieren).

Die Datenbank: Etikettierungen VOT in /t, d, St/ muss differenzierbar sein. Wir müssen zwischen 1 und 3 silbigen Wörtern differenzieren können. Vielleicht sind einige Wörter bezüglich VOT irgendwie 'seltsam'. Wir werden daher auch die Wort-Etikettierungen markieren. Es schadet nie, einen Sprecherkürzel zu setzen (sollten wir später alle Daten aus allen Sprechern zusammentun wollen).

Signale und Etikettierungen Verschluss: t oder d oder St VOT: h

} Etikettierungsstruktur Bedeutet: jmh und 3 sind Merkmale (Beschreibungen) von Tanzboden } Bedeutet: Der Segment Tanzboden besteht aus einer Reihenfolge von t und h Tanzboden (daher auch jmh und 3) hat keine eigene Dauer: sie erbt die Dauern aus der Phonetik Ebene. Dauer von Tanzboden bzw. jmh bzw. 3 in dieser Äußerung

Die zip-Datei 'VOT' Daten in 'Eigene Dateien' entpacken. 10 .wav Dateien sind dann in H:/vot/signale Die Etikettierungen werden in H:/vot/lab gespeichert. Eine Template-Datei laut dem Muster auf. S.10/11 erstellen, und 5 dieser Äußerungen etikettieren.

? Die Signalverarbeitung Das Ziel in diesem Fall, ist ein Signal zu bekommen, womit wir besser einschätzen können, wo die Grenze zwischen dem Frikativen und Verschluss liegt ?

Vorschlag Der Frikativ hat wesentlich mehr Energie zwischen ca. 2-9 kHz als der Verschluss. Wir könnten daher das Signal ca. in diesem Frequenzbereich filtern (sodass alle Teile vom Signal außerhalb dieses Frequenzbereichs herausgefiltert werden) und dann die Intensität von diesem gefilterten Signal berechnen. Diese Intensität müsste dann ziemlich steil (hoffentlich!) umkippen an der Grenze zwischen diesen Lauten.

Gefiltertes Signal und Intensität davon

Vorgang 1. wav Dateien filtern. Die gefilterten Dateien in H:/vot/abgeleitet speichern 2. Die Intensität dieser gefilterten Dateien berechnen und auch in H:/vot/abgeleitet speichern 3. Die Template-Datei modifizieren, sodass nur das Spektrogramm + berechnetes Intensitäts-Signal sichtbar sind.

Berechnung von Formanten Akustisch lässt sich Vokalqualität durch die ersten zwei Formanten unterscheiden. niedrig i u F1 e o hoch a hoch niedrig F2

Unser Ziel ist festzustellen, ob wir eine ähnliche Verteilung für mehrere Vokale aus einer Sprachdatenbank bekommen...

Zwei Sprecher, Standarddeutsch, 4 verschiedene Vokale, gelesene Sprache

1. Signalverarbeitung fuer die Formantberechnung anwenden Vorgang 1. Signalverarbeitung fuer die Formantberechnung anwenden 3. 1. 2. 4. 5. 3. Verzeichnis auswählen (wo die Formanten gespeichet werden). 4. Weibliche Stimmen: Nominal Frequency auf 600 Hz setzen.

Vorgang 2. Template-Datei ändern damit die Formanten in Emu sichtbar sind zu beachten: Der Track muss fm sein.

Vorgang 3. F1 und F2 in R dem zeitlichen Mittelpunkt von jedem Vokal entnehmen siehe formant.doc, pdf in der Webseite

Wir entnehmen den Vokale Werte zum zeitlichen Mittelpunkt, weil hier der Vokal am wenigsten vom Kontext beeinflusst wird Spektrogramm von 'drüben' mit F2 markiert

Vorgang 4. Vokale-Ellipsen in R abbilden

Vorgang 5. ggf Formantfehler korrigieren 2. Formantfehler 1. Formanten manuell korrigieren

Vorgang Sprachdatenbank: stops 1-5 für den Sprecher gam durchführen. Dann 1-5 für die Sprecherin gbr (Beide Sprecher: Standarddeutsch) Wie müssten sich (laut Theorie) die Formanten vom Sprecher und Sprecherin derselben Varietät unterscheiden?

Ein Sprecher, eine Sprecherin Standarddeutsch, gemittelte Vokale, gelesene Sätze