Parametrisierung von Spektra

Slides:



Advertisements
Ähnliche Präsentationen
Spektrale Analysen in EMU-R: eine Einführung
Advertisements

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die phonetischen Merkmale von Vokalen
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Formant-Analysen von Vokalen
Tina John Ebenen und Links in Sprachdatenbanken. Ebenen = Symbole werden mit der Zeit in einer Ebene verbunden. Namen der Ebenen Symbole der Word-Ebene.
FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.
Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:
Spektrogramm und Spektrum
Logische Vektoren in R Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Die Varianzanalyse Jonathan Harrington.
Formant-Analysen von Vokalen
Spektrale Analysen in EMU-R: eine Einführung
Mixed models Jonathan Harrington
Grundlagen der R Programmiersprache
Anwendung von Emu-TCL Jonathan Harrington.
Formant-Analysen von Vokalen (2) Jonathan Harrington 1, 2 Struktur und Abbildung einer Trackdatei 3, 4. Anwendung von vorhandenen und eigenen Funktionen.
Kovarianz, Korrelation, (lineare) Regression
Berechnung von digitalen Signalen
Kovarianz, Korrelation, (lineare) Regression
Berechnung von digitalen Signalen Jonathan Harrington.
Logistische Regression und die Analyse von Proportionen
Spektrale Analysen in EMU-R: eine Einführung
Vokale und die Quantaltheorie
Logistische Regression und psychometrische Kurven
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Die t-Verteilung (fortgesetzt)
Frequenz- und Zeitauflösung
Die Anatomie der Grundfrequenz Jonathan Harrington.
Jonathan Harrington Bitonale Akzente. Bedeutungsunterschiede wegen unterschiedlicher f0-Vokal-Synchronisierungen werden im AM-System durch bitonale Akzente.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Artikulationsstelle, F2-Locus, Locusgleichungen Jonathan Harrington.
Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.
Kovarianz, Korrelation, (lineare) Regression
Die Diskrete-Cosinus-Transformation: Parametrisierung von Signalen in der Zeit und in der Frequenz Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.
Die Nulldurchgangsrate
Logistische Regression und die Analyse von Proportionen Jonathan Harrington.
Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid
Median Merkmal Geordneter Datensatz
Quantile.
Quantile.
Digital Audio Medientyp digital audio representation
Digital Audio Medientyp digital audio representation
Die t-Verteilung und die Prüfstatistik
Die t-Verteilung und die Prüfstatistik
Aufgabenzettel V Statistik I
Die t-Verteilung und die Prüfstatistik
Einige Kriterien für die Durchführung einer Varianzanalyse Jonathan Harrington.
Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.
f0 an f0 ab d ab d an Modell A: H* H*. Je größer die Dauer zwischen H*, umso mehr sackt f0 ab. Modell B: H* L H*. f0 sackt ab zu dem selben Wert unabhängig.
Messgrößen für Schallwellen
Messgrößen für Schallwellen
Messgrößen für Schallwellen
Herleitung DFT Spektrum zeitdiskretes Signal (periodisch) DFT IDFT
Analyse von Spektra 2 Jonathan Harrington 1. Wiederholung: Spektra in R einlesen 2. Einige grundlegende Funktionen 3. Zugriff auf Spektralwerte 4. Spektrale-Abbildungen.
Kovarianz, Korrelation, (lineare) Regression
Etikettierungsstrukturen und Abfragen in Emu Jonathan Harrington.
PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(ez)
Bitonale Akzente Jonathan Harrington.
Die Varianzanalyse Jonathan Harrington library(ggplot2) library(dplyr)
Logistische Regression und psychometrische Kurven
Die Anatomie der Grundfrequenz
 Präsentation transkript:

Parametrisierung von Spektra Energie-Summen Spektrale Momemte Spektrale Neigung Jonathan Harrington

Das Ziel ist allen 3 Fällen ist, ein Spektrum, das sehr viele (z. B Das Ziel ist allen 3 Fällen ist, ein Spektrum, das sehr viele (z.B. 64, 256, 512..) Werte enthält, auf ein paar Parameter zu reduzieren. Und zwar auf eine solche Weise, dass verschiedene phonetische Lautklassen voneinander differenziert werden können.

Spektra mit Default-Weren, berechnen, Sprachdatenbank florian # Segmentliste von 3 Vokalen v.s = emu.query("florian", "*", "phonetic=i:|u:|a:") # Label-Vektor v.l = label(v.s) # Spektrale Trackdatei v.dft = # Spektra zum zeitlichen Mittelpunkt sp = # Abbildung aller Spektra 0-3 kHz kodiert nach Vokal-Kategorie emu.track(v.s, "dft") dcut(v.dft, .5, prop=T) plot(sp[,0:3000], v.l, xlab="Frequenz (Hz)", ylab="Intensitaet (dB)")

1. Energie-Mittelwert 2 Frequenz-Bereichen, in denen sich die Vokale unterschieden. zB 2200-3000 Hz noch eine?

fapply(): eine Funktion anwenden auf Spektra dB Mittelwert 2200-3000 Hz vom ersten Segment? mittel = mean(sp[1,2200:3000]) plot(sp[1,2200:3000]) abline(h = mittel) Eine Funktion, fun auf alle Segmente einer spektralen Matrix m andwenden fapply(m, fun) dB-Mittelwert 2200-3000 Hz aller Segmente? a = fapply(sp[,2200:3000], mean) dB-Mittelwert aller Segmente vom anderen gewählten Frequenzbereich? b = Ellipse-Abbildung in diesem Raum beide = cbind(a, b) eplot(beide, v.l, dopoints=T)

m1: erstes spektrales Moment (spektrales Gewichtsschwerpunkt) Je mehr sich die Energie in höheren Frequenzen konzentriert, umso höher m1 (in Hz gemessen). (a) m1 ist ca. 2000 Hz (die Energie ist in den Frequenzen gleich verteilt) m1 wird nicht von der dB-Skalierung beeinflusst (b): m1 wie für (a) (a) m1 gleich/höher/tiefer im Vgl. zu (a)? (b) (c) (d)

m2: zweites spektrales Moment (spektrale Varianz) Je verteilter die Energie im Spektrum, umso höher m2 (in Hz2) m1 von c-f im Vgl. zu (a)? (a) m2 von (c, d) > (a) m2 von (e) im Vgl. zu (c)? (c) (d) (f) (e) m2 wird nicht von der dB-Skalierung beeinflusst m2 von (f) im Vgl. zu (d)? (b): m2 wie für (a)

Spektrale Momente einschätzen hoch tief m1 tief hoch

Spektrale Momente in Emu-R Die spektralen Momente im Bereich 0-3000 Hz vom ersten Segment? moments( sp[1,0:3000], minval=T ) p = Die spektralen Momente im Bereich 0-3000 Hz aller Segmente? p = fapply(sp[,0:3000], moments, minval=T) Ellipse-Abbildung im Raum m1 x m2 eplot(p[,1:2], v.l, dopoints=T)

Lineare Neigung 1500-3000 Hz positiv, flach, oder negativ? a: flach + - i: u:

Lineare Neigung 1500-3000 Hz Vom ersten Segment lm(sp[1,1500:3000] ~ trackfreq(sp[1,1500:3000]))$coef Funktion, um die lineare Neigung zu berechnen: spec = function(specdaten) { lm(specdaten ~ trackfreq(specdaten))$coef } Funktion auf alle Segmente anwenden erg = fapply(sp[,1500:3000], spec) Boxplot der Neigungen als Funktion der Vokal-Kategorie boxplot(erg[,2] ~ v.l)