Parametrisierung von Spektra

Slides:

Advertisements

Ähnliche Präsentationen

Spektrale Analysen in EMU-R: eine Einführung

Advertisements

Multivariate Analysemethoden Johannes Gutenberg Universität Mainz

Die akustische Analyse von Sprachlauten.

Quellen-Filter Theorie der Sprachproduktion

Die phonetischen Merkmale von Vokalen

Die akustische Analyse von Sprachlauten

Spektra von periodischen Signalen. Resonanz.

Formant-Analysen von Vokalen

Tina John Ebenen und Links in Sprachdatenbanken. Ebenen = Symbole werden mit der Zeit in einer Ebene verbunden. Namen der Ebenen Symbole der Word-Ebene.

FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.

Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:

Spektrogramm und Spektrum

Logische Vektoren in R Jonathan Harrington.

Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.

Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.

Die Varianzanalyse Jonathan Harrington.

Formant-Analysen von Vokalen

Spektrale Analysen in EMU-R: eine Einführung

Mixed models Jonathan Harrington

Grundlagen der R Programmiersprache

Anwendung von Emu-TCL Jonathan Harrington.

Formant-Analysen von Vokalen (2) Jonathan Harrington 1, 2 Struktur und Abbildung einer Trackdatei 3, 4. Anwendung von vorhandenen und eigenen Funktionen.

Kovarianz, Korrelation, (lineare) Regression

Berechnung von digitalen Signalen

Kovarianz, Korrelation, (lineare) Regression

Berechnung von digitalen Signalen Jonathan Harrington.

Logistische Regression und die Analyse von Proportionen

Spektrale Analysen in EMU-R: eine Einführung

Vokale und die Quantaltheorie

Logistische Regression und psychometrische Kurven

Abfragen aus einer Sprachdatenbank Jonathan Harrington.

Die t-Verteilung (fortgesetzt)

Frequenz- und Zeitauflösung

Die Anatomie der Grundfrequenz Jonathan Harrington.

Jonathan Harrington Bitonale Akzente. Bedeutungsunterschiede wegen unterschiedlicher f0-Vokal-Synchronisierungen werden im AM-System durch bitonale Akzente.

Abfragen aus einer Sprachdatenbank Jonathan Harrington.

Artikulationsstelle, F2-Locus, Locusgleichungen Jonathan Harrington.

Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.

Kovarianz, Korrelation, (lineare) Regression

Die Diskrete-Cosinus-Transformation: Parametrisierung von Signalen in der Zeit und in der Frequenz Jonathan Harrington.

Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.

Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.

Die Nulldurchgangsrate

Logistische Regression und die Analyse von Proportionen Jonathan Harrington.

Zeitreihenanalyse WS 2004/2005 Michael Hauhs / Gunnar Lischeid

Median Merkmal Geordneter Datensatz

Digital Audio Medientyp digital audio representation

Digital Audio Medientyp digital audio representation

Die t-Verteilung und die Prüfstatistik

Die t-Verteilung und die Prüfstatistik

Aufgabenzettel V Statistik I

Die t-Verteilung und die Prüfstatistik

Einige Kriterien für die Durchführung einer Varianzanalyse Jonathan Harrington.

Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.

f0 an f0 ab d ab d an Modell A: H* H*. Je größer die Dauer zwischen H*, umso mehr sackt f0 ab. Modell B: H* L H*. f0 sackt ab zu dem selben Wert unabhängig.

Messgrößen für Schallwellen

Messgrößen für Schallwellen

Messgrößen für Schallwellen

Herleitung DFT Spektrum zeitdiskretes Signal (periodisch) DFT IDFT

Analyse von Spektra 2 Jonathan Harrington 1. Wiederholung: Spektra in R einlesen 2. Einige grundlegende Funktionen 3. Zugriff auf Spektralwerte 4. Spektrale-Abbildungen.

Kovarianz, Korrelation, (lineare) Regression

Etikettierungsstrukturen und Abfragen in Emu Jonathan Harrington.

PCA Principal Component Analysis. Gliederung PCA – Warum eigentlich? PCA – Was ist zu tun? Was passiert eigentlich? Anwendungen Zusammenfassung.

Die Varianzanalyse Jonathan Harrington library(ggplot2) library(ez)

Bitonale Akzente Jonathan Harrington.

Die Varianzanalyse Jonathan Harrington library(ggplot2) library(dplyr)

Logistische Regression und psychometrische Kurven

Die Anatomie der Grundfrequenz

Präsentation transkript:

Parametrisierung von Spektra Energie-Summen Spektrale Momemte Spektrale Neigung Jonathan Harrington

Das Ziel ist allen 3 Fällen ist, ein Spektrum, das sehr viele (z. B Das Ziel ist allen 3 Fällen ist, ein Spektrum, das sehr viele (z.B. 64, 256, 512..) Werte enthält, auf ein paar Parameter zu reduzieren. Und zwar auf eine solche Weise, dass verschiedene phonetische Lautklassen voneinander differenziert werden können.

Spektra mit Default-Weren, berechnen, Sprachdatenbank florian # Segmentliste von 3 Vokalen v.s = emu.query("florian", "*", "phonetic=i:|u:|a:") # Label-Vektor v.l = label(v.s) # Spektrale Trackdatei v.dft = # Spektra zum zeitlichen Mittelpunkt sp = # Abbildung aller Spektra 0-3 kHz kodiert nach Vokal-Kategorie emu.track(v.s, "dft") dcut(v.dft, .5, prop=T) plot(sp[,0:3000], v.l, xlab="Frequenz (Hz)", ylab="Intensitaet (dB)")

1. Energie-Mittelwert 2 Frequenz-Bereichen, in denen sich die Vokale unterschieden. zB 2200-3000 Hz noch eine?

fapply(): eine Funktion anwenden auf Spektra dB Mittelwert 2200-3000 Hz vom ersten Segment? mittel = mean(sp[1,2200:3000]) plot(sp[1,2200:3000]) abline(h = mittel) Eine Funktion, fun auf alle Segmente einer spektralen Matrix m andwenden fapply(m, fun) dB-Mittelwert 2200-3000 Hz aller Segmente? a = fapply(sp[,2200:3000], mean) dB-Mittelwert aller Segmente vom anderen gewählten Frequenzbereich? b = Ellipse-Abbildung in diesem Raum beide = cbind(a, b) eplot(beide, v.l, dopoints=T)

m1: erstes spektrales Moment (spektrales Gewichtsschwerpunkt) Je mehr sich die Energie in höheren Frequenzen konzentriert, umso höher m1 (in Hz gemessen). (a) m1 ist ca. 2000 Hz (die Energie ist in den Frequenzen gleich verteilt) m1 wird nicht von der dB-Skalierung beeinflusst (b): m1 wie für (a) (a) m1 gleich/höher/tiefer im Vgl. zu (a)? (b) (c) (d)

m2: zweites spektrales Moment (spektrale Varianz) Je verteilter die Energie im Spektrum, umso höher m2 (in Hz2) m1 von c-f im Vgl. zu (a)? (a) m2 von (c, d) > (a) m2 von (e) im Vgl. zu (c)? (c) (d) (f) (e) m2 wird nicht von der dB-Skalierung beeinflusst m2 von (f) im Vgl. zu (d)? (b): m2 wie für (a)

Spektrale Momente einschätzen hoch tief m1 tief hoch

Spektrale Momente in Emu-R Die spektralen Momente im Bereich 0-3000 Hz vom ersten Segment? moments( sp[1,0:3000], minval=T ) p = Die spektralen Momente im Bereich 0-3000 Hz aller Segmente? p = fapply(sp[,0:3000], moments, minval=T) Ellipse-Abbildung im Raum m1 x m2 eplot(p[,1:2], v.l, dopoints=T)

Lineare Neigung 1500-3000 Hz positiv, flach, oder negativ? a: flach + - i: u:

Lineare Neigung 1500-3000 Hz Vom ersten Segment lm(sp[1,1500:3000] ~ trackfreq(sp[1,1500:3000]))$coef Funktion, um die lineare Neigung zu berechnen: spec = function(specdaten) { lm(specdaten ~ trackfreq(specdaten))$coef } Funktion auf alle Segmente anwenden erg = fapply(sp[,1500:3000], spec) Boxplot der Neigungen als Funktion der Vokal-Kategorie boxplot(erg[,2] ~ v.l)