Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.

Slides:



Advertisements
Ähnliche Präsentationen
Spektrale Analysen in EMU-R: eine Einführung
Advertisements

Polynomial Root Isolation
Filterung der räumlichen Frequenzen
Vom graphischen Differenzieren
Morphem und Allomorph Jonathan Harrington.
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Formant-Analysen von Vokalen
Tina John Ebenen und Links in Sprachdatenbanken. Ebenen = Symbole werden mit der Zeit in einer Ebene verbunden. Namen der Ebenen Symbole der Word-Ebene.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:
Die akustische Analyse von Sprachlauten
Übung Akustische Phonetik
Logische Vektoren in R Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Formant-Analysen von Vokalen
Spektrale Analysen in EMU-R: eine Einführung
Grundlagen der R Programmiersprache
Formant-Analysen von Vokalen (2) Jonathan Harrington 1, 2 Struktur und Abbildung einer Trackdatei 3, 4. Anwendung von vorhandenen und eigenen Funktionen.
Berechnung von digitalen Signalen
Berechnung von digitalen Signalen Jonathan Harrington.
Logistische Regression und die Analyse von Proportionen
Spektrale Analysen in EMU-R: eine Einführung
Vokale und die Quantaltheorie
Logistische Regression und psychometrische Kurven
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Berechung von Schalldruckpegeln
Frequenz- und Zeitauflösung
Parametrisierung von Spektra
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Artikulationsstelle, F2-Locus, Locusgleichungen Jonathan Harrington.
Methode 1. Konvertierung der Hz-Werte in log-Hz Die Sprecherunterschiede werden reduziert Die Wahrnehmung der Frequenzunterschiede ist eher logarithmisch.
Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.
Die Diskrete-Cosinus-Transformation: Parametrisierung von Signalen in der Zeit und in der Frequenz Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Was ist die artikulatorische Grundlage von Locus-Gleichungen? Hauptseminar: Modelle der Sprachproduktion & - perzeption Dozent: Prof. Dr. Jonathan Harrington.
Kovarianz, Korrelation, (lineare) Regression Jonathan Harrington BITTE NOCH EINMAL dframes.zip (Webseite 4.1) herunterladen und in pfad auspacken.
Die Nulldurchgangsrate
Logistische Regression und die Analyse von Proportionen Jonathan Harrington.
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Pattern sensitivity Campbell & Robson (1968).
Spektralanalyse Spektralanalyse ist derart wichtig in allen Naturwissenschaften, dass man deren Bedeutung nicht überbewerten kann! Mit der Spektralanalyse.
Ein Seminar in Computer Grafik von Johannes Bochmann
Digital Audio Medientyp digital audio representation
Digital Audio Medientyp digital audio representation
Histogramm/empirische Verteilung Verteilungen
Zeit, Ort und Weg Geschwindigkeit Beschleunigung
Analyse nach harmonischen Schwingungen
Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.
EMA in Emu-R Jonathan Harrington
§3 Allgemeine lineare Gleichungssysteme
Polynome und schnelle Fourier-Transformation
Messgrößen für Schallwellen
Begriffe zu Schwingungen
Bewegung auf der Kreisbahn: Die Zentripetalbeschleunigung
Verwandtschaft zwischen der Schwingung und der Bewegung auf der Kreisbahn.
Inhalt Weg-Zeitgesetz nach der cos- oder sin- Funktion
Herleitung DFT Spektrum zeitdiskretes Signal (periodisch) DFT IDFT
Analyse von Spektra 2 Jonathan Harrington 1. Wiederholung: Spektra in R einlesen 2. Einige grundlegende Funktionen 3. Zugriff auf Spektralwerte 4. Spektrale-Abbildungen.
Eine kleine Einführung für Studierende der Psychologie
Plosive [a d a] [a t a] [a th a]
Vom graphischen Differenzieren
3. Sitzung K3.1 Phonetik und Phonologie II
Etikettierungsstrukturen und Abfragen in Emu Jonathan Harrington.
 Gegenstandsbereich der Testtheorie: Analyse der Charakteristika von Tests:  Güte von Tests.  Struktur von Tests.  Schwierigkeit von Tests.  Gruppenunterschiede.
Plosive [a d a] [a t a] [a th a]
 Präsentation transkript:

Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington

1. Ein digitales Sinusoid 2. Fourier-Analyse 5. Berechnung von Spektra mit Emu 3. Ein Spektrum 4. Frequenz- und Zeitauflösung

1. Ein digitales Sinusoid Amplitude Time (number of points) crplot() die Höhe über eine horizontale Linie eines Punktes, der sich in zeit-regelmäßigen Abständen (und daher mit konstanter Geschwindigkeit) im Kreis dreht.

A: die Amplitude (Größe des Kreises) k: die Anzahl der Schwingungen (Frequenz) p: die Phase (wo beginnt der Punkt?) N: aus wievielen digitalen Werten besteht der Sinusoid? Parameter eines digitalen Sinusoids

crplot(A=1.5) Höhere Amplitude (Die Amplitude ist im Verhältnis zum Kreis-Radius) (Eine 16 Punkt digitale Cosinuswelle)

Doppelte Frequenz crplot(k=2) k = 2 Schwingungen pro 16 Punkte

Phase 0 radian: der Punkt beginnt ganz oben eine viertel Schwingung früher: crplot(p=-pi/2) radian: der Punkt beginnt ganz unten (= eine halbe Schwingung später) (Eine 16 Punkt digitale Sinuswelle)

Anzahl der digitalen Punkte crplot(N=32)crplot(N=8)

2. Die Fourier-Analyse Die Zerlegung eines Signals in eine Reihenfolge von Sinusoiden zunehmender ganzer Frequenz-Intervallen, sodass wenn diese Sinusoiden summiert werden (= Fourier-Synthese), das Signal genau rekonstruiert wird. Wenn eine Fourier-Analyse auf ein N-Punkt Signal angewandt wird, dann wird immer das Signal in N Sinusoiden mit Frequenzen k = 0, 1, 2, … N-1 Schwingungen zerlegt. Beziehung zwischen Signal-Länge und die Anzahl der Sinusoiden

zB wollen wir eine Fourier-Analyse auf dieses 8-Punkt Signal anwenden. Dann wissen wir schon, dass das Ergebnis davon 8 Sinusoiden sein wird, mit Frequenzen 0, 1, 2, 3, 4, 5, 6, 7 Schwingungen. Die Fourier-Analyse berechnet die Amplituden und die Phasen davon (und auf eine solche Weise, dass wenn wir die 8 Sinusoiden summieren, das obige 8-Punkt Signal genau rekonstruiert wird).

Fourier- Analyse Fourier- Synthese

Die Faltung Alle Sinusoiden mit einer Frequenz größer als (N/2) Schwingungen sind Kopien (= werden gefaltet auf) Sinusoiden mit niedrigeren Frequenzen = = = k k

Die Faltung crplot(k=3, N=16) crplot(k=13, N=16) verursachen dasselbe Sinusoid…

3. Ein (Amplitude) Spektrum ist eine Abbildung der Amplitude als Funktion der Frequenz für alle Sinusoiden bis zur und inklusive der Faltung-Frequenz (k = N/2) daher werden für das 8-Punkt-Signal nach der Fourier- Analyse in einem Spektrum die Amplituden der Sinusoiden mit Frequenzen 0, 1, 2, 3, 4 (= N/2) Schwingungen abgebildet

Zeitsignal Fourier-Analyse Frequenz (Anzahl der Schwingungen) Amplitude Spektrum

Schwingungen in Hertz (Hz) umrechnen Die Umsetzung der Frequenzachse in Hz ist von der Abtastrate des Signals, fs, abhängig. 1. Frequenz (Hz) = Schwingungen x fs/N zB bei der Fourier-Analyse eines 8-Punkt-Signals bekommen wir Sinusoiden mit Schwingungen 0, 1, 2, 3, 4 (bis zur Faltung-Frequenz) Bei fs = Hz entsprechen diese Schwingungen 0 Hz, 2000 Hz, 4000 Hz, 6000 Hz, 8000 Hz = 3 x 16000/8

Frequenz- und Zeitauflösung 1. Frequenz (Hz) = Schwingungen x fs/N 2. der Abstand zwischen Spektralkomponenten = fs/N Hz (wegen 1.) 0 Hz, 2000 Hz, 4000 Hz, 6000 Hz, 8000 Hz = 3 x 16000/8 wie man hier gesehen hat… 3. die Anzahl der Spektralkomponente bis zur Faltung = N/2 +1 zB fs = Hz, Zeisignal hat N = 8 Punkte N/2 + 1 = 5 Spektralkomponente mit einem jeweiligen Frequenzabstand von 16000/8 = 2000 Hz.

4. Daher, je größer N (also je grober die Zeitauflösung), umso feiner/detaillierter das Spektrum… 2. der Abstand zwischen Spektralkomponenten = fs/N Hz (wegen 1.)

N = 512 fs = Hz N/2 + 1 = 257 Spektralkomponente zwischen 0 und 8 kHz mit einem Abstand von 16000/512 = Hz N = 1024 N/2 + 1 = 513 Spektralkomponente zwischen 0 und 8 kHz mit einem Abstand von 16000/1024 = Hz Frequenz und Zeitauflösung 4. Daher, je größer N (also je grober die Zeitauflösung), umso feiner/detaillierter das Spektrum…

fs = Hz, N = 512fs = Hz, N = 64 Frequenzabstand = Hz Frequenzabstand = 16000/64 = 250 Hz

Zusammenfassung Dauer in ms eines N-Punkt-Fensters: N/fs kHz, wo fs kHz die Abtastrate in kHz ist. zB 256 Punkte bei 10 kHz = 25.6 ms. Von den N-spektralen Werten behalten wir diejenigen bis zur und inkl. der Faltung-Frequenz. Das sind (N/2) + 1 spektrale Komponente zwischen 0 und fs/2 Hz mit einem Frequenzabstand von fs/N Bei einer Fourier-Analyse werden N aufeinanderfolge digitale Werte eines Zeitsignals in N spektrale Werte umgewandelt.

Das Ziel: Spektra von [ç, x] ('ich' vs. 'ach') miteinander vergleichen der timetable Datenbank Spektra in dbemu und EMU-R Wie müssten sich die Frikative voneinander im wesentlichen spektral unterscheiden?

Warum dbnorm? Die Amplituden-Werte von Spektra sind in Decibel. Decibel sind aber Logarithmen, und um den Durchschnitt von Logarithmen zu bekommen, müssen sie zuerst in Anti- Logarithmen (eine Potenz hoch 10) umgerechnet werden. Diese Umrechnung in Anti-Logarithmen konvertiert die logarithmische Decibel oder Bel Skala in eine lineare Kraft Skala Die Berechnung (Durchschnitt usw.) erfolgt dann in der Kraft-Skala. Dann werden diese Berechnungen wieder in dB konveriert.

Logarithmische dB-Werte 60 dB 70 dB lineare Kraft-Werte 10^6 10^7 Berechnungen durchführen (10^6 + 10^7)/2 = Logarithmische dB-Werte 10 * log( , base=10) [1] (Der Mittelwert von 60 dB und 70 dB = 67.4 dB)

Parametrisierung von Spektra Jonathan Harrington

Das Ziel ist, ein Spektrum – das sehr viele (z.B. 64, 256, 512..) Werte enthält – auf ein paar Parameter zu reduzieren. Und zwar auf eine solche Weise, dass verschiedene phonetische Lautklassen voneinander differenziert werden können.

# Segmentliste v.s = emu.query("florian", "*", "phonetic=i:|u:|a:") # Label-Vektor v.l = label(v.s) # Spektrale Trackdatei v.dft = emu.track(v.s, "dft") # Spektra zum zeitlichen Mittelpunkt sp = dcut(v.dft,.5, prop=T) # Abbildung plot(sp[,0:3000], v.l, xlab="Frequenz (Hz)", ylab="Intensitaet (dB)") Spektra mit Default-Weren, berechnen, Sprachdatenbank florian

1. Energie-Mittelwert 2 Frequenz-Bereichen, in denen sich die Vokale unterschieden. zB Hz noch eine?

dB Mittelwert Hz vom ersten Segment? mittel = plot(sp[1,2200:3000]) abline(h = mittel) Eine Funktion, fun auf alle Segmente einer spektralen Matrix m andwenden fapply(m, fun) dB-Mittelwert Hz aller Segmente? fapply(): eine Funktion anwenden auf Spektra mean(sp[1,2200:3000]) a =fapply(sp[,2200:3000], mean) dB-Mittelwert aller Segmente vom anderen gewählten Frequenzbereich? b = Ellipse-Abbildung in diesem Raum beide = cbind(a, b) eplot(beide, v.l, dopoints=T)

Die spektrale Neigung und Krümmung Neigung Krümmung

Neigung und Krümmung des Spektrums Hz vom ersten Segment? p = dct( ) sp[1,0:3000], 2 Neigung und Krümmung des Spektrums Hz aller Segmente? fapply(trackdatei, fun, Argumente) verwenden p = fapply(sp[,0:3000], dct, 2) Ellipse-Abbildung im Raum Neigung x Krümmung Die spektrale Neigung und Krümmung eplot(p[,2:3], v.l, dopoints=T)

m 1 : erstes spektrales Moment (spektrales Gewichtsschwerpunkt) Je mehr sich die Energie in höheren Frequenzen konzentriert, umso höher m 1 (in Hz gemessen). (a) m 1 ist ca Hz (die Energie ist in den Frequenzen gleich verteilt) m 1 gleich/höher/tiefer im Vgl. zu (a)? (b) (c) (d) m 1 wird nicht von der dB- Skalierung beeinflusst (b): m 1 wie für (a) (a)

Je verteilter die Energie im Spektrum, umso höher m 2 (in Hz 2 ) m 2 : zweites spektrales Moment (spektrale Varianz) (a) (c) (d) (f) (e) m 2 wird nicht von der dB-Skalierung beeinflusst (b): m 2 wie für (a) m 1 von c-f im Vgl. zu (a)? m 2 von (c, d) > (a)m 2 von (e) im Vgl. zu (c)? m 2 von (f) im Vgl. zu (d)?

hochtief hoch m2m2 m1m1 Spektrale Momente einschätzen

Die spektralen Momente im Bereich Hz vom ersten Segment? p = moments( ) sp[1,0:3000], minval=T p =fapply(sp[,0:3000], Ellipse-Abbildung im Raum m 1 x m 2 Spektrale Momente in Emu-R eplot(p[,1:2], v.l, dopoints=T) moments, minval=T) Die spektralen Momente im Bereich Hz aller Segmente?