Spektrale Analysen in EMU-R: eine Einführung

Slides:



Advertisements
Ähnliche Präsentationen
Aufbau, Abfrage, Analyse von Sprachdatenbanken
Advertisements

Spektrale Analysen in EMU-R: eine Einführung
Fast Fourier Transformation
Polynomial Root Isolation
Filterung der räumlichen Frequenzen
Strukturlösung mit Hilfe der Patterson-Funktion
Genetische Algorithmen für die Variogrammanpassung
Morphem und Allomorph Jonathan Harrington.
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Formant-Analysen von Vokalen
Tina John Mehrfache Ketten in Sprachdatenbanken. Mehr als eine Kette wird benötigt wenn wir nicht alle Ebenen miteinander assoziieren wollen. zB möchten.
Grundlagen der Analyse von Sprachdatenbanken
FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:
Die akustische Analyse von Sprachlauten
Übung Akustische Phonetik
Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung
Formant-Analysen von Vokalen (2) Jonathan Harrington 1, 2 Struktur und Abbildung einer Trackdatei 3, 4. Anwendung von vorhandenen und eigenen Funktionen.
Berechnung von digitalen Signalen
Berechnung von digitalen Signalen Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Vokale und die Quantaltheorie
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Frequenz- und Zeitauflösung
Parametrisierung von Spektra
Abfragen aus einer Sprachdatenbank Jonathan Harrington.
Grundlagen der Analyse von Sprachdatenbanken
Etikettierungsebenen Jonathan Harrington. Das Ziel Etikettierungen verschiedener Ebenen aufzubauen, und miteinander zu verlinken.
Die Diskrete-Cosinus-Transformation: Parametrisierung von Signalen in der Zeit und in der Frequenz Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Die Nulldurchgangsrate
WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.
Algorithmentheorie 02 – Polynomprodukt und Fast Fourier Transformation
Pattern sensitivity Campbell & Robson (1968).
Spektralanalyse Spektralanalyse ist derart wichtig in allen Naturwissenschaften, dass man deren Bedeutung nicht überbewerten kann! Mit der Spektralanalyse.
Ein Seminar in Computer Grafik von Johannes Bochmann
Digital Audio Medientyp digital audio representation
Digital Audio Medientyp digital audio representation
Heute: Scherenzange zeichnen
Überlagerung von harmonischen Schwingungen
Übung zur Vorlesung Signalverarbeitung Einführung
Analyse nach harmonischen Schwingungen
Quantum Computing Hartmut Klauck Universität Frankfurt WS 04/
Quantum Computing Hartmut Klauck Universität Frankfurt WS 05/ /23.1.
Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.
EMA in Emu-R Jonathan Harrington
Polynome und schnelle Fourier-Transformation
Mathe in den höchsten Tönen
Begriffe zu Schwingungen
Inhalt Weg-Zeitgesetz nach der cos- oder sin- Funktion
Herleitung DFT Spektrum zeitdiskretes Signal (periodisch) DFT IDFT
Berechnung der Kreisfläche
Analyse von Spektra 2 Jonathan Harrington 1. Wiederholung: Spektra in R einlesen 2. Einige grundlegende Funktionen 3. Zugriff auf Spektralwerte 4. Spektrale-Abbildungen.
ISO/OSI Referenzmodell
Harmonische Schwingungen
Eine kleine Einführung für Studierende der Psychologie
Sampling, Rekonstruktion
Frequenz und Lautstärke
Plosive [a d a] [a t a] [a th a]
Vom graphischen Differenzieren
Hunde sinne.
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann ISO/OSI Referenzmodell Physical.
Kapitel 6: Einführung in die DFT
Plosive [a d a] [a t a] [a th a]
 Präsentation transkript:

Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington siehe auch

Zuerst ein paar Grundlagen… 1. Ein digitales Sinusoid 2. Fourier-Analyse 3. Ein Spektrum 4. Frequenz- und Zeitauflösung 5. Berechnung von Spektra mit dbemu

1. Ein digitales Sinusoid die Höhe über eine horizontale Linie eines Punktes, der sich in zeit-regelmäßigen Abständen (und daher mit konstanter Geschwindigkeit) im Kreis dreht. crplot() Amplitude 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Time (number of points) -2 -1

Parameter eines digitalen Sinusoids A: die Amplitude (Größe des Kreises) k: die Anzahl der Schwingungen (Frequenz) p: die Phase (wo beginnt der Punkt?) N: aus wievielen digitalen Werten besteht der Sinusoid?

Höhere Amplitude (Die Amplitude ist im Verhältnis zum Kreis-Radius) crplot(A=1.5) (Eine 16 Punkt digitale Cosinuswelle)

Doppelte Frequenz k = 2 Schwingungen pro 16 Punkte crplot(k=2)

Phase 0 radian: der Punkt beginnt ganz oben p radian: der Punkt beginnt ganz unten (= eine halbe Schwingung später) eine viertel Schwingung früher: crplot(p=-pi/2) (Eine 16 Punkt digitale Sinuswelle)

Anzahl der digitalen Punkte crplot(N=32) crplot(N=8)

2. Die Fourier-Analyse Die Zerlegung eines Signals in eine Reihenfolge von Sinusoiden zunehmender ganzer Frequenz-Intervallen, sodass wenn diese Sinusoiden summiert werden (= Fourier-Synthese), das Signal genau rekonstruiert wird. Beziehung zwischen Signal-Länge und die Anzahl der Sinusoiden Wenn eine Fourier-Analyse auf ein N-Punkt Signal angewendet wird, dann wird immer das Signal in N Sinusoiden mit Frequenzen k = 0, 1, 2, … N-1 Schwingungen zerlegt.

zB wollen wir eine Fourier-Analyse auf dieses 8-Punkt Signal anwenden. Dann wissen wir schon, dass das Ergebnis davon 8 Sinusoiden sein wird, mit Frequenzen 0, 1, 2, 3, 4, 5, 6, 7 Schwingungen. Die Fourier-Analyse berechnet die Amplituden und die Phasen davon (und auf eine solche Weise, dass wenn die 8 Sinusoiden summieren, das obige 8-Punkt Signal genau rekonstruiert wird).

Fourier-Analyse Fourier-Synthese

Die Faltung Alle Sinusoiden mit einer Frequenz größer als (N/2) Schwingungen sind Kopien (= werden gefaltet auf) Sinusoiden mit niedrigeren Frequenzen. k k 7 1 = 2 = 6 5 3 = 4

Die Faltung crplot(k=3, N=16) crplot(k=13, N=16) verursachen dasselbe Sinusoid…

3. Ein (Amplitude) Spektrum ist eine Abbildung der Amplitude als Funktion der Frequenz für alle Sinusoiden bis zur und inklusive der Faltung-Frequenz (k = N/2) daher werden für das 8-Punkt-Signal nach der Fourier-Analyse in einem Spektrum die Amplituden der Sinusoiden mit Frequenzen 0, 1, 2, 3, 4 (= N/2) Schwingungen abgebildet

Zeitsignal Fourier-Analyse Spektrum 8 22 18 0.2 18.5 Amplitude 1 2 3 4 5 10 15 20 Frequenz (Anzahl der Schwingungen) Amplitude Spektrum 8 22 18 0.2 18.5

Schwingungen in Hertz (Hz) umrechnen Die Umsetzung der Frequenzachse in Hz ist von der Abtastrate des Signals, fs, abhängig. 1. Frequenz (Hz) = Schwingungen x fs/N zB bei der Fourier-Analyse eines 8-Punkt-Signals bekommen wir Sinusoiden mit Schwingungen 0, 1, 2, 3, 4 (bis zur Faltung-Frequenz) Bei fs = 16000 Hz entsprechen diese Schwingungen 0 Hz, 2000 Hz, 4000 Hz, 6000 Hz, 8000 Hz = 3 x 16000/8

Frequenz- und Zeitauflösung 1. Frequenz (Hz) = Schwingungen x fs/N 2. der Abstand zwischen Spektralkomponenten = fs/N Hz (wegen 1.) 3. die Anzahl der Spektralkomponente bis zur Faltung = N/2 +1 zB fs = 16000 Hz, Zeisignal hat N = 8 Punkte N/2 + 1 = 5 Spektralkomponente mit einem jeweiligen Frequenzabstand von 16000/8 = 2000 Hz. 0 Hz, 2000 Hz, 4000 Hz, 6000 Hz, 8000 Hz = 3 x 16000/8 wie man hier gesehen hat…

2. der Abstand zwischen Spektralkomponenten = fs/N Hz (wegen 1.) 4. Daher, je größer N (also je grober die Zeitauflösung), umso feiner/detaillierter das Spektrum…

Frequenz und Zeitauflösung 4. Daher, je größer N (also je grober die Zeitauflösung), umso feiner/detaillierter das Spektrum… N/2 + 1 = 257 Spektralkomponente zwischen 0 und 8 kHz mit einem Abstand von 16000/512 = 31.25 Hz N = 512 fs = 16000 Hz N = 1024 N/2 + 1 = 513 Spektralkomponente zwischen 0 und 8 kHz mit einem Abstand von 16000/1024 =15.625 Hz

fs = 16000 Hz, N = 512 fs = 16000 Hz, N = 64 Frequenzabstand = 31.25 Hz Frequenzabstand = 16000/64 = 250 Hz Frequenz (Hz) Intensität (dB)

5. Spektra in dbemu berechnen Das Algorithmus in der digitalen Sprachverarbeitung um eine Fourier-Analyse anzuwenden ist der DFT oder 'discrete Fourier transform'. Eine schnellere Form der DFT ist die FFT oder Fast Fourier Transform. Mit der Anwendung der DFT oder FFT bekommt man genau das gleiche Ergebnis. Um eine FFT anzuwenden, muss die Fensterlänge, N, eine Potenz von zwei sein (2, 4, 8, 16, 32, 64…)

DFT/FFT Anwendung in dbemu

Spektra in dbemu und EMU-R Das Ziel: Spektra zum zeitlichen Mittelpunkt von den deutschen Dorsalfrikativen [, x] Frikativen aus den ersten 10 Äußerungen der kielread06 Sprachdatenbank aufeinander überlagern.