Die akustische Analyse von Sprachlauten.

Slides:



Advertisements
Ähnliche Präsentationen
Spektrale Analysen in EMU-R: eine Einführung
Advertisements

Morphem und Allomorph Jonathan Harrington.
Melodien im Standarddeutschen.
Die Satzprosodie Phrasengrenzen, Akzentuierung, Intonation.
Quellen-Filter Theorie der Sprachproduktion
Die phonetischen Merkmale von Vokalen
Die akustische Analyse von Sprachlauten
Phonemische und phonetische Darstellungen von Lauten
Spektra von periodischen Signalen. Resonanz.
Die phonetische Klassifikation von Konsonanten
Formant-Analysen von Vokalen
Einf. in die Instrumentalphonetik
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
FRIKATIVE Sitzung 9 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht gelöst wird und.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Sitzung 9 FRIKATIVE /Tondateien/Frikative/bach-traegt-wenig-wasser.wav: Der Bach trägt dieses Jahr wenig Wasser. /Tondateien/Frikative/schickt-er-blumengruesse.wav:
Spektrogramm und Spektrum
Einführung in die Phonetik und Phonologie
Spektrogramm und Spektrum Sitzung 8 Welche Konsonanten sind für sich alleine identifizierbar? -Alle Konsonanten ausser [pt] in tippt, weil das [p] nicht.
Die akustische Analyse von Sprachlauten
Übung Akustische Phonetik
Mikro und Makroprosodie
Logische Vektoren in R Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Spektrale Analysen in EMU-R: eine Einführung
Die Funktion und Form der Intonation
Hauptseminar: Speaker Characteristics Venice International University
Berechnung von digitalen Signalen
Berechnung von digitalen Signalen Jonathan Harrington.
Spektrale Analysen in EMU-R: eine Einführung
Vokale und die Quantaltheorie
Berechnung von stehenden Wellen
Frequenz- und Zeitauflösung
Jonathan Harrington Bitonale Akzente H*, H+L*, L*+H unterscheiden sich akustisch in der Synchronisierung des f0-Gipfels mit dem (primär betonten) Vokal.
Parametrisierung von Spektra
Artikulationsstelle, F2-Locus, Locusgleichungen Jonathan Harrington.
Die Diskrete-Cosinus-Transformation: Parametrisierung von Signalen in der Zeit und in der Frequenz Jonathan Harrington.
Übung zur Intonation Jonathan Harrington.
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Die Nulldurchgangsrate
Jonathan Harrington H*, L+H*, H+L*, L*+H H*, H+L*, L*+H unterscheiden sich akustisch in der Synchronisierung des f0-Gipfels mit dem (primär betonten)
Lautwandel, Perzeption, Kompensierung für Koartikulation.
Gegenstück D/A-Wandlung
FRAGENKATALOG GRUNDLAGEN DES SCHALLS
Überlagerung von harmonischen Schwingungen
HLSyn – eine Kurzeinführung
Die Fourier-Analyse Durch die Fourier-Analyse wird ein Sprachsignal in Sinusoiden zunehmender Frequenz zerlegt, sodass wenn diese summiert werden, das.
Mathe in den höchsten Tönen
Der Doppler Effekt Änderung von Schallgeschwindigkeit und Frequenz bei bewegtem Empfänger, ruhender Quelle.
Berechnung von Prozentwert, Prozentsatz und Grundwert mit dem Dreisatz und mit der Operatorenschreibweise Prozentrechnung.
Österreichische Akademie der Wissenschaften (ÖAW) / Institut für Weltraumforschung (IWF) Schmiedlstraße 6, 8042 Graz, Austria, Tel.: +43/316/ ,
AKUSTISCHE PHONETIK.
Elementarteilchen + Abstossung Anziehung + – – + –
Elementarteilchen + Abstossung Anziehung + – – + –
Einsatzmöglichkeiten der Sprachsignalverarbeitung
Harmonischer Oszillator Pendel Energieanteile einer Schwingung.
Eine kleine Einführung für Studierende der Psychologie
Tonhöhenwahrnehmung Wozu?
Akustische Modelle der Sprachproduktion
Frequenz und Lautstärke
Plosive [a d a] [a t a] [a th a]
3. Sitzung K3.1 Phonetik und Phonologie II
2. Sitzung K3.1 Phonetik und Phonologie II
ST X : What You Hear Is What You See Acoustics Research Institute of the Austrian Academy of Sciences: A-1010 Wien; Liebiggasse 5. Tel /
Atomphysik für den Schulunterricht
Plosive [a d a] [a t a] [a th a]
4. Sitzung Akustik III K3.1 Phonetik und Phonologie II
Spektrogramm und Spektrum Sitzung 8 Spektrogramm und Spektrum Date ip003rb.wav laden Formantwerte (F1 und F2) vom /a:/ im ‘mal’ ablesen Formantwerte.
Plosive [a d a] [a t a] [a th a]
 Präsentation transkript:

Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel.

Vom Zeitsignal zum Spektrum 1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung (hier 30 ms) ist die Dauer des Signals die Fourier-analysiert wird 30 ms s t a m Amplitude Frequenz Spektrum 2. Fourier Analyse

Periodendauer, Grundfrequenz, Harmonischen Zeitsignal 30 ms 21e Harmonische » 85 x 21 = 1770 Hz Spektrum Ca. 2.5 Perioden in 30 ms Periodendauer » 30/2.5 ms » 12 ms = 0.012 s Grundfrequenz » 1/0.012 Hz » 85 Hz

Frequenz- und Zeitauflösung Die Frequenzauflösung (Hz) ist ca. im ungekehrten Verhältnis zur Dauer des Zeitfensters (s) oder zur Zeitauflösung. Das bedeutet: Je breiter die Zeitauflösung, umso schmaler die Frequenzauflösung und umgekehrt Zeitauflösung = 30 ms = 30/1000 s Frequenzauflösung = 1000/30 Hz = 33.3 Hz 30 ms

Im Spektrum werden Frequenzen nur differenziert, wenn deren Abstand größer als die Frequenzauflösung ist: Zeitsignal 110 120 100 Spektrum Undifferenzierte Frequenzen Frequenzen 100, 110, 120 Hz Abstand = 10 Hz 30 ms Fourier-Analyse Frequenzauflösing = 33.3 Hz 100 150 200 Differenzierte Frequenzen Frequenzen 100, 150, 200 Hz Abstand = 50 Hz

Breite Zeitauflösung: 30 ms schmale Frequenzauflösung: 33.3 Hz (Schmalbandanalyse) Schmale Zeitauflösung: 3 ms Breite Frequenzauflösung: 333 Hz (Breitbandanalyse) 3 ms 30 ms Hier sind die Harmonischen sichtbar, da die Grundfrequenz und daher der Abstand zwischen Harmonischen » ca. 85 Hz Fourier-Analyse F1 F2 F3 Die Harmonischen sind nicht mehr sichtbar, und die Formanten treten dadurch deutlicher hervor Fourier-Analyse F1 F2 F3

Spektrale Änderungen in der Zeit Wenn wir feststellen wollen, wie sich das Spektrum mit der Zeit ändert, müssen Fourier-Analysen zu sämtlichen Zeitpunkten berechnet werden Anfang vom [a] Mitte vom [a] Ende vom [a]

‘Wasserfall Abbildung Ende vom [a] F2 Mitte vom [a] F2 F2 Anfang vom [a] F2

Wasserfall-Abbildung zum Spektrogramm Frequenz (Hz) F3 F2 Zeit F1 Tal In einem Spektrogramm wird die Amplitude in Dunkelheit umgesetzt – je dunkler umso höher die Amplitude

In einem Breitbandspektrogramm ist: Die Frequenzauflösung mindestens 300 Hz Die Zeitauflösung ist daher 1/300 » 3 ms Für dieses Signal: f0 » ca. 85 Hz Periodendauer, T, » 1/85 s » 12 ms Die Stimmlippenschließung: sichtbar (Da T > 3 ms) Die Harmonischen: nicht sichtbar (da f0 < 300 Hz)

Breitbandspektrogramm Frequenzauflösung = 333.3 Hz, Zeitauflösung = 3 ms Stimmlippenschließung Jede Schließung erzeugt eine gerade Linie im Breitband-Spektrogramm und ist mit einem Höhepunkt im Zeitsignal synchronisiert

Schmalbandspektrogramm Frequenzauflösung ist meistens 45 Hz Harmonische sind sichtbar, da f0 » 85 Hz Zeitauflösung = 1/45 » 22 ms Stimmlippenschließungen sind nicht sichtbar, da die Periodendauer » 12 ms 5e Harmonische F3 2e Harmonische F2 Grundfrequenz F1

Schmalbandspektrogramm und die Tonhöhe Mit einem SB-Spektrogramm kann man oft an Hand der höheren Harmonischen Die Änderungen der Tonhöhe sehen Die Grundfrequenz einschätzen Tonhöhe steigt fällt 5e Harmonische » 450 Hz, daher f0 » 90 Hz

Zusammenfassung Ein Spektrum wird durch die Anwendung einer Fourier-Analyse auf einen Teil oder ein Fenster vom einem Zeitsignal angewendet In einem Spektrogramm werden Spektra in regelmäßigen Zeitabständen berechnet: die Amplitude entspricht der Dunkelheit Die Frequenzauflösung ist im ungekehrten Verhältnis zur Dauer oder Zeitauflösung dieses Fensters: je schmaler das Fenster, umso grober (breiter) die Frequenzauflösung

Zusammenfassung (fortgesetzt) Um Harmonischen im Spektrum/Spektrogramm zu sehen, muss die Grundfrequenz größer als die Frequenzauflösung sein. Daher ist ein Schmalbandspektrogramm (Frequenzauflösung typischerweise 45 Hz) für die Analyse von Harmonischen geeignet Um Stimmlippen-Schließungen im Spektrogramm zu sehen, muss die Periodendauer größer als die Zeitlauflösung sein. Dafür ist ein Breitbandspektrogramm (Zeitauflösung ca. 3 ms, Frequenzauflösung über 300 Hz) geeignet.

10 Perioden in einer Sekunde. Frequenz = 10 Hz 7. Der Sinusoid links wird mit der Resonanzkurve rechts gefiltert. Erzeugen Sie eine Abbildung des Spektrums der Ausgabe. 5 10 15 20 25 1 2 3 4 Zeit (Sekunden) Amplitude -4 -2 2 4 0.2 0.6 0.8 1.0 0.4 4 10 Perioden in einer Sekunde. Frequenz = 10 Hz 3 Amplitude 2 1 5 10 15 20 25 Frequenz (Hz)

Resonanz für eine Wellenlänge von: l = (4 x 15)/3 cm = 20 cm 8. Die typische Länge von einem Vokaltrakt einer Frau ist 15 cm. Berechnen Sie den zweiten Resonanz eines [«] Vokals an Hand eines Rohres von der selben Länge. 15 cm Luftdruck- maximum Atmosphärischer Luftdruck Wellenlänge (l) 15 cm 15 cm = ¾ l Resonanz für eine Wellenlänge von: l = (4 x 15)/3 cm = 20 cm Und für eine Frequenz von f = c/l = 35000/20 = 1750 Hz

Frequenz = Schallgeschwindigkeit / Wellenlänge f = c / l 9. Beim Tief-Tauchen besteht die Luft oft aus einer Mischung von Sauerstoff und Helium, wodurch die Schallgeschwindigkeit erheblich höher wird. Welcher Einfluss übt dies auf die Resonanzen vom Vokaltrakt des Tauchers aus? Frequenz = Schallgeschwindigkeit / Wellenlänge f = c / l Je grösser c, umso größer c/ l, also umso höher die Frequenz

Einatmung von Schwefel- Hexafluorid (c ist niedriger) 2 kHz My name is Yelda Normal 2 kHz Einatmung von Heliox (c ist höher) 2 kHz Einatmung von Schwefel- Hexafluorid (c ist niedriger) 2 kHz Beispiele: John Ohala, Phonetics Laboratory San Francisco

Je länger der Vokaltrakt, umso grösser wird l (die Wellenlänge) 10. Wenn Vokale gerundet werden, wird der Vokaltrakt länger. Welcher Einfluss übt dies auf die Resonanzen aus? Je länger der Vokaltrakt, umso grösser wird l (die Wellenlänge) f (die Frequenz der Resonanz) wird kleiner wenn l grösser wird, da: f = c / l Daher führt die Lippenrundung zu einer Senkung der Formantfrequenzen

Welches Vielfach von 200 Hz liegt 1750 Hz am nächsten? 11. Berechnen Sie den zweiten Formant für die Frau in 8. bei einer Grundfrequenz von (i) 200 Hz (ii) 280 Hz. Welches Vielfach von 200 Hz liegt 1750 Hz am nächsten? Antwort = die 9e Harmonische = 1800 Hz = F2 Für F0 = 280 Hz, Antwort = die 6e Harmonische = 1680 Hz

Bitte Fragen 12-28 (Seiten 12-16) zum nächsten Mal beantworten.