Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.

Name: Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.
Uploaded: 2018-01-11T15:15:09+00:00
Duration: PTM15S12
Channel: Verena Leinberger
Description: Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.

Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem

Übersicht I Theorie II Praxis Das Oszillogramm
Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis Theorie mit einfachen signalen Wie kann man soundfiles darstellen und analysieren7 Praxis mit sprache

Das Oszillogramm Oszillogramme einfacher Sinussignale

Das Oszillogramm 2 Dimensionen Was kann man daraus ablesen? x: Zeit
y: Auslenkung (durch Schall entstandene Luftdruckschwankungen) Was kann man daraus ablesen? Amplitude Ausschlag/Auslenkung des Signals → Lautstärke Frequenz Anzahl der Nulldurchgänge innerhalb einer Sekunde bzw. 1/Periodendauer Hertz [Hz] → Tonhöhe

Das Oszillogramm

Das Oszillogramm Wie unterschiedlich sind die beiden Töne?

Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis

Fourier Transformation
Überlagerung zweier Schwingungen → Addition zu einer neuen

Jedes (auch noch so komplexe) periodische Signal (zB Sprache) stellt eine Addition einfacher Sinusschwingungen dar Die FT zerlegt ein komplexes Signal in einzelne Sinusschwingungen mit unterschiedlicher Frequenz

100 Hz 200Hz Energie (Amplitude) FT Oszillogramm Spektrum

Spektrum 2 Dimensionen Dezibel - dB Frequenz [Hz]
Energie - Schalldruckpegel (Sound Pressure Level - SPL) [dB/Hz] Dezibel - dB Logarithmische Hilfseinheit Faustregel: +10 dB entspricht ungefähr der doppelten Lautstärke Schallereignis (Pa) Referenzdruck (Pa)

Spektrum Welches Signal ist lauter, höher?

Spektrum 14

Spektrum 440 Hz Hz =

Spektrum Wie sieht das Spektrum aus?

Spektrum Was kann aus einem Spektrum ablesen?
Verteilung der Frequenzen und ihre Intensität → Klangfarbe Klangfarbe Im Zeitbereich Im Frequenzbereich Meyer et al. (2006)

Spektrum Abfallend oder Ansteigend?

Spektrum Keine Aussage über Veränderungen, Trends über die Zeit
→ gut geeignet, um durchschnittliche Charakteristik eines Signals bzw. eingeschwungene Signale darzustellen Sprache, Musik… sind zeitlich sehr komplexe Signale → Darstellung im Spektrogramm

Spektrogramm (=Sonagramm, Sonogramm)
3 Dimensionen x: Zeit y: Frequenz z (Schwärzung): Energie (Intensität)

Spektrogramm Was kann man daraus ablesen?
Verteilung der Frequenzen und ihre Intensität Verlauf über die Zeit

Spektrogramm

Spektrogramm Abfallend oder Ansteigend?

Zusammenfassung Achsen Gut Ablesbar Oszillogramm Zeit Auslenkung
Lautstärke, Pausen/Segmente Spektrum Frequenz Intensität Gesamtcharakteristik der Frequenz/Intensität, Klangfarbe Spektrogramm Frequenz- & Intensitätsverlauf über die Zeit

Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis

Das Quelle-Filter-Modell der Vokalproduktion
ein Filter lässt bestimmte Frequenzen passieren & dämpft andere

Resonanzfrequenz je grösser das Objekt desto tiefer fres
Quelle Filter Output Rauschen Resonator gefiltertes Rauschen

Vokaltrakt als Resonator
Vokalproduktion Quelle Filter Output Stimmlippen Vokaltrakt Sprache

Formanten Entstehung einer Lautäusserung - Quelle/Filter-Theorie
supralaryngal Ansatzrohr (Mund-, Nasen-, Rachenraum (Pharynx)): Artikulation = Modulation / Filterung des Quellsignals → Ausdifferenzierung der Phoneme →Formanten Larynx (Kehlkopf): Phonation = Erzeugung eines akustischen Signals (Schwingung der Stimmbänder mit Grundfrequenz f0) - Quellsignal → Tonhöhe (f0), Stimmqualität (zB gepresst) laryngal Lunge: Luftdruck → Lautstärke sublaryngal Fitch (2000) logopaedie.rwth-aachen.de

Vokaltrakt (Ansatzrohr) als Resonator
mehrere Resonanzräume -> mehrere Resonanzfrequenzen

je nach Stellung der Artikulatoren unterscheiden sich die Formantfrequenzen

Formanten Supralaryngale Artikulatoren Zunge Lippen Gaumensegel

Formanten Quellsignal: f0 & Harmonische (ganzzahlige Vielfache von f0)
Je nach Geometrie und Stellung der Artikulatoren können bestimmte Frequenzen in Resonanz schwingen. Es ergeben sich Amplitudenmaxima → Formanten: Konzentration akustischer Energie in einem Frequenzband

Formanten Filter Konzentration akustischer Energie in einem Frequenzband Im Spektrogramm sichtbar

Formanten Im Spektrogramm

Formanten Im Spektrogramm
Fitch (1997)

•Frequenzbereiche erhöhter Intensität heissen Formanten
Filtering by formants (bandpass filter, Vokaltrakt Resonanzen) • Formanten – schnelle Modifikation durch Artikulatoren (Zunge, Lippe, Gaumen, Zäpfchen) • Formant – keinen Einfluss auf Tonhöhe, welche in der Larynx modifiziert werden. • („Beet, Bett, beten“)

Vokalraum Englisch Deutsch

Veränderungen in den Resonanzfrequenzen bewirken, dass unterschiedliche Frequenzbereiche des im Kehlkopf erzeugten Primärschalls verstärkt bzw. abgeschwächt werden. Frequenzbereiche erhöhter Intensität nennt man Formanten. Verschiedene Vokale unterscheiden sich durch die Lage ihrer Formanten.

Übersicht I Theorie II Praxis Praat Darstellung akustischer Signale
Signalfilter - Hochpass, Tiefpass, Bandpass - Flüstern & Delexikalisieren Suprasegmentale Manipulationen - Prosodie, akustische Geschlechtsumwandlung Segmentale Manipulation - VOT Signalvorverarbeitung - Normalisierung

Praat www.praat.org Soundanalyse, -manipulation…
Für viele Plattformen (Win, OS X, Linux…) Gratis, offen Viele Tutorials im Internet Gute On- und Offline Hilfe Stapelverarbeitung via Skripten möglich tw. etwas gewöhnungsbedürftiges Handling

Objects Befehle Ausgabefenster Hauptfenster Praat:
Hauptfenster: Objects; Befehle Outputfenster Objects Befehle Ausgabefenster Hauptfenster

Eigene Soundfiles aufnehmen
Vokale & Konsonanten Einen kurzen Satz (mit viel Melodie) New -> record mono sound… -> Record -> SPRECHEN Stop -> Save to list & close Write -> Write to wav file

Darstellung akustischer Signale Oszillogramm
File laden Read… → Read from file → jutta.wav Abspielen Play Edit Abspielen mit Tabulator Zoomen Intensity → Show Intensity Pitch → Show Pitch (in etwa f0) (Achtung: 2. Achse) Formant → Show Formants

Darstellung akustischer Signale Spektrum
Spektrum erstellen Analyse → Spectrum → To Spectrum... Abspielen: Tabulator Frequenzbereiche markieren und abspielen Zeichnen Draw...

Suprasegmentale Manipulationen Akustische Geschlechtsumwandlung
f005.wav und m005.wav Synthesize → Convert → change gender… Formant shift ratio Duration factor Lattner et al. (2005)

Suprasegmentale Manipulationen Flattening
Sound 1a06 → Manipulate → To Manipulation... Manipulation 1a06 → Extract Pitch Tier Edit Remove Points Add Point Replace Pitch Tier Manipulation 1a06 & PitchTier untiteled gleichzeitig markieren → Replace Pitch Tier Flattened soundfile erstellen Manipulation 1a06 Play (overlapp-add) Get resynthesis (overlapp-add) Sound 1a06 Write → Write to WAV file… + weiter Melodieverläufe erstellen

Suprasegmentale Manipulationen Flattening
Meyer et al. (2004)

Signalfilter Hochpass Tiefpass Bandpass Bandstopp
Lässt Frequenzen über einer Grenzfrequenz passieren Tiefpass Lässt Frequenzen unter einer Grenzfrequenz passieren Bandpass Lässt Frequenzen in einem Frequenzband passieren Bandstopp Stoppt Frequenzen in einem Frequenzband

Signalfilter Flüstern
1a06.wav Hochpassfilter anlgegen Synthesize → Filter (stop hann band)… → 0...x Hz

Signalfilter Delexikalisieren
Semantische Informationen zerstört, prosodische erhalten Kontrollbedingung in Experimenten (zB: Meyer et al., 2004) 1a06.wav Tiefpassfilter anlgegen Synthesize → Filter (pass hann band)… → 0...x Hz

Segmentale Manipulationen VOT
VOT – Voice Onset Time Zeit zwischen Beginn des Konsonanten und Einsatz der Stimme (Schwingung der Stimmbänder) Frye(2007)

Kategoriale Sprachwahrnehmung /da/  /ta/ Phonem-Grenze = phonetic categoric boundary eco.psy.ruhr-uni-bochum.de/download/Guski-Lehrbuch/Kap_7_3.html

Pa-pa.wav /pa/ /ba/

Signalvorverarbeitung Normalisierung
Zwei Unterschiedlich laute Soundfiles (jutta.wav & kind.wav) Normalisierung: Angleichung der Energie (→ Lautstärke) Modify → scale intesity… → zB: 70dB Kontrolle: Query → get intensity (dB)

Darstellung akustischer Signale Oszillogramm
Edit Get Pitch/Formant Frequency... Wide-/Narrowband-Spektrogramm Spectrum → Spectrogramm settings… Window length: 0.005s → Wideband Window length: 0.05s → Narrowband Vgl. f0 und unterste Harmonische Oszillogram zeichnen Im Outputwindow einen eine Ebene aufspannen Draw… Parameter variieren File → Copy to clipboard Erase All

Literatur aachen.de/personen/dozenten/bkroeger/documents/Kroeger_PhonetikSkript_2007.pdf

Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.

Ähnliche Präsentationen

Präsentation zum Thema: "Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011."— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback

Anmelden

Anmeldung über soziales Netzwerk:

Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.

Ähnliche Präsentationen

Präsentation zum Thema: "Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011."— Präsentation transkript:

Ähnliche Präsentationen

Über Projekt

Feedback