Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011.

Slides:



Advertisements
Ähnliche Präsentationen
Anzahl der ausgefüllten und eingesandten Fragebögen: 211
Advertisements

Filterung der räumlichen Frequenzen
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.
Telefonnummer.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.
Eine RDF Konvention für die Beschreibung phonetischer Ressourcen im Semantic Web Hauptseminar: Historisch-Kulturwissenschaftliche Objekte im Semantic Web.
1 JIM-Studie 2010 Jugend, Information, (Multi-)Media Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
= = = = 47 = 47 = 48 = =
Die akustische Analyse von Sprachlauten.
Quellen-Filter Theorie der Sprachproduktion
Die akustische Analyse von Sprachlauten
Spektra von periodischen Signalen. Resonanz.
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar:
Spektrogramm und Spektrum
Einführung in die Phonetik und Phonologie
Starten von Multi-Speech Starten des Systems: n PC einschalten n Icon für Multi-Speech auf dem Desktop anklicken n Multi-Speech Main Program wählen Sitzung.
Die akustische Analyse von Sprachlauten
Übung Akustische Phonetik
Aufbau, Abfrage, Analyse von Sprachdatenbanken ErstellungAnalyse Abfrage Digitale Zeitsignale akustisch, artikulatorisch Etikettieren Verknüpfung mit Symbolen.
Rechneraufbau & Rechnerstrukturen, Folie 2.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 2.
Internet facts 2008-II Graphiken zu dem Berichtsband AGOF e.V. September 2008.
Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.
Betreuer: Christian Brose
Bewegte Bezugssysteme
Differentielles Paar UIN rds gm UIN
1Ausgewählte Themen des analogen Schaltungsentwurfs Zusammenfassung Einführung Teilchendetektore – Sensorstrukturen, Verstärker, Rauschen, Geschwindigkeit.
Prof. Dr. Bernhard Wasmayr
Studienverlauf im Ausländerstudium
Kategoriale Wahrnehmung
Prof. Dr. Bernhard Wasmayr VWL 2. Semester
AWA 2007 Natur und Umwelt Natürlich Leben
Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.
2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.
1. 2 Schreibprojekt Zeitung 3 Überblick 1. Vorstellung ComputerLernWerkstatt 2. Schreibprojekt: Zeitung 2.1 Konzeption des Kurses 2.2 Projektverlauf.
20:00.
„Küsse deine Freunde“ – FlexKom-App teilen
Zusatzfolien zu B-Bäumen
für Weihnachten oder als Tischdekoration für das ganze Jahr
1 Ein kurzer Sprung in die tiefe Vergangenheit der Erde.
Syntaxanalyse Bottom-Up und LR(0)
PROCAM Score Alter (Jahre)
Ertragsteuern, 5. Auflage Christiana Djanani, Gernot Brähler, Christian Lösel, Andreas Krenzin © UVK Verlagsgesellschaft mbH, Konstanz und München 2012.
Geometrische Aufgaben
Symmetrische Blockchiffren DES – der Data Encryption Standard
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Zahlentheorie und Zahlenspiele Hartmut Menzer, Ingo Althöfer ISBN: © 2014 Oldenbourg Wissenschaftsverlag GmbH Abbildungsübersicht / List.
MINDREADER Ein magisch - interaktives Erlebnis mit ENZO PAOLO
Eine kleine Einführung für Studierende der Psychologie
1 (C)2006, Hermann Knoll, HTW Chur, FHO Quadratische Reste Definitionen: Quadratischer Rest Quadratwurzel Anwendungen.
Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.
Folie Beispiel für eine Einzelauswertung der Gemeindedaten (fiktive Daten)
Imperfekt Wie sagt man das mit Imperfekt
Plosive [a d a] [a t a] [a th a]
Folie Einzelauswertung der Gemeindedaten
Datum:17. Dezember 2014 Thema:IFRS Update zum Jahresende – die Neuerungen im Überblick Referent:Eberhard Grötzner, EMA ® Anlass:12. Arbeitskreis Internationale.
1 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt 10 pt 15 pt 20 pt 25 pt 5 pt Wie.
Technische Kommunikation
Einführung in die Volkswirtschaftslehre, Mikroökonomie und Wettbewerbspolitik Lothar Wildmann ISBN: © 2014 Oldenbourg Wissenschaftsverlag.
1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.
Monatsbericht Ausgleichsenergiemarkt Gas – Oktober
3. Sitzung K3.1 Phonetik und Phonologie II
2. Sitzung K3.1 Phonetik und Phonologie II
Sommersemester 2012 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einführung in die Instrumentalphonetik.
ST X : What You Hear Is What You See Acoustics Research Institute of the Austrian Academy of Sciences: A-1010 Wien; Liebiggasse 5. Tel /
Einf. in die Instrumentalphonetik Sommersemester 2015 Bistra Andreeva FR 4.7 Computerlinguistik & Phonetik Universität des Saarlandes
Plosive [a d a] [a t a] [a th a]
Spektrogramm und Spektrum Sitzung 8 Spektrogramm und Spektrum Date ip003rb.wav laden Formantwerte (F1 und F2) vom /a:/ im ‘mal’ ablesen Formantwerte.
Plosive [a d a] [a t a] [a th a]
 Präsentation transkript:

Von Spektren und Formanten Grundlagen akustischer Analyse und Manipulation Martin Meyer/Franziskus Liem 28.03.2011

Übersicht I Theorie II Praxis Das Oszillogramm Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis Theorie mit einfachen signalen Wie kann man soundfiles darstellen und analysieren7 Praxis mit sprache

Das Oszillogramm Oszillogramme einfacher Sinussignale

Das Oszillogramm Oszillogramme einfacher Sinussignale

Das Oszillogramm 2 Dimensionen Was kann man daraus ablesen? x: Zeit y: Auslenkung (durch Schall entstandene Luftdruckschwankungen) Was kann man daraus ablesen? Amplitude Ausschlag/Auslenkung des Signals → Lautstärke Frequenz Anzahl der Nulldurchgänge innerhalb einer Sekunde bzw. 1/Periodendauer Hertz [Hz] → Tonhöhe

Das Oszillogramm

Das Oszillogramm Wie unterschiedlich sind die beiden Töne?

Übersicht I Theorie II Praxis Das Oszillogramm Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis

Fourier Transformation Überlagerung zweier Schwingungen → Addition zu einer neuen www.germanistik.unibe.ch

Fourier Transformation Jedes (auch noch so komplexe) periodische Signal (zB Sprache) stellt eine Addition einfacher Sinusschwingungen dar Die FT zerlegt ein komplexes Signal in einzelne Sinusschwingungen mit unterschiedlicher Frequenz

Fourier Transformation 100 Hz 200Hz Energie (Amplitude) FT Oszillogramm Spektrum

Spektrum 2 Dimensionen Dezibel - dB Frequenz [Hz] Energie - Schalldruckpegel (Sound Pressure Level - SPL) [dB/Hz] Dezibel - dB Logarithmische Hilfseinheit Faustregel: +10 dB entspricht ungefähr der doppelten Lautstärke Schallereignis (Pa) Referenzdruck (Pa)

Spektrum Welches Signal ist lauter, höher?

Spektrum 14

Spektrum 440 Hz + 1000Hz =

Spektrum Wie sieht das Spektrum aus? 440 1000

Spektrum Was kann aus einem Spektrum ablesen? Verteilung der Frequenzen und ihre Intensität → Klangfarbe Klangfarbe Im Zeitbereich Im Frequenzbereich Meyer et al. (2006)

Spektrum Abfallend oder Ansteigend?

Spektrum Keine Aussage über Veränderungen, Trends über die Zeit → gut geeignet, um durchschnittliche Charakteristik eines Signals bzw. eingeschwungene Signale darzustellen Sprache, Musik… sind zeitlich sehr komplexe Signale → Darstellung im Spektrogramm

Spektrogramm (=Sonagramm, Sonogramm) 3 Dimensionen x: Zeit y: Frequenz z (Schwärzung): Energie (Intensität)

Spektrogramm Was kann man daraus ablesen? Verteilung der Frequenzen und ihre Intensität Verlauf über die Zeit

Spektrogramm

Spektrogramm Abfallend oder Ansteigend?

Zusammenfassung Achsen Gut Ablesbar Oszillogramm Zeit Auslenkung Lautstärke, Pausen/Segmente Spektrum Frequenz Intensität Gesamtcharakteristik der Frequenz/Intensität, Klangfarbe Spektrogramm Frequenz- & Intensitätsverlauf über die Zeit

Übersicht I Theorie II Praxis Das Oszillogramm Fourier Transformation, Spektrum und Spektrogramme Formanten II Praxis

Das Quelle-Filter-Modell der Vokalproduktion ein Filter lässt bestimmte Frequenzen passieren & dämpft andere

Resonanzfrequenz je grösser das Objekt desto tiefer fres Quelle Filter Output Rauschen Resonator gefiltertes Rauschen

Vokaltrakt als Resonator Vokalproduktion Quelle Filter Output Stimmlippen Vokaltrakt Sprache

Formanten Entstehung einer Lautäusserung - Quelle/Filter-Theorie supralaryngal Ansatzrohr (Mund-, Nasen-, Rachenraum (Pharynx)): Artikulation = Modulation / Filterung des Quellsignals → Ausdifferenzierung der Phoneme →Formanten Larynx (Kehlkopf): Phonation = Erzeugung eines akustischen Signals (Schwingung der Stimmbänder mit Grundfrequenz f0) - Quellsignal → Tonhöhe (f0), Stimmqualität (zB gepresst) laryngal Lunge: Luftdruck → Lautstärke sublaryngal Fitch (2000) logopaedie.rwth-aachen.de

Vokaltrakt (Ansatzrohr) als Resonator mehrere Resonanzräume -> mehrere Resonanzfrequenzen www.ims.uni-stuttgart.de

je nach Stellung der Artikulatoren unterscheiden sich die Formantfrequenzen

Formanten Supralaryngale Artikulatoren Zunge Lippen Gaumensegel

Formanten Quellsignal: f0 & Harmonische (ganzzahlige Vielfache von f0) Je nach Geometrie und Stellung der Artikulatoren können bestimmte Frequenzen in Resonanz schwingen. Es ergeben sich Amplitudenmaxima → Formanten: Konzentration akustischer Energie in einem Frequenzband

Formanten Filter Konzentration akustischer Energie in einem Frequenzband Im Spektrogramm sichtbar

Formanten Im Spektrogramm

Formanten Im Spektrogramm Fitch (1997)

•Frequenzbereiche erhöhter Intensität heissen Formanten Filtering by formants (bandpass filter, Vokaltrakt Resonanzen) • Formanten – schnelle Modifikation durch Artikulatoren (Zunge, Lippe, Gaumen, Zäpfchen) • Formant – keinen Einfluss auf Tonhöhe, welche in der Larynx modifiziert werden. • („Beet, Bett, beten“)

Vokalraum Englisch Deutsch

Veränderungen in den Resonanzfrequenzen bewirken, dass unterschiedliche Frequenzbereiche des im Kehlkopf erzeugten Primärschalls verstärkt bzw. abgeschwächt werden. Frequenzbereiche erhöhter Intensität nennt man Formanten. Verschiedene Vokale unterscheiden sich durch die Lage ihrer Formanten.

Übersicht I Theorie II Praxis Praat Darstellung akustischer Signale Signalfilter - Hochpass, Tiefpass, Bandpass - Flüstern & Delexikalisieren Suprasegmentale Manipulationen - Prosodie, akustische Geschlechtsumwandlung Segmentale Manipulation - VOT Signalvorverarbeitung - Normalisierung

Praat www.praat.org Soundanalyse, -manipulation… Für viele Plattformen (Win, OS X, Linux…) Gratis, offen Viele Tutorials im Internet Gute On- und Offline Hilfe Stapelverarbeitung via Skripten möglich tw. etwas gewöhnungsbedürftiges Handling www.praat.org

Objects Befehle Ausgabefenster Hauptfenster Praat: Hauptfenster: Objects; Befehle Outputfenster Objects Befehle Ausgabefenster Hauptfenster

Eigene Soundfiles aufnehmen Vokale & Konsonanten Einen kurzen Satz (mit viel Melodie) New -> record mono sound… -> Record -> SPRECHEN Stop -> Save to list & close Write -> Write to wav file

Darstellung akustischer Signale Oszillogramm File laden Read… → Read from file → jutta.wav Abspielen Play Edit Abspielen mit Tabulator Zoomen Intensity → Show Intensity Pitch → Show Pitch (in etwa f0) (Achtung: 2. Achse) Formant → Show Formants

Darstellung akustischer Signale Spektrum Spektrum erstellen Analyse → Spectrum → To Spectrum... Abspielen: Tabulator Frequenzbereiche markieren und abspielen Zeichnen Draw...

Suprasegmentale Manipulationen Akustische Geschlechtsumwandlung f005.wav und m005.wav Synthesize → Convert → change gender… Formant shift ratio Duration factor Lattner et al. (2005)

Suprasegmentale Manipulationen Flattening Sound 1a06 → Manipulate → To Manipulation... Manipulation 1a06 → Extract Pitch Tier Edit Remove Points Add Point Replace Pitch Tier Manipulation 1a06 & PitchTier untiteled gleichzeitig markieren → Replace Pitch Tier Flattened soundfile erstellen Manipulation 1a06 Play (overlapp-add) Get resynthesis (overlapp-add) Sound 1a06 Write → Write to WAV file… + weiter Melodieverläufe erstellen

Suprasegmentale Manipulationen Flattening Meyer et al. (2004)

Signalfilter Hochpass Tiefpass Bandpass Bandstopp Lässt Frequenzen über einer Grenzfrequenz passieren Tiefpass Lässt Frequenzen unter einer Grenzfrequenz passieren Bandpass Lässt Frequenzen in einem Frequenzband passieren Bandstopp Stoppt Frequenzen in einem Frequenzband

Signalfilter Flüstern 1a06.wav Hochpassfilter anlgegen Synthesize → Filter (stop hann band)… → 0...x Hz

Signalfilter Delexikalisieren Semantische Informationen zerstört, prosodische erhalten Kontrollbedingung in Experimenten (zB: Meyer et al., 2004) 1a06.wav Tiefpassfilter anlgegen Synthesize → Filter (pass hann band)… → 0...x Hz

Segmentale Manipulationen VOT VOT – Voice Onset Time Zeit zwischen Beginn des Konsonanten und Einsatz der Stimme (Schwingung der Stimmbänder) Frye(2007)

Segmentale Manipulationen VOT Kategoriale Sprachwahrnehmung /da/  /ta/ Phonem-Grenze = phonetic categoric boundary eco.psy.ruhr-uni-bochum.de/download/Guski-Lehrbuch/Kap_7_3.html

Segmentale Manipulationen VOT Pa-pa.wav /pa/ /ba/

Signalvorverarbeitung Normalisierung Zwei Unterschiedlich laute Soundfiles (jutta.wav & kind.wav) Normalisierung: Angleichung der Energie (→ Lautstärke) Modify → scale intesity… → zB: 70dB Kontrolle: Query → get intensity (dB)

Darstellung akustischer Signale Oszillogramm Edit Get Pitch/Formant Frequency... Wide-/Narrowband-Spektrogramm Spectrum → Spectrogramm settings… Window length: 0.005s → Wideband Window length: 0.05s → Narrowband Vgl. f0 und unterste Harmonische Oszillogram zeichnen Im Outputwindow einen eine Ebene aufspannen Draw… Parameter variieren File → Copy to clipboard Erase All

Literatur http://www.linguistics.ucsb.edu/faculty/gordon/106/106acousticpdf/widebandlinguistics.pdf http://www.logopaedie.rwth- aachen.de/personen/dozenten/bkroeger/documents/Kroeger_PhonetikSkript_2007.pdf http://www.phonetik.uni-muenchen.de/Lehre/Skripten/SGL/SGLHome.html http://www.spectrum.uni-bielefeld.de/~thies/HTHS_WiSe2005-06/formanten_in_vokaldreieck.jpg http://www.germanistik.unibe.ch/siebenhaar/subfolder/PhonetikPhonologie/