Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Sommersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik.

Kopien: 1
Wintersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik.

Ähnliche Präsentationen


Präsentation zum Thema: "Sommersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik."—  Präsentation transkript:

1 Sommersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik

2 Administrativ n Teilnehmerliste n n Sitzung 1

3

4 Kursinhalt n Mikrofonaufnahmen n Signaldarstellungen: - Oszillogramm = Mikrofonsignal = Druckwellen - Spektrum - Spektrogramm - Grundfrequenz (= F 0 ) n Messungen in den Signaldarstellungen - Dauer (Zeitbereich) - Harmonische, Formanten, Eckfrequenzen (Frequenzbereich) - Grundfrequenz (Zeit- und Frequenzbereich) Sitzung 1

5 Signalverarbeitungsprogramm n Computerized Speech Lab (CSL) n Entropic Signal Processing System (ESPS) mit Waves + (Visualisierung) n PRAAT Sitzung 1

6 Literatur n Pétursson, M. & Neppert, J. (1991). Elementarbuch der Phonetik. Hamburg: Helmut Buske Verlag. n Borden, G., Harris, K. & Raphael, L. (1994). Speech Science Primer. Physiology, Acoustics and Percep- tion of Speech. Baltimore: Williams & Wilkins. n Ladefoged, P. (1982). A Course in Phonetics. San Diego: Harcourt Brace Jovanovich. Sitzung 1

7 Erste Schritte in Praat Programm starten n Doppelklick auf der Ikone Es erscheinen 2 Fenster. Sitzung 1

8 Erste Schritte in Praat Signal aufnehmen n Wie erkennt man laute/leise Signale? n Welche Laute sind meistens lauter als ihre Umgebung? Sitzung 1

9 Aufnahmen n Anschließen des Mikrofons, bzw. des Kassetten- oder DAT -Recorders Unter NEW : n Record mono Sound n Abtastrate einstellen (Sampling frequency) - bei Vokalen bzw. F 0 : 10 kHz - bei Frikativen: 20 kHz n Aufnahmedauer (unbegrenzt) n Record anklicken n Aufnahmepegel einstellen Sitzung 2

10 Aufnahmen n Aufnahme starten (record) n Aufnahme beenden (stop) n Während der Aufnahme das Aufnahmepegel im Auge behalten n Datei benennen (sound markieren und umbennen) n Aufnahme speichern (save to list) Sitzung 2

11 Oszillogramm n Auch: Mikrofonsignal, Zeitsignal, Drucksignal n Darstellung des in Spannungsunterschiede umgewandelten Schalldrucksignals n x-Achse: Zeit (vgl. Dauer in der Perzeption) n y-Achse: Amplitude (vgl. Lautstärke in der Perzeption) Sitzung 2

12 Speichern von Daten n Relevanten Signalteil ausschneiden n Speichern Sitzung 2

13 Laden einer Signaldatei n Datei ip001rb.wav im Verzeichnis InstrPhon laden l Read l Read from file l Im Fenster Objects erscheint die Datei l Edit anklicken Sitzung 3

14 Abspielen der Vokale n die Vokale markieren und abspielen n Woran erkennt man die Vokale? Sitzung 3

15 Abspielen der Konsonanten n die Konsonanten markieren und abspielen l Welche Konsonanten sind für sich alleine identifizierbar? n [p] von Peter, [t] von tippt und [k] von Kieler markieren, sehen und hören l Was haben sie gemeinsam? l Welche Position haben sie? l In welcher Art von Silben befinden sie sich? Sitzung 3

16 Dauer der Konsonanten messen n Den jeweiligen Laut markieren und Dauer (in Sekunden) ablesen n 1 sek = 1000 ms Sitzung 3

17 Schneiden und Konkatenation Die 3 silbeninitiale Plosive in Fenster B kopieren: n Signalteil markieren n EDIT, copy selection to sound clipboard n EDIT, paste after selection - der markierte Signalteil wird eingefügt Sitzung 3

18 Hörtest n die im Fenster B kopierten Plosive in randomisierter Reihenfolge abspielen Sitzung 3 Daß wir die Plosive nicht gut voneinander unterscheiden können, hat einen Grund: Die Minimaleinheit, die wir hören, ist eine Silbe!

19 Phonetische Dauermessungen n ip006rb.wav laden Die Lallphase dauert nicht lange ip001rb.wav laden Peter tippt auf die Kieler - Wie unterscheidet sich [d] in Die von [t] in tippt? n Die zwei [d]-Segmente finden und vergleichen - Was haben sie gemeinsam? - Worin unterscheiden sie sich? Sitzung 4

20 Voice Onset Time (VOT) n VOT oder Stimmlatenzzeit: die Dauer vom Anfang der Lösung eines Plosivs bis zum Einsatz der Stimmlippenschwingungen n VOT von [d] in dauert und [t] in tippt messen und vergleichen - Wie unterscheidet sich [d] in Die von [t] in tippt? Sitzung 4 Faustregel:die VOT-Grenze zwischen dem stimmlosen [t] und dem stimmhaften [d] liegt bei etwa 25 ms (länger bei stimmlosen Plosiven) N.B. Energie auch wichtig: größer für stimmlose Plosive

21 Variable Lautrealisierungen n Vergleiche die beiden [t]s in nicht und tippt Sitzung 4 (Verschlußlösung) n ip008rb.wav laden Breite Karren stören den Betrieb n Vergleiche die [t]s in tippt und in stören (Aspiration)

22 Lautwahrnehmung n nicht lange markieren und vorspielen n Was hört man? Sitzung 4 Klange:Es gibt eine Preferenz, sinnvolle Äußerungen (Wörter) wahrzunehmen

23 Laute im Signal n Inhalte der Fenster löschen n Fenster C aktivieren und löschen: VIEW, DELETE ACTIVE VIEW n c:\user(s)\ip002rb.001 in Fenster A laden Tania kaufte Backpapier c:\user(s)\ip007rb.001 in Fenster B laden Junge Leute jammern nicht n Ausgabepegel auf Null stellen n Plosive und Vokale im Signal finden Sitzung 4

24 Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: n x-Achse: Zeit (ms) - vgl. Dauer in der Perzeption n y-Achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption n Schwärzungsgrad: Energie - vgl. Lautstärke in der Perzeption Sitzung 5

25 Grundbegriffe Sitzung 5 n Amplitude: maximale Auslenkung bzw. Abweichung von der Ruhelage (dB) n Frequenz: Anzahl der Schwingungen pro Sekunde (Hz) n Periodendauer: der zeitliche Abstand zweier benachbarter Maxima (T, ms) n Grundfrequenz: die Welle mit der längsten Perioden- dauer (Stimmlippen) n Harmonische: sinusförmige Obertöne, deren Frequenzen ganzzahlige Vielfache der Grundfrequenz sind (Stimmlippen); F 0 =H 1 ; H 2 = O 1 n Formanten: Bereiche von Harmonischen, die durch Resonanz eine maximale Intensität erreichen (Vokaltrakt)

26 Oszillogramm und Spektrogramm n Das Oszillogramm kann man als eine Überlagerung von mehreren Harmonischen betrachten n Die Harmonischen (als Klangfarbe wahrgenommen) werden durch ihre Frequenz (Kehrwert), ihre Amplitude und ihre Phase (relative Verschiebung zueinander) gekennzeichnet und bestimmen so das komplexe Oszillogramm n Die Grundfrequenz (als Tonhöhe wahrgenommen) kann von dem Oszillogramm als die Anzahl der Perioden (sich wiederholenden Signalteile) pro Sekunde berechnet werden: F 0 =1/T Sitzung 5

27 Oszillogramm und Spektrogramm Sitzung 5 n ip007rb.wav laden Das Spektrogramm ist eine bessere Darstellung des Signals, wenn man die einzelnen Frequenz- komponenten erkennen möchte. Es stellt die Frequenzbereiche dar, in denen viel Energie vorhanden ist.

28 Breitband-Spektrogramm n ip007rb.wav laden Sitzung 5 Hohe Auflösung im Zeitbereich, niedrige Auflösung im Frequenzbereich. n Einzelne Glottisschläge sind gut sichtbar (die vertikale Linien). n Die Formanten sind gut zu erkennen (breite horizontale Bänder). Sie sind charakteristisch für die Laute, insb. für Vokale.

29 Schmalband-Spektrogramm n Unter Spectrum, Spectrogram settings n Window length (s) von auf 0.03 ändern Sitzung 5 Niedrige Auflösung im Zeitbereich, hohe Auflösung im Frequenzbereich. n Einzelne Glottisschläge nicht sichtbar. n Einzelne Harmonische sind gut zu erkennen (schmale paralelle Bänder). Grundfrequenz kann sehr genau berechnet werden aus der n-ten Harmonischen: Wert des n-ten Harmonischen festellen und durch n teilen. (Formanten schwer zu erkennen).

30 Abgrenzung von Segmenten Sitzung 5 n Meistens benutzen wir ein Breitband-Spektrogramm, um Laute zu segmentieren. n Akustische Ereignisse sind an Laute zuweisbar. n Zwischen den Lauten gibt es kontinuierliche Übergange. Diese entstehen dadurch, daß die Artikulatoren Zeit brauchen, um sich von der typischen oder Zielposition für einen Laut zur Zielposition des nächsten Lautes zu bewegen. Dabei sind die Artikulatoren (fast) ständig in Bewegung, wobei die Laute sich auch gegenseitig beeinflussen (= Koartikulation). kahlKielcool ABER:Paarperpur

31 Vokale im Spektrogramm Sitzung 6 n stimmhafte Laute n ihre Klangcharakteristika sind primär durch die Konfiguration des Vokaltraktes bestimmt n der durch Glottisimpulse angeregte Luftstrom (Quelle) wird im Ansatzrohr moduliert (Filter) n Veränderung der Resonanzeigenschaften des Ansatzrohres und somit der Resonanzfrequenzen des entstehenden Vokals durch Kehlkopfhöhe, Rachenenge, Zungenposition und -höhe sowie die Lippenstellung n typische spektrale Zusammensetzung mit Energiekonzentrationen bei den jeweiligen Resonanzfrequenzen (Formanten)

32 Vokale im Spektrogramm Sitzung 6 Vokale [ ], [ ] und [ ] (in junge, jammern und nicht) im Zeitsignal suchen. n Was ist der Unterschied zwischen den Vokalen? n Mit welchen artikulatorischen Dimensionen hängen F1 und F2 zusammen? n Was fällt auf, wenn man sich die Formanten eines Vokals (z.B. [ ]) im Kontext ansieht? Deutliche Formantenstruktur. Vor allem die Positionierung der ersten beiden Formanten (F1 und F2)ist sehr wichtig für unsere Wahrnehmung der Vokale F1: Kieferöffnung; F2: vorne-hinten Onset-, Offsettransitionen und evtl. steady state, wenn genug Zeit für die Artikulaton vorhanden ist

33 Messungen der Formantenwerte Sitzung 6 n Den Cursor in die Mitte des schwarzen Balkens (Formanten) setzen und den Wert rechts neben der roten gestrichelten Linie ablesen n Wenn es problematisch ist die Formanten zu erkennen, geht man von vorgegebenen Werten aus, d.h. man verwendet die durchschnittlichen Formantwerte zur Orientierung (diese sind im fast jeden Buch zu finden)

34

35 Messungen der Formantenwerte Sitzung 6 n Den Cursor in die Mitte des Vokals setzen n über den Menüeintrag Formant' -> Show formants' die Formanten im Spektrogramm anzeigen n Wieder über den Menüeintrag Formant' -> Formant listing' den jeweiligen Zeitpunkt sowie F1, F2, F3 und F4 auflisten

36 Spektrogramm und Spektrum Sitzung 8 n Datei ip003rb.wav laden Formantwerte (F1 und F2) vom / a: / im mal ablesen n Das Spektrogramm zeigt die Veränderung der Energieverteilung im Frequenzbereich Welche Dimensionen stellt das Spektrogramm dar?

37 Aufrufen des Spektrums Sitzung 8 n den Cursor in die Mitte des zu untersuchenden Vokals setzen. n über den Menüeintrag 'Query' -> 'Get cursor' die Position des Cursors anzeigen (am besten die im Fenster angezeigte Zeit kopieren). n im 'Praat objects'-Fenster das Spektrogramm auswählen n auf To Spectrum (slice)… klicken (es erscheint ein Fenster, in dem die ausgewählte Zeit eingegeben wird) n nach 'OK' erscheint das Spektrum im 'Praat objects'- Fenster n Mit Draw wird das Spektrum angezeigt.

38 Aufrufen des Spektrums Sitzung 8 n Das Spektrum stellt 2 Dimensionen dar: x-Achse: Frequenz y-Achse: Energie n Das Spektrum zeigt die Energie in den Harmonischen und in den Geräuschkomponenten im gewählten Zeitabschnitt (normalerweise ein kurzer Zeitabschnitt). Bei längeren Zeitabschnitten (z.B. größer als 1 Sekunde) spricht man von einem Langzeitspektrum (Stimmqualitätsmaß)

39 Spektrum Sitzung 8 n Das Spektrogramm kann man als eine Reihe von Spektren betrachten (vgl. Wasserfallspektrogramm) n Anregung: Wie im Spektrogramm (welches?) kann man auch im Kurzzeit-Spektrum einzelne Harmonische erkennen, die mit der Anregung zusammenhängen. Die erste Harmonische (H 1 ) ist der Grundton (F 0 ), der mit der Geschwindigkeit der Stimmlippenschwingungen zusammenhängt. Alle anderen Harmonischen sind Vielfache des Grundtons. Die zweite Harmonische wird als der erste Oberton bezeichnet usw. N.B. Die HARMONISCHEN SIND KEINE FORMANTEN!

40 Spektrum Sitzung 8 n Filter: Die Resonanzen des Vokaltrakts (Formanten) kann man im Spektrum von der Hüllkurve ableiten. Dabei muß man darauf achten, daß die Gipfel in der Hüllkurve mit den Harmonischen nicht zusammenfallen. Um Formanten zu finden muß man mit dem Auge bestimmen, wo in der Hüllkurve Maxima vorhanden sind. Dazu benutzt man auch die Amplituden der Harmonischen: Bei der Interpretation sind auch Kenntnisse über den Wert der erwarteten Formanten wichtig

41 FRIKATIVE Sitzung 9 n Die Entstehung der Frikative basiert auf einer Enge- bildung im Mundraum zwischen artikulierendem Organ und der Artikulationsstelle. Diese Verengung unterteilt den Mundraum in einen vorderen und einen hinteren Resonanzraum. Der Luftstrom, der diese Enge passiert, wird turbulent. Luftturbulenzen sind die typischen Schallquellen aller Frikative. n Das erzeugte Friktionsgeräusch wirkt als akustische Anregung für beide Resonanzräume. Es wird jedoch überwiegend im vorderen Mundraum moduliert, so daß das Spektrum des am Mund abgestrahlten Frikativ- schalls weitgehend von Größe und Form des vorderen Resonanzraumes abhängt.

42 FRIKATIVE Sitzung 9 n Generell gilt, je größer der vordere Resonanzraum ist, d.h. je weiter hinten die Artikulationsstelle, also der Ort der Engebildung, liegt, desto stärker wird der Schall moduliert und umso ausgeprägter ist sein Spektrum. Während also beim labiodentalen [f] das Spektrum sehr flach ist, weist das velare [x] bereits formant- ähnliche Strukturen auf. n Das Frikativspektrum weist wesentlich mehr Intensität in den höheren Frequenzbereichen oberhalb von 2500 Hz auf als in den unteren Frequenzbereichen. Je nach Artikulationsort konzentriert sich dieses 'Rauschen auf bestimmte Frequenzbereiche.

43 n Ein wichtiges Merkmal besonders zur Unterscheidung der hinteren Artikulationsstellen ist neben den Transitionen die spektrale Zusammensetzung des Frikativschalls, sein Schwerpunkt und seine Gesamtintensität. Das Frikativspektrum wird durch die Passage des frikativen Grundschalls von dem Ort der Engebildung bis zur Mundöffnung geprägt. Je länger die Passage, desto tiefer sind die am Mund abgestrahlten Frequenzen, bzw. ihr Gesamtschwerpunkt. n Je weiter hinten die Artikulationsstelle des Frikativs liegt, desto tiefer liegt auf der Frequenzachse die untere Grenze des Frikativschwerpunktes (vgl. [s] und [S]) und desto strukturierter ist das Frikativspektrum (vgl. [f] und [h]). FRIKATIVE Sitzung 9

44 n Das Spektrum labiodentaler Frikative ist flach. Ihre Energie ist gleichmäßig über alle Frequenzbereiche verteilt mit einer leichten Energiekonzentration im obersten Frequenzbereich oberhalb von 6000 Hz. [f] und [v] sind - besonders im Vergleich zu [s] und [S] - Frikative geringer Energie. Labiodental [f v] Sitzung 9

45 n Das Spektrum der alveolaren Frikative weist insgesamt eine sehr hohe Intensität auf. Es gibt eine Energiekonzentration im Bereich von 5000 Hz bis 8000 Hz. Die Untergrenze des Energieschwerpunktes (= Eckfrequenz) kann bei angrenzenden hinteren Vokalen um bis zu 1000 Hz tiefer liegen. Alveolar [s z] Sitzung 9

46 n Postalveolare Frikative weisen im Zeitsignal die stärkste Energie, d.h. die höchste Amplitude auf. Dadurch weisen sie im Sonagramm einen sehr hohen Schwärzungsgrad auf. Ihr Energieschwerpunkt liegt im Bereich von 2500 Hz bis 7000 Hz. Damit liegt ihr Schwerpunkt um bis zu 2500 Hz tiefer als bei den alveolaren Frikativen. Die Schwerpunktsuntergrenze (= Eckfrequenz) variiert ebenfalls je nach angrenzendem Vokal. Postalveolar [S Z] Sitzung 9

47 n Palatale Frikative sind wesentlich intensitätsschwächer als alveolare oder postalveolare. Ihr Frequenzschwer- punkt reicht hinunter bis ca Hz und kann bereits formantähnliche Strukturen aufweisen. Damit liegt ihre Schwerpunktuntergrenze über der der postalveolaren Frikative. Dieses Faktum widerspricht dennoch nicht dem Gesetz der artikulatorischen Tiefe, da sich beim postalveolaren Frikativ [S] die vordere Mundraum- passage durch Lippenrundung verlängert. Dadurch liegt dieser, absolut gemessen, von der Mundöffnung weiter hinten als der palatale Frikativ. Palatal [ç j] Sitzung 9

48 n Der velare Frikativ [x] zeichnet sich durch Friktions- energie bis in die untersten Frequenzbereiche aus und läßt sich dadurch vom palatalen [ç] unterscheiden. Sein Spektrum weist eine relativ gut ausgeprägte formant- ähnliche Struktur auf. Sie variiert zwar in Abhängigkeit von den angrenzenden Vokalen, entspricht aber nicht - anders als beim glottalen /h/ - deren Formantstruktur. n Zur Unterscheidung von [x] und [ç] kann im Deutschen der vokalische Kontext hinzugenommen werden, der entscheidet, welches /ch/-Allophon produziert wird, da beide distributive Allophone des Phonems /ch/ sind. So taucht das [x] niemals nach vorderen Vokalen oder initial auf. Das [ç] dagegen kann sowohl initial als auch im Diminuitivsuffix "-chen" nach jedem Vokal auftreten. Velar [x] Sitzung 9

49 Glottal [h] n Der glottale Frikativ ist ein stark koartikulierter Laut. n Das /h/ bezieht seine Vokalqualitäten aus dem phonetischen Kontext, d.h. sowohl aus dem vorausgehenden als auch dem folgenden Vokal. n Auch im vokalischen Kontext zeigen sich im Bereich von 300 Hz bis 2400 Hz keine Transitionen an den Grenzen des Frikativs. n Lediglich der dritte Formant F3 scheint konstant und damit unabhängig vom Vokalkontext und /h/- immanent zu sein. Er liegt zwischen 2500 Hz und 2800 Hz.


Herunterladen ppt "Sommersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik."

Ähnliche Präsentationen


Google-Anzeigen