Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Wintersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik.

Ähnliche Präsentationen


Präsentation zum Thema: "Wintersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik."—  Präsentation transkript:

1

2 Wintersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes andreeva@coli.uni-sb.de Einf. in die Instrumentalphonetik

3 Administrativ n Teilnehmerliste n http://www.coli.uni-saarland.de/~andreeva n andreeva@coli.uni-sb.de Sitzung 1

4 3.05.4.05.5.05.10.05.11.05.12.05.13.05. 9-10 10-11 11-12 12-13 13-14 14-15

5 Kursinhalt n Mikrofonaufnahmen n Signaldarstellungen: - Oszillogramm = Mikrofonsignal = Druckwellen - Spektrum - Spektrogramm - Grundfrequenz (= F 0 ) n Messungen in den Signaldarstellungen - Dauer (Zeitbereich) - Harmonische, Formanten, Eckfrequenzen (Frequenzbereich) - Grundfrequenz (Zeit- und Frequenzbereich) Sitzung 1

6 Signalverarbeitungsprogramm n Computerized Speech Lab (CSL) n Entropic Signal Processing System (ESPS) mit Waves + (Visualisierung) n PRAAT Sitzung 1

7 Literatur n Pétursson, M. & Neppert, J. (1991). Elementarbuch der Phonetik. Hamburg: Helmut Buske Verlag. n Borden, G., Harris, K. & Raphael, L. (1994). Speech Science Primer. Physiology, Acoustics and Percep- tion of Speech. Baltimore: Williams & Wilkins. n Ladefoged, P. (1982). A Course in Phonetics. San Diego: Harcourt Brace Jovanovich. Sitzung 1

8 Erste Schritte in Praat Programm starten n Doppelklick auf der Ikone Es erscheinen 2 Fenster. Sitzung 1

9 Erste Schritte in Praat Signal aufnehmen n Wie erkennt man laute/leise Signale? n Welche Laute sind meistens lauter als ihre Umgebung? Sitzung 1

10 Aufnahmen n Anschließen des Mikrofons, bzw. des Kassetten- oder DAT -Recorders Unter NEW : n Record mono Sound n Abtastrate einstellen (Sampling frequency) - bei Vokalen bzw. F 0 : 10 kHz - bei Frikativen: 20 kHz n Aufnahmedauer (unbegrenzt) n Record anklicken n Aufnahmepegel einstellen Sitzung 2

11 Aufnahmen n Aufnahme starten (record) n Aufnahme beenden (stop) n Während der Aufnahme das Aufnahmepegel im Auge behalten n Datei benennen (sound markieren und umbennen) n Aufnahme speichern (save to list) Sitzung 2

12 Oszillogramm n Auch: Mikrofonsignal, Zeitsignal, Drucksignal n Darstellung des in Spannungsunterschiede umgewandelten Schalldrucksignals n x-Achse: Zeit (vgl. Dauer in der Perzeption) n y-Achse: Amplitude (vgl. Lautstärke in der Perzeption) Sitzung 2

13 Speichern von Daten n Relevanten Signalteil ausschneiden n Speichern Sitzung 2

14 Laden einer Signaldatei n Datei ip001rb.wav im Verzeichnis InstrPhon laden l Read l Read from file l Im Fenster Objects erscheint die Datei l Edit anklicken Sitzung 3

15 Abspielen der Vokale n die Vokale markieren und abspielen n Woran erkennt man die Vokale? Sitzung 3

16 Abspielen der Konsonanten n die Konsonanten markieren und abspielen l Welche Konsonanten sind für sich alleine identifizierbar? n [p] von Peter, [t] von tippt und [k] von Kieler markieren, sehen und hören l Was haben sie gemeinsam? l Welche Position haben sie? l In welcher Art von Silben befinden sie sich? Sitzung 3

17 Dauer der Konsonanten messen n Den jeweiligen Laut markieren und Dauer (in Sekunden) ablesen n 1 sek = 1000 ms Sitzung 3

18 Schneiden und Konkatenation Die 3 silbeninitiale Plosive in Fenster B kopieren: n Signalteil markieren n EDIT, copy selection to sound clipboard n EDIT, paste after selection - der markierte Signalteil wird eingefügt Sitzung 3

19 Hörtest n die im Fenster B kopierten Plosive in randomisierter Reihenfolge abspielen Sitzung 3 Daß wir die Plosive nicht gut voneinander unterscheiden können, hat einen Grund: Die Minimaleinheit, die wir hören, ist eine Silbe!

20 Phonetische Dauermessungen n ip006rb.wav laden Die Lallphase dauert nicht lange ip001rb.wav laden Peter tippt auf die Kieler - Wie unterscheidet sich [d] in Die von [t] in tippt? n Die zwei [d]-Segmente finden und vergleichen - Was haben sie gemeinsam? - Worin unterscheiden sie sich? Sitzung 4

21 Voice Onset Time (VOT) n VOT oder Stimmlatenzzeit: die Dauer vom Anfang der Lösung eines Plosivs bis zum Einsatz der Stimmlippenschwingungen n VOT von [d] in dauert und [t] in tippt messen und vergleichen - Wie unterscheidet sich [d] in Die von [t] in tippt? Sitzung 4 Faustregel:die VOT-Grenze zwischen dem stimmlosen [t] und dem stimmhaften [d] liegt bei etwa 25 ms (länger bei stimmlosen Plosiven) N.B. Energie auch wichtig: größer für stimmlose Plosive

22 Variable Lautrealisierungen n Vergleiche die beiden [t]s in nicht und tippt Sitzung 4 (Verschlußlösung) n ip008rb.wav laden Breite Karren stören den Betrieb n Vergleiche die [t]s in tippt und in stören (Aspiration)

23 Lautwahrnehmung n nicht lange markieren und vorspielen n Was hört man? Sitzung 4 Klange:Es gibt eine Preferenz, sinnvolle Äußerungen (Wörter) wahrzunehmen

24 Laute im Signal n Inhalte der Fenster löschen n Fenster C aktivieren und löschen: VIEW, DELETE ACTIVE VIEW n c:\user(s)\ip002rb.001 in Fenster A laden Tania kaufte Backpapier c:\user(s)\ip007rb.001 in Fenster B laden Junge Leute jammern nicht n Ausgabepegel auf Null stellen n Plosive und Vokale im Signal finden Sitzung 4

25 Spektrogramm Das Spektrogramm stellt 3 Dimensionen dar: n x-Achse: Zeit (ms) - vgl. Dauer in der Perzeption n y-Achse: Frequenz (Hz) - vgl. Tonhöhe und Klangqualität in der Perzeption n Schwärzungsgrad: Energie - vgl. Lautstärke in der Perzeption Sitzung 5

26 Grundbegriffe Sitzung 5 n Amplitude: maximale Auslenkung bzw. Abweichung von der Ruhelage (dB) n Frequenz: Anzahl der Schwingungen pro Sekunde (Hz) n Periodendauer: der zeitliche Abstand zweier benachbarter Maxima (T, ms) n Grundfrequenz: die Welle mit der längsten Perioden- dauer (Stimmlippen) n Harmonische: sinusförmige Obertöne, deren Frequenzen ganzzahlige Vielfache der Grundfrequenz sind (Stimmlippen); F 0 =H 1 ; H 2 = O 1 n Formanten: Bereiche von Harmonischen, die durch Resonanz eine maximale Intensität erreichen (Vokaltrakt)

27 Oszillogramm und Spektrogramm n Das Oszillogramm kann man als eine Überlagerung von mehreren Harmonischen betrachten n Die Harmonischen (als Klangfarbe wahrgenommen) werden durch ihre Frequenz (Kehrwert), ihre Amplitude und ihre Phase (relative Verschiebung zueinander) gekennzeichnet und bestimmen so das komplexe Oszillogramm n Die Grundfrequenz (als Tonhöhe wahrgenommen) kann von dem Oszillogramm als die Anzahl der Perioden (sich wiederholenden Signalteile) pro Sekunde berechnet werden: F 0 =1/T Sitzung 5

28 Oszillogramm und Spektrogramm Sitzung 5 n ip007rb.wav laden Das Spektrogramm ist eine bessere Darstellung des Signals, wenn man die einzelnen Frequenz- komponenten erkennen möchte. Es stellt die Frequenzbereiche dar, in denen viel Energie vorhanden ist.

29 Breitband-Spektrogramm n ip007rb.wav laden Sitzung 5 Hohe Auflösung im Zeitbereich, niedrige Auflösung im Frequenzbereich. n Einzelne Glottisschläge sind gut sichtbar (die vertikale Linien). n Die Formanten sind gut zu erkennen (breite horizontale Bänder). Sie sind charakteristisch für die Laute, insb. für Vokale.

30 Schmalband-Spektrogramm n Unter Spectrum, Spectrogram settings n Window length (s) von 0.005 auf 0.03 ändern Sitzung 5 Niedrige Auflösung im Zeitbereich, hohe Auflösung im Frequenzbereich. n Einzelne Glottisschläge nicht sichtbar. n Einzelne Harmonische sind gut zu erkennen (schmale paralelle Bänder). Grundfrequenz kann sehr genau berechnet werden aus der n-ten Harmonischen: Wert des n-ten Harmonischen festellen und durch n teilen. (Formanten schwer zu erkennen).

31 Abgrenzung von Segmenten Sitzung 5 n Meistens benutzen wir ein Breitband-Spektrogramm, um Laute zu segmentieren. n Akustische Ereignisse sind an Laute zuweisbar. n Zwischen den Lauten gibt es kontinuierliche Übergange. Diese entstehen dadurch, daß die Artikulatoren Zeit brauchen, um sich von der typischen oder Zielposition für einen Laut zur Zielposition des nächsten Lautes zu bewegen. Dabei sind die Artikulatoren (fast) ständig in Bewegung, wobei die Laute sich auch gegenseitig beeinflussen (= Koartikulation). kahlKielcool ABER:Paarperpur

32 Vokale im Spektrogramm Sitzung 6 n stimmhafte Laute n ihre Klangcharakteristika sind primär durch die Konfiguration des Vokaltraktes bestimmt n der durch Glottisimpulse angeregte Luftstrom (Quelle) wird im Ansatzrohr moduliert (Filter) n Veränderung der Resonanzeigenschaften des Ansatzrohres und somit der Resonanzfrequenzen des entstehenden Vokals durch Kehlkopfhöhe, Rachenenge, Zungenposition und -höhe sowie die Lippenstellung n typische spektrale Zusammensetzung mit Energiekonzentrationen bei den jeweiligen Resonanzfrequenzen (Formanten)

33 Vokale im Spektrogramm Sitzung 6 Vokale [ ], [ ] und [ ] (in junge, jammern und nicht) im Zeitsignal suchen. n Was ist der Unterschied zwischen den Vokalen? n Mit welchen artikulatorischen Dimensionen hängen F1 und F2 zusammen? n Was fällt auf, wenn man sich die Formanten eines Vokals (z.B. [ ]) im Kontext ansieht? Deutliche Formantenstruktur. Vor allem die Positionierung der ersten beiden Formanten (F1 und F2)ist sehr wichtig für unsere Wahrnehmung der Vokale F1: Kieferöffnung; F2: vorne-hinten Onset-, Offsettransitionen und evtl. steady state, wenn genug Zeit für die Artikulaton vorhanden ist

34 Messungen der Formantenwerte Sitzung 6 n Den Cursor in die Mitte des schwarzen Balkens (Formanten) setzen und den Wert rechts neben der roten gestrichelten Linie ablesen n Wenn es problematisch ist die Formanten zu erkennen, geht man von vorgegebenen Werten aus, d.h. man verwendet die durchschnittlichen Formantwerte zur Orientierung (diese sind im fast jeden Buch zu finden)

35

36 Messungen der Formantenwerte Sitzung 6 n Den Cursor in die Mitte des Vokals setzen n über den Menüeintrag Formant' -> Show formants' die Formanten im Spektrogramm anzeigen n Wieder über den Menüeintrag Formant' -> Formant listing' den jeweiligen Zeitpunkt sowie F1, F2, F3 und F4 auflisten

37 FRIKATIVE Sitzung 9 n Die Entstehung der Frikative basiert auf einer Enge- bildung im Mundraum zwischen artikulierendem Organ und der Artikulationsstelle. Diese Verengung unterteilt den Mundraum in einen vorderen und einen hinteren Resonanzraum. Der Luftstrom, der diese Enge passiert, wird turbulent. Luftturbulenzen sind die typischen Schallquellen aller Frikative. n Das erzeugte Friktionsgeräusch wirkt als akustische Anregung für beide Resonanzräume. Es wird jedoch überwiegend im vorderen Mundraum moduliert, so daß das Spektrum des am Mund abgestrahlten Frikativ- schalls weitgehend von Größe und Form des vorderen Resonanzraumes abhängt.

38 FRIKATIVE Sitzung 9 n Generell gilt, je größer der vordere Resonanzraum ist, d.h. je weiter hinten die Artikulationsstelle, also der Ort der Engebildung, liegt, desto stärker wird der Schall moduliert und umso ausgeprägter ist sein Spektrum. Während also beim labiodentalen [f] das Spektrum sehr flach ist, weist das velare [x] bereits formant- ähnliche Strukturen auf. n Das Frikativspektrum weist wesentlich mehr Intensität in den höheren Frequenzbereichen oberhalb von 2500 Hz auf als in den unteren Frequenzbereichen. Je nach Artikulationsort konzentriert sich dieses 'Rauschen auf bestimmte Frequenzbereiche.

39 n Ein wichtiges Merkmal besonders zur Unterscheidung der hinteren Artikulationsstellen ist neben den Transitionen die spektrale Zusammensetzung des Frikativschalls, sein Schwerpunkt und seine Gesamtintensität. Das Frikativspektrum wird durch die Passage des frikativen Grundschalls von dem Ort der Engebildung bis zur Mundöffnung geprägt. Je länger die Passage, desto tiefer sind die am Mund abgestrahlten Frequenzen, bzw. ihr Gesamtschwerpunkt. n Je weiter hinten die Artikulationsstelle des Frikativs liegt, desto tiefer liegt auf der Frequenzachse die untere Grenze des Frikativschwerpunktes (vgl. [s] und [ ]) und desto strukturierter ist das Frikativspektrum (vgl. [f] und [h]). FRIKATIVE Sitzung 9

40 n Das Spektrum labiodentaler Frikative ist flach. Ihre Energie ist gleichmäßig über alle Frequenzbereiche verteilt mit einer leichten Energiekonzentration im obersten Frequenzbereich oberhalb von 6000 Hz. [f] und [v] sind - besonders im Vergleich zu [s] und [S] - Frikative geringer Energie. Labiodental [f v] Sitzung 9

41 n Das Spektrum der alveolaren Frikative weist insgesamt eine sehr hohe Intensität auf. Es gibt eine Energiekonzentration im Bereich von 5000 Hz bis 8000 Hz. Die Untergrenze des Energieschwerpunktes (= Eckfrequenz) kann bei angrenzenden hinteren Vokalen um bis zu 1000 Hz tiefer liegen. Alveolar [s z] Sitzung 9

42 n Postalveolare Frikative weisen im Zeitsignal die stärkste Energie, d.h. die höchste Amplitude auf. Dadurch weisen sie im Sonagramm einen sehr hohen Schwärzungsgrad auf. Ihr Energieschwerpunkt liegt im Bereich von 2500 Hz bis 7000 Hz. Damit liegt ihr Schwerpunkt um bis zu 2500 Hz tiefer als bei den alveolaren Frikativen. Die Schwerpunktsuntergrenze (= Eckfrequenz) variiert ebenfalls je nach angrenzendem Vokal. Postalveolar [ ] Sitzung 9

43 n Palatale Frikative sind wesentlich intensitätsschwächer als alveolare oder postalveolare. Ihr Frequenzschwer- punkt reicht hinunter bis ca. 3000 Hz und kann bereits formantähnliche Strukturen aufweisen. Damit liegt ihre Schwerpunktuntergrenze über der der postalveolaren Frikative. Dieses Faktum widerspricht dennoch nicht dem Gesetz der artikulatorischen Tiefe, da sich beim postalveolaren Frikativ [ ] die vordere Mundraum- passage durch Lippenrundung verlängert. Dadurch liegt dieser, absolut gemessen, von der Mundöffnung weiter hinten als der palatale Frikativ. Palatal [ç j] Sitzung 9

44 n Der velare Frikativ [x] zeichnet sich durch Friktions- energie bis in die untersten Frequenzbereiche aus und läßt sich dadurch vom palatalen [ç] unterscheiden. Sein Spektrum weist eine relativ gut ausgeprägte formant- ähnliche Struktur auf. Sie variiert zwar in Abhängigkeit von den angrenzenden Vokalen, entspricht aber nicht - anders als beim glottalen /h/ - deren Formantstruktur. n Zur Unterscheidung von [x] und [ç] kann im Deutschen der vokalische Kontext hinzugenommen werden, der entscheidet, welches /ch/-Allophon produziert wird, da beide distributive Allophone des Phonems /ch/ sind. So taucht das [x] niemals nach vorderen Vokalen oder initial auf. Das [ç] dagegen kann sowohl initial als auch im Diminuitivsuffix "-chen" nach jedem Vokal auftreten. Velar [x] Sitzung 9

45 Glottal [h] n Der glottale Frikativ ist ein stark koartikulierter Laut. n Das /h/ bezieht seine Vokalqualitäten aus dem phonetischen Kontext, d.h. sowohl aus dem vorausgehenden als auch dem folgenden Vokal. n Auch im vokalischen Kontext zeigen sich im Bereich von 300 Hz bis 2400 Hz keine Transitionen an den Grenzen des Frikativs. n Lediglich der dritte Formant F3 scheint konstant und damit unabhängig vom Vokalkontext und /h/- immanent zu sein. Er liegt zwischen 2500 Hz und 2800 Hz.

46 Koartikulation Apart spart Bart [ a p h a t ] [ Spa t ] [ b a t ] _________________ M. ___________________________________________________________________ N. ___________________________________________________________________ S. ___________________________________________________________________ (M. = Mundraum; N. = Nase (Velum); S. = Stimmritze) xxxxxxxxxxxxxxxxx xxxx Zusammenfassung

47 Koartikulation S t r ei k p o s t e n [ S t aIk p h s t n ] ___________________________________________________________________ M. ___________________________________________________________________ N. ___________________________________________________________________ S. ___________________________________________________________________ (M. = Mundraum; N. = Nase (Velum); S. = Stimmritze). xxxxxxxxxxx xxxx Zusammenfassung

48 Artikulation Akustik Die Erzeugung der akustisch unterschiedlichen Laute, die für die sprachliche Informationsübertragung nötig sind, beruht auf: Diese zwei Stufen der akustischen Lautproduktion werden in einem Modell zusammengefasst: Source-Filter Model (Deutsch: Anregung-Filter Modell) 1. unterschiedlichen Arten der Umwandlung kinetischer Energie (Luftstrom) in akustische Energie (Schwingungsformen), 2. der weiteren Modifikation (= Färbung) der erzeugten akustischen Signale. d.h., die Energieumwandlung ist die akustische Anregung und die Modifikation/Färbung ist die Filterung der akustischen Energie. Zusammenfassung

49 Unterschiedliche Zungenformen verändern die Hohlräume und somit die Resonanzen, z.B.: Zungenform und Lippenpositionen für Vokale Großer hinterer Hohlraum kleiner vorderer Hohlraum Kleiner hinterer Hohlraum großer vorderer Hohlraum Zusammenfassung

50 Hohlräume und Vokalqualität Hier werden die Werte des ersten und des zweiten Formanten (F1 & F2) im Verhältnis Zweiter Formant (Hz) Erster Formant (Hz) einerseits zum Pharynx und zum oralen Hohlraum, Zusammenfassung

51 Hohlräume und Vokalqualität Hier werden die Werte des ersten und des zweiten Formanten (F1 & F2) im Verhältnis Zweiter Formant (Hz) einerseits zum Pharynx und zum oralen Hohlraum, Erster Formant (Hz) andererseits zur Zungenhöhe und Zungenposition. Zusammenfassung

52 Wie kann man sich Formantwerte merken? ieEaA ou freq. F2 F1 Gerundete, vorgestülpte Lippen verlängern den oralen Hohlraum und senken F2. y F1 F2 Zusammenfassung

53 Deutsche Vokale (nach Neppert & Petursson) Zusammenfassung

54 Nasale mit komplexem Resonator n Pharynx + Nasaltrakt = Hauptresonator; Oraltrakt = Nebenresonator Oraltrakt Resonator Nasenausgang Mundausgang Pharynx- Resonator Glottis Nasaltrakt Resonator Zungen- oder Lippenverschluss Zusammenfassung

55 Sind / m n N / unterschiedlich? Kaum! Der Hauptresonator bleibt konstant; die Nebenresonatoren variieren (dies wirkt sich ein wenig auf die Stärke der Resonanzen aus). Engl. pin Tim King Zusammenfassung

56 Frikative Frikative entstehen durch Turbulenz an einer Verengung (Quelle). Die Färbung des Rauschens wird durch die Resonanzeigenschaften des vorderen Hohlraums bestimmt: Modell für Frikativproduktion Quelle der Turbulenz Luftstrom Verengung Hinterer HohlraumVorderer Hohlraum Glottis Lippen Je kleiner desto höher die Frequenz des Rauschens Zusammenfassung

57 Sibilanten Frikative mit zusätzlichem Rauschen durch Turbulenz an den Zähnen = Sibilanten: /s z S Z/ Modell für Sibilantenproduktion primäre Quelle der Turbulenz Quelle sekundärer Turbulenz Hindernis (Zähne) Luftstrom Verengung Hinterer Hohlraum Vorderer Hohlraum Zusammenfassung

58 Andere Frikative Frikative ohne zusätzliche Turbulenz: (labio-)dentale [f, v, T, D]; palatale [C, ]; velare [x, ]; pharyngale [, ] und glottale [h, ]. n Von der (labio-)dentalen Verengung (fast ohne Resonator) bis zur glottalen Verengung (mit dem ganzen Vokaltrakt als Resonator) wird der Resonator größer. Dies hat tiefer-frequentigen Resonanzen zur Folge. Zusammenfassung

59 Andere Frikative 2 [f][T][C][x][ ][h][h][s][S] sibilants { Zusammenfassung

60 Plosive: akustische Unterschiede [ a b a ][ a p a ] 1. Verschlussdauer?2. Stimme im Verschluss? 3. Lösungsenergie? 4. Formanttransitionen? Zusammenfassung

61 Plosive: akustische Unterschiede (2) [ a d a ][ a t a ] 1. Verschlussdauer?2. Stimme im Verschluss? 3. Lösungsenergie? 4. Formanttransitionen? Zusammenfassung

62 Plosive: akustische Unterschiede (3) [ a g a ][ a k a ] 1. Verschlussdauer? 2. Stimme im Verschluss? 3. Lösungsenergie? 4. Formanttransitionen? Zusammenfassung


Herunterladen ppt "Wintersemester 2010 Bistra Andreeva FR 4.7 Phonetik Universität des Saarlandes Einf. in die Instrumentalphonetik."

Ähnliche Präsentationen


Google-Anzeigen