Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Inhalt Grundlagen, Begriffe Signal, System, Frequenz, Amplitude, Phase, Spektrum Abtastung, Quantisierung Akustische Modelle der Sprachproduktion Röhrenmodell.

Ähnliche Präsentationen


Präsentation zum Thema: "Inhalt Grundlagen, Begriffe Signal, System, Frequenz, Amplitude, Phase, Spektrum Abtastung, Quantisierung Akustische Modelle der Sprachproduktion Röhrenmodell."—  Präsentation transkript:

1 Inhalt Grundlagen, Begriffe Signal, System, Frequenz, Amplitude, Phase, Spektrum Abtastung, Quantisierung Akustische Modelle der Sprachproduktion Röhrenmodell Quelle-Filter-Modell Formantverschiebung (Perturbation Model) spektrale Merkmale der Lautklassen Spektralanalyse Grundfrequenzanalyse

2 Sprachakustik beschäftigt sich mit der Signalverarbeitung und Sprachkommunikation Gebiete: Spracherzeugung, Vokaltraktmodelle Sprachsignalanalyse Sprachwahrnehmung, Sprachverständlichkeit und -güte Sprach- und Toncodierung Sprachsynthese Störsignalunterdrückung, robuste Sprachsignalverarbeitung Spracherkennung Sprechererkennung

3 Grundlagen und Begriffe Signal analoges (zeit- und wertekontinuierlich) modulierte Signale: amplituden-, frequenzmoduliert digitales (zeitdiskret und wertediskret) Signalparameter Frequenz Amplitude Phase Dämpfung System Spektrum

4 Frequenz, Amplitude, Phase Frequenz = 1 / Periodendauer = wie oft pro Sekunde wiederholt sich die Schwingung Einheit 1/s = Hertz = Hz Amplitude = Grad der Auslenkung Phase [Grad] = Schwingungszustand der Welle an best. Ort zu best. Zeitpunkt

5 Phasenverschiebung Wellen mit gleicher Phase Wellen mit verschiedener Phasenlage

6 Analoge und digitale Signale

7 Amplitudenmodulation (AM) amplitudenmoduliertes Signal hochfrequentes Trägersignal niederfrequentes Nutzsignal einfache Erzeugung und Rückgewinnung Träger- und Nutzfrequenz werden multipliziert und dann zur Trägerfrequenz addiert Modulationsgrad wie stark die Amplitude beeinflusst wird

8 Frequenzmodulation (FM) frequenzmoduliertes Signal Nutzsignal verändert die Frequenz des Trägersignals (Phase wird ebenfalls beeinflusst) Vorteile gegenüber AM: größerer Dynamikumfang des Nutzsignals möglich geringere Störanfälligkeit Anwendung: Funktechnik: störungsarme, drahtlose Übertragung von Rundfunkprogrammen (UKW), Sprechfunk Fernsehton, bei SECAM auch Farbinformation Videosignal beim Videorekorder (auch Ton bei Hifi-Video) Messtechnik, Rasterverfahren der Drucktechnik

9 Bild FM

10 Frequenzmoduliertes Signal

11 Dämpfung ungedämpfte Schwingung in der Natur nicht vorhanden, nur technisch erzeugt gedämpfte Schwingung Normalfall

12 Systeme in der Signalverarbeitung Eingangssignal wird verändert wieder ausgegeben Ausgangssignal ist Funktion des Eingangssignals Übertragungsfunktion Transformationsvorschrift Operator

13 Aufbau eines Systems

14 A/D- und D/A-Wandlung A/D-Wandlung = Digitalisierung analoges Signal wird in ein digitales Signal umgewandelt = Sampling und Quantisierung

15 Abtastung (Sampling) Input: zeitkontinuierliches und wertekontinierliches Signal Output: zeitdiskretes, wertekontinuierliches Signal

16 Abtastrate / Samplingfrequenz

17 Abtasttheorem nach Nyquist/Shannon besagt, dass ein analoges Signal nach einer Digitalisierung wieder vollständig rekonstruierbar ist, wenn die Abtastfrequenz mindestens doppelt so hoch wie die größte enthaltene Signalfrequenz ist f abtast > 2 f max für Sprachanalysen übliche Abtastfrequenz: 16 kHz weil das Sprachsignal nur Frequenzen bis etwa 7 kHz enthält

18 Vom analogen zum digitalen Signal analoges Signal Abtastung Zeit wird diskret Quantisierung Werte werden diskret

19 Quantisierung

20 Quantisierungsfehler

21 Spektrum (meist grafische) Darstellung der Eigenschaften eines Signals spektrale Eigenschaften = Energie aller enthaltenen Frequenzen eines Signals

22 Spektren verschiedener Signale

23 aua

24 Beispiele Signal und Wasserfallspektrogramm

25 Akustische Modelle der Sprachproduktion Quelle-Filter-Modell Röhrenmodell Perturbation Model (Formantverschiebung)

26 Quelle-Filter-Modell Quelle = Anregungssignal oder Primärsignal im Kehlkopf erzeugter Primärschall Grundfrequenz mit ihren Vielfachen (Obertöne, Harmonische) Spektrum ähnelt einer Sägezahnschwingung (Dämpfung von -12 dB / Oktave) Filter = Artikulationstrakt Veränderung der Anregungssignals durch Resonanzfrequenzen (Dämpfung bestimmter Frequenzbereiche) Filterfunktion verändert sich ständig mit der Artikulation (aber: Gesamtverstärkung von +6 dB / Oktave) Engstellen wirken als zusätzliche Rauschgeneratoren (nicht- periodische Schwingungen) an den Lippen abgestrahltes Schallsignal = Ergebnis der Faltung von Quellsignal und Filterfunktion gewöhnlich: spectral slope von –6 dB / Oktave

27 Schematische Darstellung

28 Quelle-Filter-Modell

29 Literatur zum Quelle-Filter-Modell Gunnar Fant (1960): Acoustic theory of speech production Gerold Ungeheuer (1962): Elemente einer akustischen Theorie der Vokalartikulation

30 Formanten sind Energiemaxima im Spektrum entstehen aufgrund der Resonanzeigenschaften des Artikulationstraktes abhängig von Größe und Form des Artikulationstraktes sind unabhängig von der Grundfrequenz kennzeichnend für Vokale sind der 1. und 2. Formant bestimmen die Klangfarbe und damit den Vokal sind am stärksten variabel abhängig von Kieferöffnung (F1) und Artikulationsstelle (vorn-hinten, F2) Bandbreite Mittenfrequenz wird als Formantfrequenz angegeben

31 Röhrenmodell Modellierung des Vokaltrakts aus Rohrstücken mit verschiedenen Durchmessern

32 vereinfachtes Röhrenmodell Annahme: gesamter Vokaltrakt ist eine homogene Röhre von 17cm Länge Durchmesser ist relativ gering zur Länge gleichbleibender Querschnitt Glottis = schallhartes, geschlossenes Ende totale Reflexion Lippen = offenes Ende

33 Stehende Wellen entstehen durch Überlagerung von 2 gegenläufigen Wellen (gleiche f, gleiche A) aus 2 Quellen durch Reflexion einer Welle an einem Hindernis Beispiel: einseitig geschlossenes Rohr geschlossene Seite ist Hindernis Reflexion Anwendung: Musikinstrumente Vermeidung: Konzertsaal

34 Berechnung des 1. Formanten des schwa-Lautes (im vereinfachten Röhrenmodell) = 1. Eigenfreuenz (Resonanz, stehende Welle) des Rohres bei ¼ der Wellenlänge f = c / λ = 340 m/s : (17cm * 4) = 500 Hz

35 2. Formant = 2. Eigenfreuenz (Resonanz, stehende Welle) des Rohres bei ¾ der Wellenlänge f = c / λ = 340 m/s : (17cm * 4/3) = 1500 Hz

36 Rohr mit stehender Welle

37 3. Formant sowie alle weiteren = 3. Eigenfreuenz (Resonanz, stehende Welle) des Rohres bei 5/4 der Wellenlänge F3 = c / λ = 340 m/s : (17cm * 4/5) = 2500 Hz F4 = c / λ = 340 m/s : (17cm * 4/7) = 3500 Hz F5 = c / λ = 340 m/s : (17cm * 4/9) = 4500 Hz...

38 Dynamische Querschnittsveränderungen Resonanzfrequenzen des nicht querschnittsneutralen Artikulationstraktes lassen sich nicht wie beim neutralen Rohr veranschaulichen beim Sprechen: dynamische Veränderungen des Querschnitts beeinflussen die Frequenzen der Resonanzen Verengung an den Lippen oder an der Glottis: Absenkung der Frequenzen

39 Formantverschiebung (Perturbation Model)

40 Spektrale Eigenschaften: Vokale Formanten Einfluss Kieferöffnung auf 1. Formanten: große Öffnung hoher F1z.B. / a / kleine Öffnung niedriger F1z.B. / i / Einfluss Artikulationsstelle auf den 2. Formanten: vorn an den Lippen hoher F2z.B. / i / hinten am Rachen niedriger F2z.B. / u /

41 Sonagramme i, u, a

42 Zusammenhang zwischen artikulatorischen und akustischen Eigenschaften der Vokale

43 Spektrale Eigenschaften: Frikative

44 Spektrale Eigenschaften: Plosive

45 Spektrale Eigenschaften: Nasale

46 Überlagerung von Sinuswellen Überlagerund von Sinustönen verschiedener Frequenz Addition der Einzeltöne = komplexes Signal Einfluss der Phasenlage

47 Spektralanalyse Grundlage: jedes beliebige komplexe Signal kann in Komponenten zerlegt werden, die nur aus Sinusschwingungen bestehen Summe der Sinusanteil = Gesamtsignal Fourier-Analyse: = schrittweises Abtasten des Signals nach Komponentfrequenzen Vorgehen: 1. Fensterung 2. syst. Vergleich mit Sinusschwingungen der Frequenzen, die in das Fenster passen Abhängigkeit von Frequenz- und Zeitauflösung Ergebnis: Kurz- oder Langzeitspektrum

48 Spektrogramm Aneinanderreihung vieler Kurzzeitspektren zusätzlich zeitliche Dimension Darstellung quasi-dreidimensional (oder seltener als Wasserfallspektrogramm = perspektivisch) dazu notwendig: viele Spektralanalysen in kurzen, sich leicht überlappenden Zeitintervallen Fensterung

49 Fensterung notwendig, weil das Signal (normalerweise) nicht periodisch ist, aber nur periodische Signale per Fourieranalyse in ihre Komponenten zerlegt werden können Fensterung = zeitliche Aufteilung des Signals in gleich große Abschnitte, von denen jeder als periodisch angesehen wird Analyse wird für jedes Fenster durchgeführt, sodass für jeden Abschnitt als Ergebnis ein Spektrum vorliegt Fensterbreite = zeitliche Auflösung bestimmt die Frequenzauflösung (indirekt proportional) nicht frei wählbar muss Zweierpotenz sein an den Rändern des Fensters kommt es zu Störungen

50 Fensterfunktionen Arten Rechteck Dreieck Hamming Hanning Blackman Weitere Kriterien Symmetrie Breite der Hauptkeule (möglichst schmal) Anzahl und Amplituden der Nebenkeulen (mögl. niedrige Ampl.) Maximaler Abtastfehler

51 Bild Fenstertypen

52 Grundfrequenzanalyse

53 Auslenkung Geschwindigkeit Beschleunigung (Schnelle) Schalldruck)


Herunterladen ppt "Inhalt Grundlagen, Begriffe Signal, System, Frequenz, Amplitude, Phase, Spektrum Abtastung, Quantisierung Akustische Modelle der Sprachproduktion Röhrenmodell."

Ähnliche Präsentationen


Google-Anzeigen