Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, Stephan Lehmann, IV Messdatenverarbeitung.

Ähnliche Präsentationen


Präsentation zum Thema: "Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, Stephan Lehmann, IV Messdatenverarbeitung."—  Präsentation transkript:

1

2 Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, Stephan Lehmann, IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC

3 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

4 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

5 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen

6 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei

7 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen stimmhafter Laut

8 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Lautstimmloser Laut

9 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Lautstimmloser Laut Weitere Artikulierung durch den Rachenraum

10 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Lautstimmloser Laut Weitere Artikulierung durch den Rachenraum Sprachsignal s(n)

11 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Lautstimmloser Laut Weitere Artikulierung durch den Rachenraum Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz

12 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Lautstimmloser Laut Weitere Artikulierung durch den Rachenraum Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz Grundfrequenz 50 bis 400 Hz

13 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Lautstimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz

14 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Lautstimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz Abtastung mit 8 kHz zulässig

15 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

16 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G

17 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G

18 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G Stimmbänder Rachenraum Luftstrom aus der Lunge

19 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G

20 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Parameter ändern sich beim Sprechen Modell mit einem festen Parametersatz nur zur Beschreibung sehr kurzer Sprachstücke geeignet ca. 20 ms

21 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

22 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz 8 Bit/sample 8000 samples/s x 8 Bit/sample = 64 kBit/s

23 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms

24 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 160 samples pro 20 ms 8000 samples/s

25 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 160 samples pro 20 ms 8 Bit/sample 8000 samples/s 1280 Bit pro 20 ms

26 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

27 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Stimmhafte Laute: hohe Energie weniger Nulldurchgänge da Frequenzbereich niedriger Stimmlose Laute: niedrige Energie Viele Nulldurchgänge Frequenzbereich: 800 bis 1600 Hz Frequenzbereich: 2400 bis 3200 Hz

28 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 598 Nulldurchgänge: 83

29 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: Nulldurchgänge: 14

30 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 2690 Nulldurchgänge 8

31 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie 4677 Nulldurchgänge 102

32 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

33 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Die Aufgaben des Octave- Skripts detect.m 1.Sprachsignal einlesen und in 160 samples lange frames aufteilen 2.frame an den dsPIC senden 3.LPC- Parameter vom dsPIC empfangen 4.Mittels empfangenem Gain und Pitch Eingangssignal erzeugen 5.Eingangssignal durch das Filter modulieren lassen 6.Punkt 2-5 mit allen frames wiederholen 7.Alle so neu erzeugten frames zusammenfügen und in Wave- Datei abspeichern Kompression durch den dsPIC

34 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LevinsonDurbin AMDF Autokorrelation getPitch findMin

35 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten LevinsonDurbin AMDF Autokorrelation getPitch findMin akak Pausenerkennung Octave

36 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Gleichungssystem zur Bestimmung der Filterkoeffizienten mit

37 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

38 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

39 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

40 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

41 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

42 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft LevinsonDurbin AMDF Autokorrelation getPitch findMin akak

43 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC

44 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=T LevinsonDurbin AMDF Autokorrelation getPitch findMin T akak

45 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T LevinsonDurbin AMDF Autokorrelation getPitch findMin T akak

46 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Zurücksenden von Koeffizienten, Gain, Pitch LevinsonDurbin AMDF Autokorrelation getPitch findMin T akak

47 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

48 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC 12 Werte (Koeffs, Gain, Pitch) statt 160 Parameterkompression 160/12 = 13,3 Kompression ABER: Parameter haben andere Wertebereiche Gleitkommazahlen für LPC-Parameter haben 32 Bit Samples des Signals 8 Bit 1280Bit/384 Bit Kompression 3,3

49 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierung Durch geeignete Kodierung der Parameter runter bis 48 Bit mgl -> k=26,6

50 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierungsmöglichkeiten Verfahren funktioniert, hat aber Schwächen: Qualität Laufzeit Also: Andere Koeffizientenverfahren Weitere Sicherheitsmechanismen Erweiterungen z.B. CELP (Optimierung über anderes Filtereingangssignal)

51 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel

52 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Beispiel

53 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Grab every dish of sugar.

54 IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Vielen Dank für die Aufmerksamkeit!


Herunterladen ppt "Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, Stephan Lehmann, IV Messdatenverarbeitung."

Ähnliche Präsentationen


Google-Anzeigen