Präsentation herunterladen
Veröffentlicht von:Wilhelm Anspach Geändert vor über 10 Jahren
1
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, Stephan Lehmann,
2
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
3
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
4
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen
5
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei
6
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen stimmhafter Laut
7
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Laut stimmloser Laut
8
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut
9
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n)
10
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz
11
Luft kommt aus den Lungen
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz Grundfrequenz 50 bis 400 Hz
12
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
13
Abtastung mit 8 kHz zulässig
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz zulässig stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
14
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
15
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
16
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
17
Luftstrom aus der Lunge
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Stimmbänder Rachenraum H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G Luftstrom aus der Lunge
18
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
19
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Parameter ändern sich beim Sprechen Modell mit einem festen Parametersatz nur zur Beschreibung sehr kurzer Sprachstücke geeignet ca. 20 ms
20
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
21
8000 samples/s x 8 Bit/sample = 64 kBit/s
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz 8 Bit/sample 8000 samples/s x 8 Bit/sample = 64 kBit/s
22
Ein Satz Parameter beschreibt nur 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms
23
Ein Satz Parameter beschreibt nur 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms
24
Ein Satz Parameter beschreibt nur 20 ms
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms 8 Bit/sample 1280 Bit pro 20 ms
25
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
26
Frequenzbereich: 800 bis 1600 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Stimmhafte Laute: hohe Energie weniger Nulldurchgänge da Frequenzbereich niedriger Stimmlose Laute: niedrige Energie Viele Nulldurchgänge Frequenzbereich: 800 bis 1600 Hz Frequenzbereich: 2400 bis 3200 Hz
27
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 598 Nulldurchgänge: 83
28
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: Nulldurchgänge: 14
29
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 2690 Nulldurchgänge 8
30
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie 4677 Nulldurchgänge 102
31
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
32
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Die Aufgaben des Octave- Skripts detect.m Sprachsignal einlesen und in 160 samples lange frames aufteilen frame an den dsPIC senden LPC- Parameter vom dsPIC empfangen Mittels empfangenem Gain und Pitch Eingangssignal erzeugen Eingangssignal durch das Filter modulieren lassen Punkt 2-5 mit allen frames wiederholen Alle so neu erzeugten frames zusammenfügen und in Wave- Datei abspeichern Kompression durch den dsPIC
33
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen Autokorrelation LevinsonDurbin AMDF getPitch findMin
34
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation Octave Pausenerkennung LevinsonDurbin ak AMDF getPitch findMin
35
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Gleichungssystem zur Bestimmung der Filterkoeffizienten mit
36
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
37
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
38
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
39
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
40
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
41
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
42
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
43
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
44
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch= pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
45
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch= pitch=T Zurücksenden von Koeffizienten, Gain, Pitch Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
46
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
47
Kompression Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Kompression 12 Werte (Koeffs, Gain, Pitch) statt 160 Parameterkompression 160/12 = 13,3 ABER: Parameter haben andere Wertebereiche Gleitkommazahlen für LPC-Parameter haben 32 Bit Samples des Signals 8 Bit 1280Bit/384 Bit Kompression 3,3
48
Optimierung Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierung Durch geeignete Kodierung der Parameter runter bis 48 Bit mgl -> k=26,6
49
Optimierungsmöglichkeiten
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierungsmöglichkeiten Verfahren funktioniert, hat aber Schwächen: Qualität Laufzeit Also: Andere Koeffizientenverfahren Weitere Sicherheitsmechanismen Erweiterungen z.B. CELP (Optimierung über anderes Filtereingangssignal)
50
Modell zur Spracherzeugung Speicherplatz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
51
Beispiel Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Beispiel
52
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC „Grab every dish of sugar.“
53
Vielen Dank für die Aufmerksamkeit!
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Vielen Dank für die Aufmerksamkeit!
Ähnliche Präsentationen
© 2024 SlidePlayer.org Inc.
All rights reserved.