Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Diana Bindrich, diana13th@yahoo.de Stephan Lehmann, uni@stephanlehmann.net
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen stimmhafter Laut
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht stimmhafter Laut stimmloser Laut
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n)
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz
Luft kommt aus den Lungen IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Luft kommt aus den Lungen strömt an den Stimmbändern vorbei Stimmbänder schwingen Stimmbänder schwingen nicht Weitere Artikulierung durch den Rachenraum stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz Grundfrequenz 50 bis 400 Hz
IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
Abtastung mit 8 kHz zulässig IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz zulässig stimmhafter Laut stimmloser Laut Sprachsignal s(n) 800 bis 1600 Hz 2400 bis 3200 Hz 50 bis 400 Hz
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
Luftstrom aus der Lunge IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Stimmbänder Rachenraum H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G Luftstrom aus der Lunge
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC H(z) Sprachsignal Rauschen Periodische Impulse Verstärkung stimmhaft stimmlos LPC- Filter Vereinfachtes Modell zur Spracherzeugung G
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Parameter ändern sich beim Sprechen Modell mit einem festen Parametersatz nur zur Beschreibung sehr kurzer Sprachstücke geeignet ca. 20 ms
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
8000 samples/s x 8 Bit/sample = 64 kBit/s IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Abtastung mit 8 kHz 8 Bit/sample 8000 samples/s x 8 Bit/sample = 64 kBit/s
Ein Satz Parameter beschreibt nur 20 ms IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms
Ein Satz Parameter beschreibt nur 20 ms IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms
Ein Satz Parameter beschreibt nur 20 ms IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Ein Satz Parameter beschreibt nur 20 ms 8000 samples/s 160 samples pro 20 ms 8 Bit/sample 1280 Bit pro 20 ms
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Frequenzbereich: 800 bis 1600 Hz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Stimmhafte Laute: hohe Energie weniger Nulldurchgänge da Frequenzbereich niedriger Stimmlose Laute: niedrige Energie Viele Nulldurchgänge Frequenzbereich: 800 bis 1600 Hz Frequenzbereich: 2400 bis 3200 Hz
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 598 Nulldurchgänge: 83
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 88844 Nulldurchgänge: 14
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie: 2690 Nulldurchgänge 8
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Energie 4677 Nulldurchgänge 102
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Die Aufgaben des Octave- Skripts detect.m Sprachsignal einlesen und in 160 samples lange frames aufteilen frame an den dsPIC senden LPC- Parameter vom dsPIC empfangen Mittels empfangenem Gain und Pitch Eingangssignal erzeugen Eingangssignal durch das Filter modulieren lassen Punkt 2-5 mit allen frames wiederholen Alle so neu erzeugten frames zusammenfügen und in Wave- Datei abspeichern Kompression durch den dsPIC
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen Autokorrelation LevinsonDurbin AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation Octave Pausenerkennung LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Gleichungssystem zur Bestimmung der Filterkoeffizienten mit
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft Autokorrelation LevinsonDurbin ak AMDF getPitch findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC hl_LPC Nulldurchgänge zählen LPC- Koeffizienten Bestimmung des Gain Entscheidung stimmlos/stimmhaft pitch=0 pitch=T Zurücksenden von Koeffizienten, Gain, Pitch Autokorrelation LevinsonDurbin ak AMDF getPitch T findMin
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Kompression Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Kompression 12 Werte (Koeffs, Gain, Pitch) statt 160 Parameterkompression 160/12 = 13,3 ABER: Parameter haben andere Wertebereiche Gleitkommazahlen für LPC-Parameter haben 32 Bit Samples des Signals 8 Bit 1280Bit/384 Bit Kompression 3,3
Optimierung Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierung Durch geeignete Kodierung der Parameter runter bis 48 Bit mgl -> k=26,6
Optimierungsmöglichkeiten IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Optimierungsmöglichkeiten Verfahren funktioniert, hat aber Schwächen: Qualität Laufzeit Also: Andere Koeffizientenverfahren Weitere Sicherheitsmechanismen Erweiterungen z.B. CELP (Optimierung über anderes Filtereingangssignal)
Modell zur Spracherzeugung Speicherplatz IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Menschliche Sprache Modell zur Spracherzeugung Speicherplatz Unterscheidung stimmhafter und stimmloser Laute Umsetzung des Modells auf dem dsPIC Optimierungsansätze Beispiel
Beispiel Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Beispiel
Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC „Grab every dish of sugar.“
Vielen Dank für die Aufmerksamkeit! IV Messdatenverarbeitung mit Wavelets – Abschlussprojekt Komprimierung von Sprachdaten mit LPC10 auf einem dsPIC Vielen Dank für die Aufmerksamkeit!