Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck.

Ähnliche Präsentationen


Präsentation zum Thema: "Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck."—  Präsentation transkript:

1

2 Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

3 MotivationMotivation Freisprechmikrofon (SNR: 4dB) Headset Mikrofon (SNR: 14dB) Anwendungen für Freisprechen im Kfz Telefonie Sprachbedienung Insassenkommunikation Für Freisprechen ist eine wirksame Geräuschunterdrückung notwendig. Folie 1Markus Buck, 14.12.2005

4 Gliederung des Vortrags Inhaltsübersicht Räumliche und zeitliche Eigenschaften von Schallfeldern Funktionsprinzip und Grundlagen des Beamforming Robustheit von adaptiven Beamformern Adaptive Selbstkalibrierung für Beamformer Kombination von mehrkanaliger Geräuschunterdrückung und akustischer Echokompensation Folie 2Markus Buck, 14.12.2005

5 Schallfelder (1) Lösungen für das freie Schallfeld 1) Ebene Welle Kreisfrequenz: Wellenzahl: Dispersionsrelation: Wellengleichung für Wechseldruck Schallgeschwindigkeit: Folie 3Markus Buck, 14.12.2005

6 Schallfelder (2) 2) Kugelwelle 6dB Abfall des Signalpegels bei Abstandsverdoppelung. Fernfeld-Näherung: für kann das Schallfeld einer Punktquelle lokal durch ein ebenes Wellenfeld angenähert werden. 3) Diffuses Schallfeld homogenes Feld isotropes Feld Überlagerung unendlich vieler untereinander unkorrelierter ebener Wellen gleicher Leistung gleichverteilt aus allen Raumrichtungen. Das Hintergrundgeräusch im fahrenden Kfz wird häufig als diffuses Schallfeld modelliert. Folie 4Markus Buck, 14.12.2005

7 Reale Schallfelder Reale Schallfelder sind sehr komplex. Anstatt der Betrachtung des gesamten Schallfeldes wird das Schallsignal nur an den Mikrofonpositionen betrachtet. Raumimpulsantwort im Kfz: Energieabklingkurve: Nachhallzeit : Abklingen der Energie um 60 dB. Folie 5Markus Buck, 14.12.2005

8 MikrofonsignaleMikrofonsignale Kreuzleistungsdichtespektrum zweier Mikrofonsignale x m (t) und x n (t): Kohärenz zweier Mikrofonsignale: Beispiel: Betragsquadrat der Kohärenz im diffuses Schallfeld für einen Mikrofonabstand von d = 5 cm. Niedrige Kohärenz bei hohen Frequenzen. Folie 6Markus Buck, 14.12.2005

9 Delay-and-Sum Beamformer Das Schallfeld wird durch Mikrofone räumlich abgetastet. Durch Verzögerung der Mikrofonsignale werden Signale, die aus der Vorzugsrichtung einfallen, phasengleich aufaddiert. Signale aus anderen Raumrichtungen überlagern sich destruktiv. + : x x x Übertragungsfunktion: Ausgangssignal: Signal als ebene Welle aus der Richtung : Folie 7Markus Buck, 14.12.2005

10 Lineares Array (1) Sonderfall: lineares Array mit äquidistanten Mikrofonpositionen Broadside-Array ( ) Endfire-Array Vorzugsrichtung: Die Übertragungsfunktion hängt neben der gewünschten Abhängikeit von stark von der Kreisfrequenz und vom Mikrofonabstand d ab: Es besteht keine Abhängigkeit von Rotationssymmetrie Folie 8Markus Buck, 14.12.2005

11 Lineares Array (2) Beispiel: Broadside Array mit M = 6 Mikrofonen mit Mikrofonabstand d = 8 cm Räumliches Aliasing tritt bei auf, d.h. in diesem Beispiel bei f = 2125 Hz. Es besteht eine Analogie zum Aliasing für zeitlich abgetastete Signale. Folie 9Markus Buck, 14.12.2005

12 Lineares Array (3) Mit den Gewichten a m kann eine räumliche Fensterfunktion realisiert werden: Rechteckfenster Tschebyscheff-Fenster Folie 10Markus Buck, 14.12.2005

13 Filter-and-Sum Beamformer (1) Vektorielle Schreibweise: Beamformer-Filter: Mikrofoneigenschaften: Schallsignale: Leistungsdichtematrix der Mikrofonsignale: Die Mikrofonsignale werden gefiltert und aufaddiert. Die Mikrofonsignale werden nicht mehr phasengleich aufaddiert. Wird auch als superdirektiver Beamformer bezeichnet, da im Vergleich zum Delay-and-Sum Beamformer höhere Gewinne erzielbar sind. + : Folie 11Markus Buck, 14.12.2005

14 Filter-and-Sum Beamformer (2) Übertragungsfunktion: Ebene Wellen aus Richtung als Anregungssignal Akustische Laufzeiten in vektorieller Notation: Die Ausrichtung der Keule wird durch die Vorzugsrichtung vorgegeben. Laufzeit-Vektor für die Vorzugsrichtung: Folie 12Markus Buck, 14.12.2005

15 Bewertung von Beamformern Suszeptibilität (Maß für Störanfälligkeit): Richtdiagramm: Direktivität (Gewinn-Maß): Folie 13Markus Buck, 14.12.2005

16 Optimaler Entwurf: MVDR-Kriterium Minimierung der Ausgangsleistung: Nebenbedingung: unverzerrte Übertragung in Vorzugsrichtung MVDR-Kriterium ("minimum variance distortionless response") Lösung: Folie 14Markus Buck, 14.12.2005

17 Adaptives Beamforming Damit sich der Beamformer auf zeitlich veränderliche Störschallfelder einstellen kann, werden die Filter des Filter-and-Sum Beamformers als adaptive FIR-Filter realisiert. Unter der Nebenbedingung einer unverzerrten Übertragung für die Vorzugsrichtung wird die Ausgangsleistung minimiert. Am gebräuchlichsten sind Verfahren auf der Basis des NLMS-Algorithmus. In praktischen Anwendungen fallen mit dem Nutzsignal korrelierte Signalanteile aus unterschiedlichen Raumrichtungen auf das Array ein. Eine Adaption der Filter während Sprache führt zu "Signal Cancellation". Zur Adaption des Beamformers ist aus diesem Grunde eine Adaptionssteuerung erforderlich, die eine Adaption der Filter während Sprachaktivität verhindert. mit Folie 15Markus Buck, 14.12.2005

18 GSC-StrukturGSC-Struktur Die Nebenbedingungen werden durch eine Blockier-Matrix umgesetzt. Damit resultieren wesentliche Vereinfachungen: Adaptive Filterung nun ohne zusätzliche Nebenbedingung. Einsparung an Rechenzeit. Ausgang eines nichtadaptiven Beamformers als Zwischenergebnis. Mehrkan. adaptives Filter Lauf- zeit ausgl. Blockier- matrix Fester Beam- former + - Nichtadaptiver Signalpfad: Unterdrückung von unkorrelierten Störungen Adaptiver Signalpfad: Unterdrückung von korrelierten Störsignalanteilen Folie 16Markus Buck, 14.12.2005

19 Wirkungsweise eines Beamformers Einsprechrichtung Kohärente Störschallquelle Fester Beamformer: Filter werden a priori entworfen Adaptiver Beamformer: datenabhängige Richtcharakteristik Richtdiagramm für ein lineares Array aus 4 Mikrofonen bei f = 1500 Hz. Als Störung liegt ein diffuses Schallfeld mit einem kohärenten Störer vor. 0 dB -10 dB -20 dB -30 dB Folie 17Markus Buck, 14.12.2005

20 HörbeispielHörbeispiel 4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Störschall aus einem Lautsprecher von der Beifahrerseite Geräuschunterdrückung > 15 dB durch adaptive räumliche Filterung Einzelmikrofon Fester Beamformer Adaptiver Beamformer Folie 18Markus Buck, 14.12.2005

21 HörbeispielHörbeispiel 4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Aufnahmesituation: Beschleunigung auf 130 km/h Folie 19Markus Buck, 14.12.2005

22 Auswirkungen von Mikrofonabweichungen Die Filtereinstellungen hängen von den Eingangsdaten ab. Mikrofontoleranzen wirken sich auf die Filter aus. Tatsächlich vorliegende Übertragungsfunktion: Nichtideale Mikrofone weichen die Nebenbedingung auf. Es ergibt sich ein Spielraum, der eine Dämpfung für die Vorzugsrichtung zulässt. Implementierte Nebenbedingung: Folie 20Markus Buck, 14.12.2005

23 Messung Mikrofonabweichungen Messung und statistische Auswertung für 47 Einzelmikrofone vom Typ AKG Q400 Mk3T Folie 21Markus Buck, 14.12.2005

24 Erhöhung der Robustheit Beschränkung der Leistungsfähigkeit, so dass der Beamformer trotz der vorliegenden Abweichungen funktioniert: Begrenzung der Suszeptibilität: Zusätzliche räumliche Nebenbedingungen "Leck"-Faktor im Adaptionsalgorithmus für Beamformer-Filter Verbesserung der Mikrofonsignaleigenschaften: Klassische Kalibrierung: spezielle Messung notwendig Mikrofonabweichungen sind aufgrund von Alterungsprozessen Aals zeitvariant zu betrachten. Adaptive Kalibrierung: Sprache als Anregungssignal Adaptionssteuerung Folie 22Markus Buck, 14.12.2005

25 Adaptive Grundeinheit zur Kalibrierung Grundeinheit für die adaptive Kalibrierung: Adaptives FIR-Filter zur Entzerrung Minimierung der Fehlersignalleistung Adaption der Koeffizienten mit dem NLMS-Algorithmus Folie 23Markus Buck, 14.12.2005

26 Adaptive Selbstkalibrierung (1) Einzelmikrofon als Bezug (A): Fester Beamformer als Bezug (C): Einzelmikrofon als Bezug (B): Fester Beamformer als Bezug (D): Folie 24Markus Buck, 14.12.2005

27 Adaptive Selbstkalibrierung (2) Rückgekoppelte Struktur (Ck): Nebenbedingung notwendig: Grundstruktur IC* ohne Signal- tzverzögerung Fester Beamformer als Bezug (C): Folie 25Markus Buck, 14.12.2005

28 GesamtsystemGesamtsystem Ein Gesamtsystem kann mit Selbstkalibrierung und Beamformer zwei adaptive Teilsysteme enthalten. ABFA+ABFC+ABFCk+ABF Wortakkuratheit87,7%88,0%88,3%88,9% Rel. Verbesserung der Wortfehlerrate 0,0%2,2%5,0%9,5% Ergebnisse bei der Spracherkennung: Folie 26Markus Buck, 14.12.2005

29 Ergebnisse aus dem praktischen Einsatz Aufnahme in einem fahrenden Fahrzeug (SNR von etwa 10 dB) Lineares Array aus 4 Cardioid- Mikrofonen mit Abständen von 5 cm (Serien-Array Mercedes E-Klasse). Gesamtsystem mit - festem Laufzeitausgleich, - adaptiver Selbstkalibration (Ck) - adaptivem Beamformer Einzelmikrofon unkalib. ABF ABF mit Selbstkal. Einzelmikrofon Folie 27Markus Buck, 14.12.2005

30 Evaluierung mit Lombard-Sprache Um signifikante Erkennraten zu ermitteln ist eine große Anzahl von Sprechern und Sprachäußerungen notwendig. Bei jeder Modifikationen des Mikrofon-Setups sind neue Sprachaufnahmen notwendig. hoher Aufwand Synthese der Audiodaten aus getrennt aufgezeichneten Sprach- und Störsignalen. Generieren eines fahrzeug- und mikrofonspezifischen Datensatzes aus einer Clean Speech Datenbank, die Lombard-Sprache enthält. Lombard- Sprache Stör- geräusch sprecherspezifische Daten fahrzeugspezifische Daten In Ruhe Mittlerer Fahrgeräuschpegel Hoher Fahrgeräuschpegel Lombard- Sprache + Folie 28Markus Buck, 14.12.2005

31 Lombard-Effekt: Sprachpegel Sprachpegel am Mund-Referenz-Punkt (MRP) Geräuschpegel am Sprecherohr Abhängigkeit des mittleren Sprachpegels vom Hintergrundgeräusch: Anstieg um ca. 0,3 dB/dB(A) Folie 29Markus Buck, 14.12.2005

32 Ergebnisse mit Lombard-Sprache Simulation verschiedener Geschwindigkeiten mit Lombard-Sprachdaten Skalierung der Sprache, abhängig vom Fahrgeräuschpegel Faltung mit im Fahrzeug gemessener Impulsantwort Addition von gemessenem Fahrgeräusch Die relative Wortfehlerrate bezieht sich auf das Einzelmikrofon bei 40 km/h. Folie 30Markus Buck, 14.12.2005

33 Kombination von Echokompensation und BF MIMO-System: N Lautsprecher und M Mikrofone : : + 1) Echokompensator vor Beamformer: M*N Echokompensationsfilter : : + + - 3) Gemeinsames Fehlersignal, GSC-Struktur: M Echokompensationsfilter Adaption ohne räumliche Nebenbedingungen. Filter für EC und BF müssen gleich lang sein. Folie 31Markus Buck, 14.12.2005 : : + - 2) Gemeinsames Fehlersignal für EC und BF: M Echokompensationsfilter

34 ZusammenfassungZusammenfassung Schallfelder Lösungen für eine adaptive Selbstkalibrierung - Analogie zur Abtastung und Filterung zeitlicher Signale - Starke Abhängigkeit des Richtdiagramms von der Frequenz und vom AMikrofonabstand Beamforming - Schallpegel einer Punktquelle fällt mit 6 dB pro Abstandsverdopplung ab - Fernfeld einer Punktquelle kann als ebenes Schallfeld angenähert werden - Diffuses Schallfeld als Modell für Fahrgeräusch im Kfz - Kalibrierung im Hintergrund während des normalen Betriebs - Das Gesamtsystem erweist sich im praktischen Einsatz als sehr robust Demonstration mit Echtzeitsystem Evaluierung mit Lombard-Sprache Kombination von Echokompensation und Beamforming Folie 32Markus Buck, 14.12.2005

35 KontaktKontakt Markus Buck Harman/Becker Automotive Systems GmbH Acoustic Signal Processing (EDA) Söflinger Str. 100 89077 Ulm Email: mbuck@harmanbecker.commbuck@harmanbecker.com Folie 34Markus Buck, 14.12.2005


Herunterladen ppt "Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck."

Ähnliche Präsentationen


Google-Anzeigen