Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz

Slides:

Advertisements

Ähnliche Präsentationen

Fast Fourier Transformation

Advertisements

Filterung der räumlichen Frequenzen

akustische Betrachtungsweise

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil3.

Robin Gruber Abschlussvortrag

Geometrie von Objektoberflächen

CME – koronaler Massenauswurf Dirk Gerbig

Genetische Algorithmen für die Variogrammanpassung

Seminar „Extrapolationsmethoden für zufällige Felder“

Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.

Modelle und Methoden der Linearen und Nichtlinearen Optimierung (Ausgewählte Methoden und Fallstudien) U N I V E R S I T Ä T H A M B U R G November 2011.

Optische Eigenschaften von Werkstoffen

Klicke Dich mit der linken Maustaste durch das Übungsprogramm! Vereinfachung von Termen Ein Übungsprogramm der IGS - Hamm/Sieg © IGS-Hamm/Sieg 2006 Dietmar.

SHURE Europe GmbH Headquarter Europe, Middle East and Africa

Vorlesung 9: Roter Faden:

WS Algorithmentheorie 02 - Polynomprodukt und Fast Fourier Transformation Prof. Dr. Th. Ottmann.

Einsatz des Level-1-Kalorimeter-Trigger Jet/Energiesummen-Moduls bei ATLAS Teststrahlmessungen am CERN.

© 2006 W. Oberschelp, G. Vossen Rechneraufbau & Rechnerstrukturen, Folie 2.1.

Vorlesung: 1 Betriebliche Informationssysteme 2003 Prof. Dr. G. Hellberg Studiengang Informatik FHDW Vorlesung: Betriebliche Informationssysteme Teil2.

PKJ 2005/1 Stefan Dissmann Rückblick auf 2005 Was zuletzt in 2005 vorgestellt wurde: Klassen mit Attributen, Methoden und Konstruktoren Referenzen auf.

Bewegte Bezugssysteme

Das Cranking Modell Drehungen senkrecht zur Symmetrieachse

AC Analyse. 2Ausgewählte Themen des analogen Schaltungsentwurfs Sprungantwort.

Physik für Mediziner, Zahnmediziner und Pharmazeuten SS

Univariate Statistik M. Kresken.

Ralf KüstersDagstuhl 2008/11/30 2 Ralf KüstersDagstuhl 2008/11/30 3.

Rechneraufbau & Rechnerstrukturen, Folie 12.1 © W. Oberschelp, G. Vossen W. Oberschelp G. Vossen Kapitel 12.

Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele

2 Distanzbasierte Sprachkommunikation für Peer-to-Peer-Spiele.

Bild 1.1 Copyright © Alfred Mertins | Signaltheorie, 2. Auflage Vieweg+Teubner PLUS Zusatzmaterialien Vieweg+Teubner Verlag | Wiesbaden.

Beschreibung der energetischen Zustände der Elektronen

Über die Firma Wir sind der einzige Händler von dem Gehörschutz der berühmten Marke SICOM in Polen. Der Gehörschutz ist im Labor Otoplastik Maier GmbH.

...ich seh´es kommen !.

§3 Allgemeine lineare Gleichungssysteme

Polynome und schnelle Fourier-Transformation

Messgrößen für Schallwellen

Messgrößen für Schallwellen

Wechselwirkung der Strahlung mit Materie

Präsentation läuft auch vollautomatisch ab … wie du möchtest

Auslegung eines Vorschubantriebes

STATISIK LV Nr.: 0028 SS Mai 2005.

Kapitel 16 Ökonometrische Modelle

MATHEMATIK UND AKUSTISCHE SIGNALVERARBEITUNG

BEAM-FORMINGBEAM-FORMING. Modell und Vorgehen Eine Welle trifft mit zeitlicher Verzögerung auf die unterschiedlichen Mikrophone eines Arrays Beamforming.

Sichern und Retten bei Arbeiten in Höhen und Tiefen

WEKA MEDIA GmbH & Co. KG Technische Hilfeleistung ENDE HILFE Folien p.de.

Regression und Kollokation

i) Projektil in Ladungsverteilung des Kerns eindringt

Absatzwirtschaft Vertriebsumfrage Düsseldorf, den

Managemententscheidungsunterstützungssysteme (Ausgewählte Methoden und Fallstudien) ( Die Thesen zur Vorlesung 3) Thema der Vorlesung Lösung der linearen.

Ein Überblick über verschiedene Verfahren

Analyseprodukte numerischer Modelle

Holger Waubke, Piotr Majdak, Michael Mihocic, Anton Noll

Schutzvermerk nach DIN 34 beachten 20/05/14 Seite 1 Grundlagen XSoft Lösung :Logische Grundschaltung IEC-Grundlagen und logische Verknüpfungen.

Vortrag von Rechtsanwältin Verena Nedden, Fachanwältin für Steuerrecht zur Veranstaltung Wege zum bedingungslosen Grundeinkommen der Piratenpartei Rhein-Hessen.

3. Schaltungsentwicklung - Beispiel Taschenlichtorgel

1 Mathematical Programming Nichtlineare Programmierung.

Fourier-Analyse und technologische Anwendungen

Inhalt Erzwungene Schwingung der Valenz-Elektronen: Kohärente Streuung

Textstrukturen 10 Gestalttheorie im Witz Metz-Göckel, Witzstrukturen, 1989.

Der Erotik Kalender 2005.

Frank Kameier - Strömungstechnik I und Messdatenerfassung Folie VL11/ Nr.1 WS14/15 Frank Kameier 11. Vorlesung Strömungstechnik.

Kommunikationstechnik B Teil 3 – Signalverarbeitung

1 Medienpädagogischer Forschungsverbund Südwest KIM-Studie 2014 Landesanstalt für Kommunikation Baden-Württemberg (LFK) Landeszentrale für Medien und Kommunikation.

Monatsbericht Ausgleichsenergiemarkt Gas – November

Spärliche Kodierung von Videos natürlicher Szenen Vortragender: Christian Fischer.

iem.kug.ac.at Konzepte für virtuelle Akustik Theoretische Betrachtungen Alois Sontacchi Institute of Electronic Music and Acoustics at the University.

Tutorial Messtechnik - Spektralanalyse, Signaltheorie -

Präsentation transkript:

Mehrkanalige Geräuschunterdrückungssysteme zum Freisprechen im Kfz 14. 12. 2005 Dr.-Ing. Markus Buck

Anwendungen für Freisprechen im Kfz Motivation Anwendungen für Freisprechen im Kfz Telefonie Sprachbedienung Insassenkommunikation Freisprechmikrofon (SNR: 4dB) Headset Mikrofon (SNR: 14dB) Für Freisprechen ist eine wirksame Geräuschunterdrückung notwendig. Folie 1 Markus Buck, 14.12.2005

Gliederung des Vortrags Inhaltsübersicht Räumliche und zeitliche Eigenschaften von Schallfeldern Funktionsprinzip und Grundlagen des „Beamforming“ Robustheit von adaptiven „Beamformern“ Adaptive Selbstkalibrierung für „Beamformer“ Kombination von mehrkanaliger Geräuschunterdrückung und akustischer Echokompensation Folie 2 Markus Buck, 14.12.2005

Wellengleichung für Wechseldruck Schallfelder (1) Wellengleichung für Wechseldruck Schallgeschwindigkeit: Lösungen für das freie Schallfeld 1) Ebene Welle Kreisfrequenz: Wellenzahl: Dispersionsrelation: Folie 3 Markus Buck, 14.12.2005

Schallfelder (2) 2) Kugelwelle 6dB Abfall des Signalpegels bei Abstandsverdoppelung. Fernfeld-Näherung: für kann das Schallfeld einer Punktquelle lokal durch ein ebenes Wellenfeld angenähert werden. 3) Diffuses Schallfeld homogenes Feld isotropes Feld Überlagerung unendlich vieler untereinander unkorrelierter ebener Wellen gleicher Leistung gleichverteilt aus allen Raumrichtungen. Das Hintergrundgeräusch im fahrenden Kfz wird häufig als diffuses Schallfeld modelliert. Folie 4 Markus Buck, 14.12.2005

Reale Schallfelder Reale Schallfelder sind sehr komplex. Anstatt der Betrachtung des gesamten Schallfeldes wird das Schallsignal nur an den Mikrofonpositionen betrachtet. Raumimpulsantwort im Kfz: Energieabklingkurve: Nachhallzeit : Abklingen der Energie um 60 dB. Folie 5 Markus Buck, 14.12.2005

Mikrofonsignale Kreuzleistungsdichtespektrum zweier Mikrofonsignale xm(t) und xn(t): Kohärenz zweier Mikrofonsignale: Beispiel: Betragsquadrat der Kohärenz im diffuses Schallfeld für einen Mikrofonabstand von d = 5 cm. Niedrige Kohärenz bei hohen Frequenzen. Folie 6 Markus Buck, 14.12.2005

Delay-and-Sum Beamformer + : : x Ausgangssignal: Das Schallfeld wird durch Mikrofone räumlich abgetastet. Durch Verzögerung der Mikrofonsignale werden Signale, die aus der Vorzugsrichtung einfallen, phasengleich aufaddiert. Signale aus anderen Raumrichtungen überlagern sich destruktiv. Signal als ebene Welle aus der Richtung : Übertragungsfunktion: Folie 7 Markus Buck, 14.12.2005

Lineares Array (1) Sonderfall: lineares Array mit äquidistanten Mikrofonpositionen Broadside-Array ( ) Endfire-Array Vorzugsrichtung: Die Übertragungsfunktion hängt neben der gewünschten Abhängikeit von q stark von der Kreisfrequenz w und vom Mikrofonabstand d ab: Es besteht keine Abhängigkeit von j Rotationssymmetrie Folie 8 Markus Buck, 14.12.2005

Lineares Array (2) Beispiel: Broadside Array mit M = 6 Mikrofonen mit Mikrofonabstand d = 8 cm Räumliches Aliasing tritt bei auf, d.h. in diesem Beispiel bei f = 2125 Hz. Es besteht eine Analogie zum Aliasing für zeitlich abgetastete Signale. Folie 9 Markus Buck, 14.12.2005

Lineares Array (3) Mit den Gewichten am kann eine räumliche Fensterfunktion realisiert werden: Rechteckfenster Tschebyscheff-Fenster Folie 10 Markus Buck, 14.12.2005

Filter-and-Sum Beamformer (1) + : : Die Mikrofonsignale werden gefiltert und aufaddiert. Die Mikrofonsignale werden nicht mehr phasengleich aufaddiert. Wird auch als superdirektiver Beamformer bezeichnet, da im Vergleich zum Delay-and-Sum Beamformer höhere Gewinne erzielbar sind. Vektorielle Schreibweise: Beamformer-Filter: Mikrofoneigenschaften: Schallsignale: Leistungsdichtematrix der Mikrofonsignale: Folie 11 Markus Buck, 14.12.2005

Filter-and-Sum Beamformer (2) Übertragungsfunktion: Ebene Wellen aus Richtung als Anregungssignal Akustische Laufzeiten in vektorieller Notation: Die Ausrichtung der Keule wird durch die Vorzugsrichtung vorgegeben. Laufzeit-Vektor für die Vorzugsrichtung: Folie 12 Markus Buck, 14.12.2005

Bewertung von Beamformern Richtdiagramm: Direktivität (Gewinn-Maß): Suszeptibilität (Maß für Störanfälligkeit): Folie 13 Markus Buck, 14.12.2005

Optimaler Entwurf: MVDR-Kriterium Minimierung der Ausgangsleistung: Nebenbedingung: unverzerrte Übertragung in Vorzugsrichtung MVDR-Kriterium ("minimum variance distortionless response") Lösung: Folie 14 Markus Buck, 14.12.2005

Adaptives Beamforming Damit sich der Beamformer auf zeitlich veränderliche Störschallfelder einstellen kann, werden die Filter des Filter-and-Sum Beamformers als adaptive FIR-Filter realisiert. Unter der Nebenbedingung einer unverzerrten Übertragung für die Vorzugsrichtung wird die Ausgangsleistung minimiert. Am gebräuchlichsten sind Verfahren auf der Basis des NLMS-Algorithmus. In praktischen Anwendungen fallen mit dem Nutzsignal korrelierte Signalanteile aus unterschiedlichen Raumrichtungen auf das Array ein. Eine Adaption der Filter während Sprache führt zu "Signal Cancellation". Zur Adaption des Beamformers ist aus diesem Grunde eine Adaptionssteuerung erforderlich, die eine Adaption der Filter während Sprachaktivität verhindert. mit Folie 15 Markus Buck, 14.12.2005

GSC-Struktur Nichtadaptiver Signalpfad: Unterdrückung von unkorrelierten Störungen Mehrkan. adaptives Filter Lauf- zeit ausgl. Blockier- matrix Fester Beam- former + - Adaptiver Signalpfad: Unterdrückung von korrelierten Störsignalanteilen Die Nebenbedingungen werden durch eine Blockier-Matrix umgesetzt. Damit resultieren wesentliche Vereinfachungen: Adaptive Filterung nun ohne zusätzliche Nebenbedingung. Einsparung an Rechenzeit. Ausgang eines nichtadaptiven Beamformers als Zwischenergebnis. Folie 16 Markus Buck, 14.12.2005

Wirkungsweise eines Beamformers Richtdiagramm für ein lineares Array aus 4 Mikrofonen bei f = 1500 Hz. Als Störung liegt ein diffuses Schallfeld mit einem kohärenten Störer vor. 0 dB -10 dB -20 dB -30 dB Einsprechrichtung Kohärente Störschallquelle Fester Beamformer: Filter werden a priori entworfen Adaptiver Beamformer: datenabhängige Richtcharakteristik Folie 17 Markus Buck, 14.12.2005

Hörbeispiel 4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Störschall aus einem Lautsprecher von der Beifahrerseite Geräuschunterdrückung > 15 dB durch adaptive räumliche Filterung Einzelmikrofon Fester Beamformer Adaptiver Beamformer Folie 18 Markus Buck, 14.12.2005

Hörbeispiel 4-Mikrofon Beamformer im Kfz (Mercedes E-Klasse) Aufnahmesituation: Beschleunigung auf 130 km/h Folie 19 Markus Buck, 14.12.2005

Auswirkungen von Mikrofonabweichungen Die Filtereinstellungen hängen von den Eingangsdaten ab. Mikrofontoleranzen wirken sich auf die Filter aus. Implementierte Nebenbedingung: Tatsächlich vorliegende Übertragungsfunktion: Nichtideale Mikrofone weichen die Nebenbedingung auf. Es ergibt sich ein Spielraum, der eine Dämpfung für die Vorzugsrichtung zulässt. Folie 20 Markus Buck, 14.12.2005

Messung Mikrofonabweichungen Messung und statistische Auswertung für 47 Einzelmikrofone vom Typ AKG Q400 Mk3T Folie 21 Markus Buck, 14.12.2005

Erhöhung der Robustheit Beschränkung der Leistungsfähigkeit, so dass der Beamformer trotz der vorliegenden Abweichungen funktioniert: Begrenzung der Suszeptibilität: Zusätzliche räumliche Nebenbedingungen "Leck"-Faktor im Adaptionsalgorithmus für Beamformer-Filter Verbesserung der Mikrofonsignaleigenschaften: Klassische Kalibrierung: spezielle Messung notwendig Mikrofonabweichungen sind aufgrund von Alterungsprozessen Aals zeitvariant zu betrachten. Adaptive Kalibrierung: Sprache als Anregungssignal Adaptionssteuerung Folie 22 Markus Buck, 14.12.2005

Adaptive Grundeinheit zur Kalibrierung Grundeinheit für die adaptive Kalibrierung: Adaptives FIR-Filter zur Entzerrung Minimierung der Fehlersignalleistung Adaption der Koeffizienten mit dem NLMS-Algorithmus Folie 23 Markus Buck, 14.12.2005

Adaptive Selbstkalibrierung (1) Einzelmikrofon als Bezug (A): Einzelmikrofon als Bezug (B): Fester Beamformer als Bezug (C): Fester Beamformer als Bezug (D): Folie 24 Markus Buck, 14.12.2005

Adaptive Selbstkalibrierung (2) Fester Beamformer als Bezug (C): Rückgekoppelte Struktur (Ck): Nebenbedingung notwendig: Grundstruktur IC* ohne Signal-tzverzögerung Folie 25 Markus Buck, 14.12.2005

Gesamtsystem Ein Gesamtsystem kann mit Selbstkalibrierung und Beamformer zwei adaptive Teilsysteme enthalten. Ergebnisse bei der Spracherkennung: ABF A+ABF C+ABF Ck+ABF Wortakkuratheit 87,7% 88,0% 88,3% 88,9% Rel. Verbesserung der Wortfehlerrate 0,0% 2,2% 5,0% 9,5% Folie 26 Markus Buck, 14.12.2005

Ergebnisse aus dem praktischen Einsatz Einzelmikrofon unkalib. ABF ABF mit Selbstkal. Einzelmikrofon Aufnahme in einem fahrenden Fahrzeug (SNR von etwa 10 dB) Lineares Array aus 4 Cardioid- Mikrofonen mit Abständen von 5 cm (Serien-Array Mercedes E-Klasse). Gesamtsystem mit - festem Laufzeitausgleich, - adaptiver Selbstkalibration (Ck) - adaptivem Beamformer Folie 27 Markus Buck, 14.12.2005

Evaluierung mit Lombard-Sprache Um signifikante Erkennraten zu ermitteln ist eine große Anzahl von Sprechern und Sprachäußerungen notwendig. Bei jeder Modifikationen des Mikrofon-Setups sind neue Sprachaufnahmen notwendig. hoher Aufwand Synthese der Audiodaten aus getrennt aufgezeichneten Sprach- und Störsignalen. Generieren eines fahrzeug- und mikrofonspezifischen Datensatzes aus einer „Clean Speech“ Datenbank, die Lombard-Sprache enthält. sprecherspezifische Daten fahrzeugspezifische Daten + Lombard- Sprache Stör-geräusch Lombard-Sprache In Ruhe Mittlerer Fahrgeräuschpegel Hoher Fahrgeräuschpegel Folie 28 Markus Buck, 14.12.2005

Lombard-Effekt: Sprachpegel Abhängigkeit des mittleren Sprachpegels vom Hintergrundgeräusch: Anstieg um ca. 0,3 dB/dB(A) Sprachpegel am Mund-Referenz-Punkt (MRP) Geräuschpegel am Sprecherohr Folie 29 Markus Buck, 14.12.2005

Ergebnisse mit Lombard-Sprache Simulation verschiedener Geschwindigkeiten mit Lombard-Sprachdaten Skalierung der Sprache, abhängig vom Fahrgeräuschpegel Faltung mit im Fahrzeug gemessener Impulsantwort Addition von gemessenem Fahrgeräusch Die relative Wortfehlerrate bezieht sich auf das Einzelmikrofon bei 40 km/h. Folie 30 Markus Buck, 14.12.2005

Kombination von Echokompensation und BF MIMO-System: N Lautsprecher und M Mikrofone : + 1) Echokompensator vor Beamformer: M*N Echokompensationsfilter : + - 2) Gemeinsames Fehlersignal für EC und BF: M Echokompensationsfilter : + - 3) Gemeinsames Fehlersignal, GSC-Struktur: M Echokompensationsfilter Adaption ohne räumliche Nebenbedingungen. Filter für EC und BF müssen gleich lang sein. Folie 31 Markus Buck, 14.12.2005

Lösungen für eine adaptive Selbstkalibrierung Zusammenfassung Schallfelder - Schallpegel einer Punktquelle fällt mit 6 dB pro Abstandsverdopplung ab - Fernfeld einer Punktquelle kann als ebenes Schallfeld angenähert werden - Diffuses Schallfeld als Modell für Fahrgeräusch im Kfz Beamforming Analogie zur Abtastung und Filterung zeitlicher Signale Starke Abhängigkeit des Richtdiagramms von der Frequenz und vom AMikrofonabstand Lösungen für eine adaptive Selbstkalibrierung - Kalibrierung im Hintergrund während des normalen Betriebs Das Gesamtsystem erweist sich im praktischen Einsatz als sehr robust Demonstration mit Echtzeitsystem Evaluierung mit Lombard-Sprache Kombination von Echokompensation und Beamforming Folie 32 Markus Buck, 14.12.2005

Kontakt Markus Buck Harman/Becker Automotive Systems GmbH Acoustic Signal Processing (EDA) Söflinger Str. 100 89077 Ulm Email: mbuck@harmanbecker.com Folie 34 Markus Buck, 14.12.2005