Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Modelle der auditorischen Verarbeitung: Perzeption und evozierte Potenziale Torsten Dau AG Medizinische Physik Carl von Ossietzky Universität Oldenburg.

Ähnliche Präsentationen


Präsentation zum Thema: "Modelle der auditorischen Verarbeitung: Perzeption und evozierte Potenziale Torsten Dau AG Medizinische Physik Carl von Ossietzky Universität Oldenburg."—  Präsentation transkript:

1

2 Modelle der auditorischen Verarbeitung: Perzeption und evozierte Potenziale Torsten Dau AG Medizinische Physik Carl von Ossietzky Universität Oldenburg

3 Informationsverarbeitendes System Gehör Hören ist essenziell für Sprachentwicklung und Kommunikation! Schall Codierung Verarbeitung Integration Andere Sinnes- systeme Verhalten/ Antwort/ Reaktion Erfahrung Herausforderungen: -Verständnis der zugrundeliegenden Prozesse. -Modellierung der “effektiven” Signalverarbeitung. -Nutzung für technische Anwendungen.

4 Überblick Aufbau des Hörsystems: Physiologie und Anatomie. Signalverarbeitung in der Cochlea. Codierung von Amplitudenmodulationen im Gehör. Konsequenzen für technische Anwendungen und klinische Diagnostik.  „peripher”  „zentral”

5 Das Ohr aus „medizinischer Sicht”

6 Die Cochlea Scala tympani Scala media Scala vestibuli Basilarmembran Trommelfell Hammer Amboß Steigbügel Cochlea Rundes Fenster Ovales Fenster Helicotrema Scala vestibuli Steigbügel Wanderwelle Basilarmembran Scala tympani Rundes Fenster

7 Neuronale Stationen bis zum Cortex Inferior Colliculus Auditory Cortex

8 Das Gehör aus „physikalischer Sicht” Dau et al. (1997) (J. Acoust. Soc. Am.) Einhüllenden- extraktion Dynamik- kompression Zeitliche Kontrastierung Frequenz-Orts- Abbildung Modulationsfrequenz- Orts-Abbildung Auflösungsgrenze Verarbeitung “gehörgerecht”? 

9 Frequenz-Orts-Transformation in der Cochlea Neuronale Aktivität f Schallsignal Gehirn Tone Auditory Filter Noise Power Frequency Cochlea wirkt wie akustisches Prisma „Cochleäre Filter” Bandpass-Filterbank Filterbandbreite beim Menschen indirekt messbar   Maskierungs- experimente

10 Amplitudengang wurde oft untersucht: Fletcher (1940), Zwicker et al. (1957), Plomp (1964), Patterson (1974). Phasengang wurde bisher wenig untersucht: (i) Gehör galt als phaseninsensitiv (Helmholtz). (ii) “Power spectrum model” erklärt viele Phänomene. Gehör ist zwar sensitiv für relative Phasenlage zwischen spekralen Komponenten. Dennoch wurde lange angenommen, daß der Einfluß des Gehörs auf Stimulusphase vernachlässigbar ist. Phasenantwort psychoakustisch messbar? Absolute Phase  und Gruppenlaufzeit nicht erfassbar, aber Phasenkrümmung: Cochleäre Transformation

11 Sine phase (m 0 ) Schroeder negative (m - ) Schroeder positive (m + ) Tonkomplex-Maskierer m+m_m+m_  Energie-Detektor Modell versagt Frequency (Hz) Amplitude Schroeder (1970): Fundamental Frequency (Hz) m+m+ m-m- m0m0 Masked Threshold (dB) 20 dB Kohlrausch und Sander (1995)

12 Schroeder-Maskierer haben konstante Sweeprate (konstante Phasen- Krümmung): Erklärungsansatz BM Stimulus BM- Filterung Hypothese: Schwellenminimum, falls: Amplitude Zeit Amplitude (bei 1 kHz)

13 Schätzung der Phasenkrümmung als Funktion von CF Variation der Sweeprate: Signal: 125, 250, 500, 1000 Hz Maskierer: n 1 = 0.4f s ; n max = 1.6f s f 0 = 0.1f s ; N = 13  keine Dispersion bei tiefen Frequenzen m - - Masker C Value Hz 250 Hz 500 Hz 1000 Hz m + - Masker (f s = 1000 Hz) m 0 - Masker Oxenham und Dau (2001) (J. Acoust. Soc. Am.) C Value Signal threshold (dB SPL) 

14 Schätzung der Phasenkrümmung der auditorischen Filter  Etwa konstante relative Skalierung für  Abweichung von relativer Skalierung für  Phasengang von Filtern existierender Modelle unrealistisch. Oxenham und Dau (2001) (J. Acoust. Soc. Am.)

15 Korrelation zur Physiologie  Räumliche Dispersion: (Wanderwelle) 4 kHz 250 Hz Übertragung an festem Ort x 0 (als Funktion der Frequenz  =f/CF) Shera (2001)  Frequenz-Dispersion Übertragung für feste Frequenz f (als Funktion des Ortes)  Impulsantwort: upward chirp Zeit Time Amplitude t1t1 t2t2 Basis Apex x

16 Woher kommt die Wanderwelle? - Direkte Konsequenz aus den mechanischen Eigenschaften der Basilarmembran im umgebenden Medium - Räumliche Änderung (“Gradient”) der Steifigkeit der Basilarmembran Mechanisches Ersatzschaltbild Elektrisches Ersatzschaltbild + - Apex Basis I U - Egbert de Boer (1980) entwickelt “Transmission-Line” Modell der Basilarmembran und berechnet Wanderwellenausbreitung

17 Potenzialamplitude wesentlich abhängig von: - Anzahl der angeregten Neurone - Synchronisation der Entladungen Evozierte Potenziale = Summation von Reizantworten vieler Neurone, abgeleitet im „Fernfeld” an der Schädeloberfläche. Konsequenzen der cochleären Dispersion für akustisch evozierte Potenziale Picton et al. (1974) Klassisches Click-evoziertes Potenzial Click kann nicht optimal sein!

18 Ausgleich der Laufzeitunterschiede -Clickreiz nicht optimal um hohe Synchronisation zu erreichen. -Mit Hilfe des de Boer-Modells (“exponential model”) lässt sich „vorverzerrter” Stimulus berechnen, der die Laufzeitunterschiede ausgleicht. ClickChirp Basis Apex Dau et al. (2000) (J. Acoust. Soc. Am.) Chirp-Reiz

19  In Cochlea erzielte „optimale” Synchronisation durch den Chirp führt auch zu erhöhter Synchronisation im Hirnstamm (Welle V). Click- und chirp-evozierte Potenziale Chirp Click I III V I V Dau et al. (2000) (J. Acoust. Soc. Am.)

20 Up- versus down-chirp Zeit Frequenz Dau et al. (2000) (J. Acoust. Soc. Am.) rising

21 Modellierung von evozierten Potenzialen? Welche Population generiert welchen Potenzialpeak? Wie ist die Beziehung zwischen Hirnstammantworten und cochleärer Vorverarbeitung? Generatoren? ? s (t)

22 Potential produced by k th population 2) Potential produced by one cell in that population Number of cells in the population 4) Compound instantaneous discharge rate u i (t)=unitary response r i (t)=instantaneous discharge rate Potenzialgenerierung 1) 3)

23 “Unitary response” im Modell: drei einzelne Antworten, die die Generatoren für die Wellen I, III, V repräsentieren. Form der peaks basiert auf physiologischen Daten. Annahmen im Modell: „Impulsantworten” der beteiligten Generatoren -Form der “unitary response” unabhängig von CF. -“Template” unabhängig vom Stimulus und Pegel.

24 Nichtlineares AN Modell von Heinz et al. (2001): Neuronale Erregungsfunktion Heinz et al. (2001)  Berechnet stimulusabhängige Feuerrate r(t) als Funktion von CF.

25 Generatoren der Potenzialpeaks Wave I Wave III Wave V + Wave V -

26 Modellierung von evozierten Potenzialen Berechnung der summierten synchronisierten Neuronenaktivität, basierend auf realistischem Cochlea-Modell. Mittelohrfilterung Summierte neuronale Aktivität Faltung mit “Unitary Response” BM Bandpassfiltering (mit Feedback) IHZ-Transduction Adaptation IHZ-AN Synapse + AN-Model Heinz et al. (2001) Idee: Mittlere Feuerrate Internes Rauschen + Evoziertes Potenzial Dau (2002) (J. Acoust. Soc. Am., subm.)

27 Vergleich von Simulation und Messung Dau (2002) (J. Acoust. Soc. Am., subm.) ClickChirp Model Data Model Data

28 Beispiel für komplexe Stimulation Dau (2002) (J. Acoust. Soc. Am., subm.) DataModel

29 Interpretation/Anwendungen Verständnis der Verarbeitung in der Cochlea fundamental für die Interpretation der (frühen) Potenzialmuster. Modellierung erlaubt Vorhersage für beliebige Reize bei beliebigen Pegeln:  Aussagen über Frequenzspezifizität von Antworten möglich.  Aussagen für beliebigen angenommenen Hörverlust möglich. Antwort auf tieffrequente Töne (z.B. 300 Hz) repräsentiert Aktivität von Neuronen, die auf höhere Frequenzen (> 1.2 kHz) abgestimmt sind. Wichtiges Hilfsmittel im Bereich der klinischen Diagnostik!

30 Das Gehör aus „physikalischer Sicht” Dau et al. (1997) (J. Acoust. Soc. Am.) Einhüllenden- extraktion Dynamik- kompression Zeitliche Kontrastierung Frequenz-Orts- Abbildung Modulationsfrequenz- Analyse Auflösungsgrenze

31 Signalverarbeitung hinter der Cochlea Hören ist mehr als nur cochleäre Verarbeitung! Bisher „nur” Zerlegung in Frequenzbänder durch Cochlea und Umwandlung in neuronale Aktivitätsmuster im auditorischen Nerven. Wichtige Informationen sind auch in zeitlicher „Grobstruktur” enthalten: Sprache, Musik, Umweltgeräusche durch Modulationen gekennzeichnet.

32 Extraktion der Einhüllenden in den Haarzellen In Out + f 1 kHz Modellierung: Pickles (1988) Feinstruktur wird abgebildet Einhüllende wird abgebildet  Einhüllende Gleichrichtung Tiefpass-Filterung

33 Wie wird die Einhüllende weiterverarbeitet? Wie überträgt das Gehör Modulationen? Wie empfindlich ist das Gehör für Modulationen? „Einfachstes” Experiment: Modulationsdetektion mit Rauschträger Modulationstransferfunktion  Tiefpass-Charakteristik („Trägheit“) des Gehörs  f = 6000 Hz f gr = 64 Hz “leicht” “schwierig” Viemeister (1979)

34 Einhüllenden-Detektor Modell (Viemeister, 1979) Problem: Modell „funktioniert” nur bei Breitbandrauschen! f gr = 64 Hz predetection filtering halfwave rectification lowpass filtering decision device

35 Messdaten für verschiedene Bandbreiten Neues Erklärungs- konzept notwendig!  Viemeister-Modell versagt Tiefpass-Verhalten gilt nicht allgemein!   f = 3 Hz  f = 30 Hz  f = 300 Hz  f = 3 Hz  f = 30 Hz  f = 300 Hz Modulation frequency m at threshold (dB) Zeit (s) Amplitude Zeit (s) Amplitude Dau et al. (1997) (J. Acoust. Soc. Am.)

36 Modulationsmaskierung Analogie: Cochleäre Verarbeitung „Zentrale” Verarbeitung Frequenz-Zerlegung  Modulationsfrequenz-Zerlegung Prinzip: Tonotopie  Prinzip: Periodotopie  Modulations- filterbank Psychoakustische Maskierungsmuster signal masker Ewert und Dau (2000) (J. Acoust. Soc. Am.)  Konstante Güte Q der Filter

37 Modulationsfilterbank-Modell Dau et al. (1997) (J. Acoust. Soc. Am.)

38 Experiment und Simulation Modell erlaubt Nachbildung für breitbandige („klassische”) und schmalbandige Signale. Tiefpass-Charakteristik durch logarithmische Skalierung:   3dB-Anstieg pro Oktave Dau et al. (1997a,b) (J. Acoust. Soc. Am.)  f = 30 Hz  f = 3 Hz  f = 300 Hz m at threshold (dB) Modulation frequency  f = 3 Hz  f = 30 Hz  f = 300 Hz

39 Wiener-Chintchin Theorem: Lawson & Uhlen- beck (1950) Modulationsspektrum von Gauß-Rauschen Reelles Signal: Hilbert Einhüllende: Analyt. Signal Mod.-Spektrum: Gauß- Rauschen Spektrum Mod.-Spektrum Hilbert-Transformation mit

40 “Envelope power spectrum model”  f = 30 Hz  f = 300 Hz  f = 3 Hz Dau et al. (1999) (J. Acoust. Soc. Am.) Träger-Modulationsspektrum Modulationsfilter- Übertragungsfunktion Einhüllendenfrequenz

41 Physiologische Modulationsfilter Korrelation unklar: - Frequenzselektivität größer in physiologischen Ableitungen - Biologische Realisation der Periodizitätsanalyse? Hirnstamm: Langner und Schreiner (1988) Kortex: Schulze et al. (2002)

42 Objektbildung

43 Beispiel: Interferenzen bei der Modulationswahrnehmung (MDI = Modulation detection interference) Auditorische Objektbildung Yost et al. (1989) Signal Signal ohne Maskierer Signal Interferenz (MDI) Maskierer Zeit Frequenz Zeit  „Interferenz-Effekt”: Modulationen beeinflussen sich gegenseitig  Klassisches Frequenzgruppenkonzept versagt: Wechselwirkung über Frequenzgruppen hinweg

44 Original-Perzeptionsmodell Unabhängige Verarbeitung in allen Frequenzgruppen  keine Interferenz  Modell unrealistisch

45 Erweitertes Verarbeitungsmodell Frequenzgruppen- übergreifende Integration durch gemeinsame Filterbank  Modell realistisch? Dau und Verhey (1999)

46 Oxenham und Dau (JASA, 2001) Interferenzeffekte (MDI) gekoppelt mit auditorischer Objektbildung. Maskierer Interferenzen bei der Modulationswahrnehmung (MDI = Modulation detection interference) Auditorische Objektbildung Signal Maskierer Zeit Frequenz Zeit Signal Zeit Signal Signal ohne Maskierer Signal Klassisches MDI Maskierer Zeit Frequenz Zeit Signal Aufhebung von MDI Maskierer Zeit Aufhebung der Interferenz durch „sequential streaming”. Modell: „Hart verdrahtete” Integration macht keinen Sinn. Oxenham and Dau (2001c) J. Acoust. Soc. Am.

47 Modellierung auditorischer Objektbildung Prozesse bei frequenzgruppenübergreifender Interaktion sind komplex. Stärke der Interferenz in der Wahrnehmung abhängig von objekt- bildenden Parametern wie: Synchronizität, Harmonizität, Tonhöhe, Räumliche Position,... „Top-down” Prozesse in der Modellierung notwendig (zusätzlich zu den bisher angenommenen „bottom-up” Prozessen). Modellierung schwierig, aber wichtig für Nachbildung in realistischer akustischer Umgebung. Steht noch am Anfang.

48 Technische Anwendungen von Gehörmodellen Hörgeräte Signalkodierung (z.B. MP3- Kodierung, Handy...) Signalqualitäts-Bewertung (z.B. Mobiltelefon, Hörgerät,...) Sprach- und Mustererkennung Hörgeräte Modell Codiertes Signal Qualitäts- Maß Original- Signal Modell Erkenner Signal Coder Modell Signal Decoder Modell (NH) Modell (SH) Modifi- kation Signal

49 Anwendungen der Modelle in klinischer Diagnostik? Perzeptionsmodell : Evozierte Potenziale : -Möglichkeiten und Grenzen eines „objektiven“ Nachweises von Schwerhörigkeit. -Verständnis der Entstehungsmechanismen und Lokalisation der Generatoren. -Neuronale Korrelate von kognitiven Leistungen? -Besseres Verständnis von Schwerhörigkeit. Sind die beobachteten Eigenschaften gekoppelt oder unabhängig? Erhöhte Schwellen Recruitment Schlechtere Frequenzauflösung Gestörtes binaurales Hören Schlechtere Zeit- auflösung ?

50 Signalverarbeitung im Gehör: „Hierarchische“ Vorgehensweise (peripher  zentral). Neuronale Kodierungsprinzipien und „effektive“ Modellierung. Zusammenfassung (I) „Cochleäre Transformation“: -Schätzung des Phasengangs der peripheren Filter durch Detektions- experimente  kritischer Test für Cochlea-Modelle. -Inhomogene mechanische Eigenschaften der Basilarmembran Ursache der räumlichen Dispersion  Wanderwelle. -Ausgleich der cochleären Laufzeitunterschiede führt auf Chirpreiz.  Optimaler Reiz zur Auslösung von Hirnstammantworten. Modulationsverarbeitung: -Konzept der „Periodotopie“ zusätzlich zur Tonotopie. -Modulationsfilterbank-Analyse in jedem Frequenzkanal erforderlich. -Mehrdimensionale interne Repräsentation auf zentraler Verarbeitungsstufe.

51 Auditorische Objektbildung: -Klassisches Konzept „unabhängiger Beobachtungen“ beschränkt. -Interferenzeffekte in der Wahrnehmung (Beispiel MDI). -Stärke der Interferenz abhängig von objektbildenden Parametern. -Modellierung schwierig. Top-down Prozesse notwendig. Zusammenfassung (II) Anwendungen: -Objektive Qualitätbewertung, Sprach- und Mustererkennung, Signal- kodierung, digitale Hörgeräte. -Klinische Diagnostik: Besseres Verständnis von Schwerhörigkeit. Neuronale Grundlagen einfacher kognitiver Leistungen?

52


Herunterladen ppt "Modelle der auditorischen Verarbeitung: Perzeption und evozierte Potenziale Torsten Dau AG Medizinische Physik Carl von Ossietzky Universität Oldenburg."

Ähnliche Präsentationen


Google-Anzeigen