Präsentation herunterladen
Die Präsentation wird geladen. Bitte warten
Veröffentlicht von:Armin Stuller Geändert vor über 11 Jahren
2
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at Masking, Maths, Marseille & More - An introduction to the phase vocoder, the phase, psychoacoustic masking and frame multipliers (an extension of the talk given at the HASSIP minischool 2003 in Marseille and at the LMA, CRNS 2004) Peter Balazs Acoustics Research Institute, Austrian Academy of Science, Vienna - http://www.kfs.oeaw.ac.at - Peter.Balazs@oeaw.ac.at
3
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at Phase Vocoder Phase in STFT Masking Frame Multiplier CONTENT
4
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at SHORT TIME FOURIER TRANSFORMATION The phase vocoder is an algorithm whose first part of analysis is just the discrete STFT. Short Time Fourier transformation, STFT
5
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at INTERPRETATION OF THE PHASE VOCODER (STFT) Fourier-transform Windowed signal mathematically equivalent Filterbank A channel of the filterbank Gabor projection Shifted atoms
6
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at Uncertainty: FROM FOURIER TO STFT Non-uniqueness:
7
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at overlap add oscillator bank projection on dual atoms SYNTHESIS REDUNDANCY STFT PERCEPTUAL REDUNDANCY masking Basis or frame SYNTHESIS AND REDUNDANCY Gabor frame :
8
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at PHASE VOCODER Low pass filter Phase calculation Filterbank A channel of the filterbank
9
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at AUDITORY PERCEPTION In the human ear the sound wave excitates the basilar membrane and activates the nerve cells. Nearer to the window they react to high, farther away to low frequencies. This correlation between frequency and point on the membrane is called tonotopy. The human ear
10
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at AUDITORY PERCEPTION Bark :
11
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at AUDITORY MASKING Spectrum and relevance threshold Masking : the presence of one stimulus, the masker, decreases the response to another stimulus, the target. Thresholding = Gabor Multiplier
12
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at http://www.mmk.ei.tum.de/~tal/demos/demos_content.html Psychoakustik (Zwicker) - Examples
13
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at IMPLEMENTATION OF MASKING FILTER IN ST X output signal Bark scale transformationspreading function convolution inverse bark scale transformation and compensation power spectrum [dB/Hz] power spectrum [dB/Bark] auditory filter threshold spectrum [dB/Bark] threshold spectrum [dB/Hz] analysis section of the phase vocoder synthesis section of the phase vocoder phase spectrum offset level [dB] filter: remove spectral components lower than threshold filtered power spectrum [dB/Hz] input signal For the analysis and re- synthesis the atoms PVANAand PVSYN are used. IRRECKEL: Module for computation of relevance threshold and filtering
14
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at IMPLEMENTATION OF MASKING FILTER IN ST X Original
15
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at IMPLEMENTATION OF MASKING FILTER IN ST X Relevant
16
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at IMPLEMENTATION OF MASKING FILTER IN ST X Irrelevant
17
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at APPLICATIONS Sound / Data Compression : MP3 Sound Design Background – Foreground Separation: over-masking Contrast Increase
18
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at CURRENT IMPROVEMENT / DEVELOPMENT Improvements of the current algorithms. Newer psychoacoustical knowledge Description of hearing and masking in the context of Gabor or wavelets Time-Frequency Masking Eigenfunctions
19
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TEMPORAL MASKING
20
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING Acoustics Research Institute, Austrian Academy of Science LMA, CNRS Marseille LATP, CMI, Marseille
21
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING f t A C B D Laback / Balazs:
22
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING
23
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING Laback / Balazs: f t A
24
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING Laback / Balazs: f t A
25
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING Laback / Balazs: f t A
26
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at TIME FREQUENCY MASKING Basic: Use simple modell for simultaneous and temporal masking Test Use excitation pattern (Heijden) Extended: Use newer psychoacoustical knowledge (Laback) Use algorithm to speparate signal in tonal, transient and noise parts (Jaillet) Test Use ST X spreading function
27
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at FILTER Thresholding: Gabor Multiplier: irregular grid (bark) Time Frequency localization operator (continuous) Wavelet Multiplier ? Multiple Gabor Extension Multiplier ? (Or something completely different:) Auditory Filter Multiplier ? Gamma-tone Filter Multiplier? Spectrum and relevance threshold
28
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at FRAME MULTIPLIER Frame Frame Multiplier:
29
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at FRAME MULTIPLIER
30
Institut für Schallforschung der Österreichischen Akademie der Wissenschaften: A-1010 Wien; Liebiggasse 5. Tel. +43 1/4277-29500; Fax +43 1/4277-9296; email: xxl@kfs.oeaw.ac.at; http://www.kfs.oeaw.ac.at REFERENCES: [1] S.S. Abeyseker, K.P. Padhi et al, Investigation Of Different Freqeuncy Estimation Techniques Using The Phase Vocoder, Circuits and Systems, 2001. ISCAS 2001. The 2001 IEEE International Symposium on, Volume: 2,(2001) [2] P.Balazs, H. Waubke, W.A. Deutsch, Phasenanalyse mit akustischen Anwendungsbeispielen, Proceedings DAGA 2003 - Fortschritte der Akustik, Aachen (2003) [3] O. Christensen, An Introduction To Frames And Riesz Bases, Birkhäuser Boston (2003) [4] W.A. Deutsch, A. Noll, Simulation auditorischer Signaltrennung in komplexen musikalischen Signalen durch Übermaskierung, Fortschritte der Akustik 'DAGA'93 (1993) [5] M. Dolson, The Phase Vocoder: A Tutorial, Computer Musical Journal, Vol. 10. No. 4 (1986) [6] G. Eckel, Ein Modell der Mehrfachverdeckung für die Analyse musikalischer Schallsignale, PhD Thesis, Universität Wien (1989) [7] H. Fastl, Beschreibung dynamischer Hörempfindungen anhand von Mithörschwellen-Muster, HochschulVerlag Freiburg (1982) [8] H.G. Feichtinger, T. Stromer, Gabor Analysis and Algorithms, Theory and Applications, Birkhäuser Boston (1998) [9] H. G. Feichtinger, T. Strohmer, Advances in Gabor Analysis, Birkhäuser Bosten (2003) [10] S. A. Gelfand, Essentials of audiology, Thieme New York. (1997) [11] K. Gröchenig, Foundations of Time-Frequency Analysis, Birkhäuser Boston (2001) [12] B. Laback, Effekte der Simultanmaskierung auf die Musikperzeption bei sensorineuralen Hörschäden und ihre Anwendung für Signalverarbeitungsalgorithmen in Hörgeräten, PhD Thesis, Universität Wien (1998) [13] B. Moore, Perceptual Consequences of Cochlear Damage, Oxford Medical Publications (1995) [14] A. Noll, J. White, P. Balazs, W. A. Deutsch, ST X - Intelligent Sound Processing, Programmer's Reference, http://www.kfs.oeaw.ac.at [15] Zwicker E, Fastl H, Psychoacoustics, Springer-Verlag, Berlin, Germany, 1990
Ähnliche Präsentationen
© 2025 SlidePlayer.org Inc.
All rights reserved.