PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Matching pursuit algorithm with frame-based auditory optimized WP-dictionary for audio transient modeling

Identyfikatory
Warianty tytułu
PL
Algorytm poszukiwania dopasowującego do modelowania przejść sygnału audio z wykorzystaniem percepcyjnie zoptymalizowanego słownika opartego na pakietowej transformacji falkowej
Konferencja
Signal Processing Algorithms, Architectures, Arrangements, and Applications. 11th IEEE Signal Processing Workshop SPA 2007 ; 7.09.2007 ; Poznan, Poland
Języki publikacji
EN
Abstrakty
EN
This paper presents the method of matching pursuit (MP) with frame based psychoacoustic optimized wavelet packet (WP) dictionary for selecting most relevant components to be used in compact representation transient part of signal. The wavelet dictionary for matching pursuit is composed of functions that are bounded by frame based psychoacoustic adaptive wavelet packet. Psychoacoustic motivated entropy based cost functions allow us to minimize perceptual relevance and adapt wavelet packet structure with reducing dictionary size. The proposed methodology for selecting most relevant components is based on maximizing the matching between the auditory excitation scalograms associated with original and modeled signal correspondingly. This technique allows to significant reduce the number of MP atoms in compare with well known techniques based on damped sinusoids and over-complete WP -dictionary.
PL
Artykuł prezentuje algorytm poszukiwania dopasowującego (ang. Matching Persuit) z percepcyjnie zoptymalizowanym słownikiem opartym na pakietowej transformacji falkowej. Algorytm zastosowano do jak najbardziej trafnego wyboru komponentów użytych do zwartego przedstawienia przejść w sygnale audio. Poszukiwanie dopasowujące wykorzystuje słownik złożony z funkcji określonych pakietową transformacją falkową, która percepcyjnie adaptuje się do ramek sygnału. Oparta na entropii i ocenie psychoakustycznej funkcja kosztu pozwala zminimalizować zależności percepcyjne i przystosować pakietową transformację falkową do ograniczonego rozmiaru słownika. Zaproponowana metodologia wyboru najbardziej istotnych komponentów opiera się na maksymalizacji dopasowania pomiędzy skalogramami percepcyjnego wzbudzenia skojarzonymi odpowiednio z sygnałem oryginalnym i modelowanym. Technika ta pozwala istotnie zredukować liczbę funkcji atomowych poszukiwania dopasowującego w stosunku do znanych technik, które wykorzystują tłumione sinusoidy i nadkompletne słowniki pakietowej transformacji falkowej.
Rocznik
Strony
74--79
Opis fizyczny
Bibliogr. 13 poz., rys., wykr.
Twórcy
autor
autor
  • Belarusian State University of Informatics and Radioelectronics, Computer Enigineering Departament, Belarus
Bibliografia
  • [1] Mallat S., Zhang Z.: Matching pursuits with time-frequency dictionaries. IEEE Trans. on Signal Processing, vol. 41, no. 12, December 1993, pp. 3397-3415.
  • [2] Vera-Candeas P., Ruiz-Reyes N., Roza-Zurera M., Martinez-Munoz D., Lopez-Ferreras F.: Transient modellling by Matching-Pursuits with a wavelet dictionary for parametric audio coding. IEEE Signal Processing Letters, vol. 11, No. 3, March 2004, pp. 349-352.
  • [3] Goodwin M.M.: Adaptative signal models: theory, algorithms and audio applications. Kluwer Academic Publishers, 1998.
  • [4] Vera-Candeas P., Ruiz-Reyes N., Roza-Zurera M., Lopez-Ferreras F., Curpian-Alonso J.: New matching pursuit based sinusoidal modelling method for audio coding, IEE Proc. Vis. Image Signal Process., vol. 151, no. 1, February 2004, pp. 21-28.
  • [5] Heusdens R., Vafin R., Kleijn W.B.: Sinusoidal modeling using psychoacoustic-adaptive matching pursuits. IEEE Signal Processing Letters, vol. 9, no. 8, August 2002, pp. 262-265.
  • [6] Levine S., Smith J.: A Sines+Transients+Noise Audio Representation for Data Compression and Time/Pitch Scale Modifications. AES 105th Convention (San Francisco, CA, USA), Preprint 4781, September 1998.
  • [7] Goodwin M.M.: Residual modeling in music analysis/synthesis. Proc. IEEE ICASSP, vol. 2, Atlanta, May 1996, pp. 1005-1008.
  • [8] Goodwin M.M.: Matching pursuit with damped sinusoids. Proc. IEEE ICASSP, vol. 3, Munich, April 1997, pp. 2037-2040.
  • [9] Verma T.S.: A perceptually based audio signal model with application to scalable audio compression. PhD thesis, Standford University, 1999.
  • [10] Coifman R., Wickerhauser V.: Entropy-based algorithms for best basis selection. IEEE Trans, on Information Theory, vol. 38, no. 2, March 1992, pp. 713-718.
  • [11] Painter T., Spanias A.: Sinusoidal Analysis-Synthesis of Audio Using Perceptual Criteria, EURASIP Journal on Applied Signal Processing, N1, 2003, pp. 15-20.
  • [12] Petrovsky A., Krahe D., Petrovsky A.A.: Real-Time Wavelet Packet-based Low Bit Rate Audio Coding on a Dynamic Reconfigurable System, AES 114th Convention (Amsterdam, Netherlands), preprint 5778, May, 2003, p. 22.
  • [13] Johnston J.D.: Transform coding of audio signals using perceptual noise criteria. IEEE Trans. On Select. Areas Commun., vol. 6, Feb. 1988, pp. 314-323.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAD-8101-0013
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.