PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

On hardware implementation of the Context-based Lossless Audio Codec

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Sprzętowa realizacja bezstratnej kompresji audio z przełączanym modelem predekcyjnym
Języki publikacji
EN
Abstrakty
EN
A modification of the most efficient version of MPEG4 Lossless Audio with extension of the RLS (Recursive Least Square) and NLMS (Normalized Least-Mean-Square) blocks is described in the paper. Moreover, a segmentation block influencing the selection of proper predictive modelling parameters is introduced. These blocks have been implemented in hardware description language ImpulseC and synthesised into a reprogrammable device from the Xilinx Virtex5 family.
PL
W pracy zaprezentowano rozwinięcie najwydajniejszej wersji MPEG4 Lossless Audio przez rozbudowanie bloków RLS (Recursive Least Square) i NLMS (Normalized Least-Mean-Square), wprowadzając przy tym blok segmentacji wpływający na dobór odpowiednich parametrów modelowania predykcyjnego. Zwiększono nie tylko rząd predykcji w poszczególnych blokach modelowania, ale też rozwinięto metodę NLMS do ES-NLMS i dobrano eksperymentalne wartości współczynników uczących, a także odpowiednie proporcje liczby współczynników predykcji w trybie stereo. Ponadto opracowano własny blok adaptacyjnego kodera arytmetycznego, w którym wykorzystano adaptacyjne kodowanie Golomba-Rice'a. Każdy z tych bloków został przygotowany do potrzeb implementacji sprzętowej. Bloki RLS i NLMS wykorzystują dane pochodzące z modułu segmentacji, co ma pozytywny wpływ na efektywność kompresji. Głównym zadaniem bloku segmentacji jest wydzielenie segmentów różniących się zawartością akustyczną. Wykorzystano na tym etapie dwa podejścia do segmentacji – pierwsze z nich realizuje podejście polegające na porównywaniu sąsiednich ramek sygnału w przestrzeni cech składającej się z 12 współczynników MFCC (Mel-Frequency Cepstral Coefficients) i drugie polegające na ocenie dwóch modeli w przestrzeni cech w użyciem typowego podejścia opartego o Bayesowskie kryterium informacyjne. Wyniki uzyskane z obu technik są następnie łączone w celu kompensacji potencjalnych błędów określających granice segmentów. Dla każdego z uzyskanych segmentów wyznaczany jest uśredniony wektor cech MFCC, który dostarczany jest do bloków RLS i NLMS jako źródło do określania kontekstu. Bloki funkcjonalne zostały zaimplementowane w języku opisu sprzętu ImpulseC oraz dokonano syntezy do układu reprogramowalnego z rodziny Xilinx Virtex5.
Wydawca
Rocznik
Strony
507--509
Opis fizyczny
Bibliogr. 11 poz., tab., rys.
Twórcy
autor
  • West Pomeranian University of Technology, Faculty of Computer Science and Information Technology, Żołnierska 49, 71-210 Szczecin
autor
  • West Pomeranian University of Technology, Faculty of Computer Science and Information Technology, Żołnierska 49, 71-210 Szczecin
  • West Pomeranian University of Technology, Faculty of Computer Science and Information Technology, Żołnierska 49, 71-210 Szczecin
Bibliografia
  • [1] Huang H., Fränti P., Huang D., Rahardja S.: Cascaded RLS-LMS prediction in MPEG-4 lossless audio coding, IEEE Trans. on Audio, Speech and Language Processing, March 2008, vol. 16, no. 3, pp. 554-562.
  • [2] Rabiner L., Schafer R.: Theory and Applications of Digital Speech Processing, Pearson Higher Education, Inc., 2011.
  • [3] Chen S. and Gopalakrishnan P.: Speaker, environment and channel change detection and clustering via the bayesian information criterion, In In Proc. DARPA Broadcast News Transcription and Understanding Workshop, 1998.
  • [4] Maka T., Dziurzanski P.: Feature Contours Fusion for Determining Segment Boundaries in Audio Data, International Conference on Systems, Signals and Image Processing - IWSSIP 2014, 12-15 May, Dubrovnik, Croatia, 2014.
  • [5] Reznik Y.A.: Coding of prediction residual in MPEG-4 standard for lossless audio coding (MPEG-4 ALS), Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP’04), Montreal, Quebec, Canada, 17-21 May 2004, vol. 3, pp. III_1024-1027.
  • [6] Bekkouche H., Barret M.: Adaptive multiresolution decomposition: applications to lossless image compression, Proc. of IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP’02), Orlando, Florida, USA, May 2002, vol. 4, pp. IV_3533-3536.
  • [7] Makino S., Kaneda Y., Koizumi N.: Exponentially weighted stepsize NLMS adaptive filter based on the statistics of a room impulse response, IEEE Transactions on Speech and Audio Processing, Vol. 1, No. 1, 1993, pp. 101-108.
  • [8] Golomb S. W.: Run-length encoding, IEEE Transactions on Information Theory, July 1966, vol. 12, pp. 399-401.
  • [9] Giurcaneau C. D., Tabus I., Astola J.: Adaptive context based sequential prediction for lossless audio compression, Proceedings of IX European Signal Processing Conference EUSIPCO 1998, Rhodes, Greece, Sept. 1998, vol. 4, pp. 2349-2352.
  • [10] Dziurzański P.: Pros and cons of system-level synthesis of datadominated algorithms, Electronics - Constructions, Technologies, Applications, vol. 51, no. 10, pp. 169-171, 2010.
  • [11] Impulse Accelerated Technologies, Accelerating HPC and HPEC Applications Using Impulse C, Reconfigurable Systems Summer Institute (RSSI), Urbana, IL, July 17-20, 2007.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-efd7e1e9-f8a1-447c-9ee2-ba3e7ba72e2a
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.