PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Influence of subband signal denoising for voice activity detection

Identyfikatory
Warianty tytułu
PL
Wpływ odszumiania w podpasmach na detekcję sygnału mowy
Konferencja
IEEE Signal Processing Conference : Algorithms, Architectures, Arrangements, and Applications. IEEE SPA 2009 (13 ; 24-26.09.2009 ; Poznań, Poland)
Języki publikacji
EN
Abstrakty
EN
In this paper a new approach is proposed for the socalled voice activity detection (VAD) and word endpoint detection (EPD) both under assumption that the analyzed speech signal is recorded in the presence of noise. The described VAD and ERP methods contain a special stage of the wavelet subband denoising. We present effectiveness of the algorithm with this stage of processing for automatic recognition of isolated words by means experimental results.
PL
W artykule zaproponowano nowe ujęcie detekcji sygnału mowy (VAD - Voice Activity Detection) i wyznaczania początków i końców słów (EPD - Endpoint Detection) w przypadku sygnałów mowy zarejestrowanych w obecności szumu. Opisane metody wykorzystują specjalny etap odszumiania sygnału w podpasmach z użyciem transformacji zafalowaniowej. Na podstawie wyników eksperymentalnych zaprezentowano skuteczność algorytmów zawierających ten etap przetwarzania w przypadku automatycznego rozpoznawania izolowanych słów.
Rocznik
Strony
67--70
Opis fizyczny
Bibliogr. 11 poz., tab., wykr.
Twórcy
autor
  • Politechnika Poznańska, Katedra Sterowania i Inżynierii Systemów
Bibliografia
  • [1] Benyassine A. et al: ITU-T recommendation G. 729 Annex B: A silence compression scheme for use with G.729 optimized for V.70 digital simultaneous voice and data applications. IEEE Communication Magazine, pp. 64-73, September 1997.
  • [2] Rabiner L. R., Sambur M. R.: An algorithm for determining the endpoints of isolated utterances. Bell System Tech. J., vol. 54, no. 2, pp. 297-315, Feb. 1975.
  • [3] Tahmasbi R., Rezaei S.: Change point detection in GARCH models for voice activity detection. IEEE Transaction on Audio, Speech and Language Processing, vol. 16, no. 5, pp. 1038-1046, July 2008.
  • [4] Marciniak T., Rochówniak R., Dąbrowski A.: Detection of end points of isolated words using slope transformation. Proc. of Mixed Design of Integrated Circuits and Systems (MIXDES), pp. 655-659, Gdynia, Poland, 2006.
  • [5] Jang R.: ASR (automatic speech recognition) toolbox, available from the link at the author's homepage at http://www.cs.nthu.edu.tw/-jang.
  • [6] ITU-T Rec.G.729, Annex B: A silence compression scheme for G.729 optimized for terminals conforming to Recommendation V.70, ITU-T, 1996.
  • [7] Voice activity detector (VAD) for adaptive multi rate (AMR) speech traffic channels, Digital Cellular Telecommunications System (Phase2+), 1999.
  • [8] Wu B. F., Wang K. C.: Robust endpoint detection algorithm based on the adaptive band - partitioning spectral entropy in adverse environments. IEEE Trans. on Speech and Audio Processing, vol. 13, no. 5, September 2005.
  • [9] Sohn J., Kim N. S., Sung W.: Astatistical model - based voice activity detection. IEEE Signal Processing Letters, vol. 6, no. 1, pp. 1-3, January 1999.
  • [10] Matlab GARCH toolbox, Mathworks, 2005.
  • [11] Rochówniak R.: Automatic recognition of isolated words - software written in C++" (B. Sc. dissertation). Poznań University of Technology, Poznań, 2006.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWA9-0027-0015
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.