Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Uzdatnianie mowy metodą podprzestrzeni sygnału z ograniczeniami percepcyjnymi : rozwiązania przybliżone
Konferencja
Signal Processing Algorithms, Architectures, Arrangements, and Applications. 11th IEEE Signal Processing Workshop SPA 2007 ; 7.09.2007 ; Poznan, Poland
Języki publikacji
Abstrakty
This paper is concerned with recently proposed perceptually constrained signal subspace (PCSS) method for speech enhancement. Two simplifications of the PCSS method are presented. The first approach is based on approximate diagonalization of the covariance matrix of noise energies in the transformed domain. The approximate solution is presented in a new form which provides perceptually optimal resi-dual noise shaping and does not require a whitening transformation. The second approach is a realization of the PCSS method in the frequency-domain. This is done using an assumption that the covariance matrices are circulant. The resulting estimator is almost identical to the well known IND (Inaudible Noise Distortion) rule. An evaluation of selected methods is performed using objective speech quality mea-sures and informal listening tests. The results show that the sub-optimal methods offer comparable speech quality as the exact solution in common situations.
Artykuł dotyczy zaproponowanej ostatnio metody podprzestrzeni sygnału z ograniczeniami percepcyjnymi (PCSS). Prezentowane są dwa uproszczenia metody PCSS. Pierwsze podejście opiera się na przybliżonej diagonalizacji macierzy kowariancji energii szumu w dziedzinie transformaty. Rozwiązanie przybliżone umożliwia optymalne w sensie percepcyjnym kształtowanie widma szumu resztkowego i nie wymaga transformacji wybielających. Drugie podejście stanowi realizację metody PCSS w dziedzicznie częstotliwości. Osiąga się to wykorzystując założenie, że macierze kowariancji są macierzami okresowymi. Uzyskany estymator okazuje się niemal identyczny z dobrze znaną regułą IND. Przeprowadzana jest ocena wybranych metod przy użyciu obiektywnych miar jakościowych oraz nieformalnych testów odsłuchowych. Wyniki wskazują, że metody przybliżone oferują porównywalną jakość mowy do metody dokładnej w typowych warunkach.
Wydawca
Rocznik
Tom
Strony
38--44
Opis fizyczny
Bibliogr. 13 poz., rys., tab., wykr.
Twórcy
Bibliografia
- [1] Gustafsson S., Jax P., Vary P.: A novel psychoacoustically motivated audio enhancement algorithm preserving background noise characteristic. IEEE Int. Conf. on Acoustic, Speech a Signal Proc. ICASSP'98, Seattle, 1998, vol. 1, pp. 397-400.
- [2] Petrovsky A., Parfieniuk M., Borowicz A.: Warped DFT based perceptual noise reduction system. Proc. 116th AES Convention, Berlin, Germany, 2004, Paper #6035.
- [3] Ephraim Y., Van Trees H.L.: A signal subspace approach I speech enhancement. IEEE Trans. Speech Audio Proc, vol. 3, 1995, pp. 251-266.
- [4] Jabloun F., Champagne B.: Incorporating the Human Hearing Properties in the Signal Subspace Approach for Speech Enhancement. IEEE Trans. Speech Audio Proc., vol. 11, no. 2003, pp. 700-708.
- [5] Lev-Ari H., Ephraim Y.: Extension of the Signal Subspace Speech Enhancement Approach to Colored Noise. IEEE Signal Proc. Letters, vol. 10, no. 4, 2003, pp. 104-106.
- [6] Borowicz A., Petrovsky A.: Perceptually constrained subspace method for enhancing speech degraded by colored noise. Proc. AES 118th, Barcelona, Spain, 2005, Paper #6331.
- [7] Hu Yi, Loizou P.C.: A subspace approach for enhancing speech corrupted by colored noise. IEEE Int. Conf. on Acoustic, Speech and Signal Proc. ICASSP'02, Orlando, 2002, vol. pp. 573-576.
- [8] Borowicz A., Petrovsky A.: Perceptually Constrained Signal Subspace Speech Enhancement Based on KLT Tracking Algorithm. Proc. IEEE Scientific Workshop Signal Processing'2005, Poznań, Poland, September 2005, pp. 109-114.
- [9] Rezayee A., Gazor S.: An adaptive KLT approach for speech enhancement. IEEE Trans. Speech Audio Processing, vol. 8, 2001, pp. 87-95.
- [10] Borowicz A., Petrovsky A.: Minima controlled noise estimations for KLT-based speech enhancement. Proc. 14th European Signal Processing Conference: EUSPICO'2006, Florence, Italy, September 2006, CD-ROM.
- [11] Gray R.: Toeplitz and circulant matrices: II. Stanford Electron Lab., Tech. Rep., vol. 6504-1, April 1977.
- [12] Johnston J.D.: Transform coding of audio signals using perceptual noise criteria. IEEE J. on Selected Areas in Comm., vol. 6, 1988, pp. 314-323.
- [13] Yang W., Benbouchta M., Yantorno R.: Performance of a modified bark spectral distortion measure as an objective speech quality measure. IEEE Int. Conf. on Acoustic, Speech and Signal Processing ICASSP'98, Seattle, 1998, pp. 541-544.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAD-8101-0007