Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl

PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2007 | Vol. 48, nr 4 | 61-64
Tytuł artykułu

Speech recognition by means of feature extraction method based on slope transformation assisted with denoising

Warianty tytułu
PL
Rozpoznawanie mowy metodą ekstrakcji cech za pomocą transformacji nachyleniowej połączonej z odszumianiem
Konferencja
Signal Processing ; 07.09.2007 ; Poznań, Poland
Języki publikacji
EN
Abstrakty
EN
This paper describes a method for speech feature extraction using morphological signal processing based on the so-called "slope transformation". The proposed approach has been used to extract the signal upper spectral envelope. Results of experiments of the automatic speech recognition (ASR), which were undertaken to check the performance of the presented method, have shown some evident improvements of the effectiveness of recognition of isolated words, especially for women voices. The proposed method was combined with the speech enhancement and then evaluated. Results showed that for low signal-to-noise ratios the denoising algorithms used in the preprocessing stage bring additional recognition accuracy increase.
PL
W artykule przedstawiono metodę ekstrakcji cech mowy za pomocą morfologicznego przetwarzania sygnałów, wykorzystującego tzw. transformację nachyleniową. Zaproponowane ujęcie polega na wyznaczeniu górnej obwiedni widmowej. Rezultaty eksperymentów automatycznego rozpoznawania mowy, które przeprowadzono w celu zbadania skuteczności zaprezentowanej metody, wykazały poprawę efektywności rozpoznawania izolowanych słów, zwłaszcza w przypadku głosów żeńskich. Metodę rozpoznawania powiązano z poprawą jakości mowy, a następnie dopiero oceniano skuteczność rozpoznawania. Otrzymane rezultaty wskazały na poprawę dokładności rozpoznawania mowy po jej wstępnym odszumieniu.
Wydawca

Rocznik
Strony
61-64
Opis fizyczny
Bibliogr. 14 poz., wykr.
Twórcy
autor
  • Poznań University of Technology, Division of Signal Processing and Electronic Systems, Poland
Bibliografia
  • [1] Bakis R.: Continuous speech recognition via centisecond acoustics states. In Proc. 91. Meeting of the Acoustic Society, Poznań 1976.
  • [2] Davis S. B., Mermelstein P.: Comparison of parametric representations for monosyllabic word recognition in continuously spoken sentences. IEEE Trans. Acoust. Speech, Signal Processing, vol. 28, pp. 357-366.
  • [3] Grocholewski S.: Statystyczne podstawy systemu ARM dla języka polskiego. Wyd. Politechniki Poznańskiej, Poznań 2001.
  • [4] Maragos P.: Slope transforms: theory and application to nonlinear signal processing. IEEE Transactions on Signal Processing, 1995, 43 (4), pp. 864-877.
  • [5] Marciniak T., Rochówniak R., Dąbrowski A.: Detection of end-points of isolated words using slope transformation. Proc. MIXDES, Gdynia 2006, pp. 655-659.
  • [6] Meyer A.: Zastosowanie transformacji zafalowaniowej do odszumiania sygnałów audio i poprawy zrozumiałości mowy. Rozprawa doktorska, Politechnika Poznańska, Wydział Informatyki i Zarządzania, Poznań 2005.
  • [7] O'Shaughnessy D.: Speech Communication. IEEE, New York 2000.
  • [8] Gong Y.: Speech recognition in noisy environments: A survey, Speech Communication, 16:261-291, 1995.
  • [9] Vaseghi S. V., Milner B. P.: Noise-adaptive hidden Markov models based on Wiener filters. Proc. European Conf. Speech Technology, Berlin, 1993, Vol. II, pp.1023-1026.
  • [10] Gu L., Rose K.: Perceptual Harmonic Cepstral Coefficients for Speech Recognition in Noisy Environment. Proc. ICASSP 2001, Salt Lake City, Utah, 2001.
  • [11] Ephraim E., Malah D. (1985): Speech Enhancement Using a Minimum Mean-Square Error Log-Spectral AmplitudeEstimator. IEEE Trans. on Speech and Audio Processing, ASSP-33(2): 443-445.
  • [12] Scalart P., Vieira Filho J. (1996): Speech Enhancement Based on A Priori Signal To Noise Estimation. IEEE International Conference on Acoustics, Speech, and Signal Processing.
  • [13] Zavarehei E. (2005): MMSESTSA85.
  • [14] Zavarehei E. (2005): WienerScalart96.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-BWA9-0006-0012
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.