Warianty tytułu
Phoneme probability estimation in neural speech recognition system
Języki publikacji
Abstrakty
Zaprezentowano nowoczesną metodę estymacji prawdopodobieństwa fonemów za pomocą sztucznych sieci neuronowych na potrzeby automatycznego systemu rozpoznawania mowy (ARM). Wykorzystano przy tym technologię cyfrowego przetwarzania sygnałów do ekstrakcji charakterystycznych cech (melowe częstotliwościowe współczynniki kepstralne - MFCC). Przedstawiono dwa rodzaje estymatorów neuronowych: wielostanowe sieci neuronowe z czasowymi opóźnieniami (MS-TDNN) oraz samoorganizującą się mapę Kohonena (SOM) z czasowymi oknami opóźnień.
This thesis presents modern method for phoneme probability estimation with Artificial Neural Networks (ANN) to use Automatic Speech Recognition (ASR) system. The digital signal processing technology pro-vide a feature extraction (mel frequency cepstral coefficients - MFCC). Presents two kinds of neural estimations: Multi-State Time Delay Neural Network (MS-TDNN) or Kohonen Self-Organizing Map (SOM) with time-delay Windows.
Rocznik
Tom
Strony
37-39
Opis fizyczny
Bibliogr. 10 poz., rys.
Twórcy
autor
- Politechnika Świętokrzyska, Wydział Elektrotechniki, Automatyki i Informatyki, gąsiorowski@op.pl
Bibliografia
- 1. C. Becchetti C. i in., Speech Recognition Theory and C+ + lmplementation, 1999.
- 2. J. Tebelskis, Speech Recognition using Neural Networks, 1995.
- 3. T. Kohonen, The „Neural” Phonetic Typewriter, IEEE Computer, 27, nr 3, 1988, 11-22.
- 4. M. Xiaolong, Towards a Unified Framework for Sub-lexical and Supra-lexical Linguistic Modeling, 2002.
- 5. Cz. Basztura, Źródła, sygnały i obrazy akustyczne. Przetwarzanie, analiza, rozpoznawanie, 1989.
- 6. R. Tadeusiewicz, Sygnał mowy, 1988.
- 7. S. Osowski, Sieci neuronowe do przetwarzania informacji, 2000.
- 8. J. Żurada i in., Sztuczne sieci neuronowe, 1995.
- 9. A. Oppenheim, Sygnały cyfrowe przetwarzania i zastosowania, 1988.
- 10. G. Richard, Wprowadzenie do cyfrowego przetwarzania sygnałów, 1999.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-BPB1-0023-0020