Identyfikatory
Warianty tytułu
A method for spoken-letter-image recognition
Języki publikacji
Abstrakty
W artykule jest opisany system do rozpoznawania obrazów akustycznych izolowanych liter mowy. Czytelnik zapozna się z tym jak przebiegał proces przetwarzania wstępnego, parametryzacji sygnału mowy, wyboru cech charakterystycznych i klasyfikacji. Omówione zostaną zastosowane w pracy algorytmy i procedury.
A new trial on speech recognition from graphical point of view is introduced. Isolated spoken letters are considered. After recording, the speech signal is processed as an image by Power Spectrum Estimation using Burg's method. For feature extraction, classification and hence recognition, the algorithm of minimal eigenvalues of Toeplitz matrices together with other methods of speech processing and recognition are used. A number of examples on applications and comparison are presented in the work. Although the efficiency of the method is not very high, the results are encouraging for algorithm extension to cover word recognition.
Rocznik
Tom
Strony
181--207
Opis fizyczny
Bibliogr. 16 poz., tab., wykr.
Twórcy
autor
- Politechnika Białostocka, Katedra Systemów Czasu Rzeczywistego, ul. Wiejska 45 A, 15-351 Białystok
autor
- Politechnika Białostocka, Katedra Systemów Czasu Rzeczywistego, ul. Wiejska 45 A, 15-351 Białystok
autor
- Politechnika Białostocka, Katedra Systemów Czasu Rzeczywistego, ul. Wiejska 45 A, 15-351 Białystok
Bibliografia
- [1] D. J. Bum: Experiments on Nuural Net Recognition of Spoken and Written Text, IEEE Transactions on Acoustic, Speech, and Signal Processing, Vol. 36, July 1988.
- [2] L. Grad: Rozpoznawanie słów izolowanych przy wykorzystaniu ukrytych modeli Markowa, Biuletyn IA1R WAT, nr 12, 2000.
- [3] K. Saeed: Computer Graphics Analysis: A Method for Arbitrary Image Shape Description, V. 10, Number 2, 2001, pp. 185-194, MGV — International Journal on Machine Graphics and Vision, Institute of Computer Science, Polish Academy of Sciences, Warsaw.
- [4] R. W. Schafer, L. R. Rabiner: System for Automatic Formant Analysis of Voiced Speech, J. Acoust. Soc. Amer. V. 47, February 1970. [5] L. Grad: Obrazowa reprezentacja sygnału mowy, Biuletyn IA1IR WAT, nr LI, 2000.
- [6] Cz. Basztura: Modele analizy i procedury w komputerowym rozpoznawaniu głosów, Prace naukowe ITIA Politechniki Wrocławskiej, nr 30, 1989.
- [7] L. S. Marple: Digital Spectral Analysis, Englewood Cliffs, NJ: Prentice Hall, 1987.
- [8] A. Kaczanowski: Przygotowanie sygnału mowy do jego rozpoznawania, Praca magisterska nr 449, Instytut Informatyki PB, Białystok, 2001.
- [9] R. Tadeusiewicz: Sygnał mowy, WKiŁ, Warszawa, 1988.
- [10] N. Levinson: The Wiener RMS (Root Mean Square) Error Criterion in Filter Design and Prediction, Journal Math. Phys. V. 25, 1947.
- [11] J. Durbin: Efjicient Estimation of Parameters in Moving Average Models, Biometrika, V. 46, part l, 2, 1969.
- [12] Khalid Saeed: Experimental Algorithm for Testing The Realization of Transfer Functions, Proceedings of the Fourteenth IASTED Tnternational Conference, Austria, 1995.
- [13] R. Niedzielski: Kryterium do rozpoznawania znaków maszynowych alfabetu łukowego, Praca magisterska nr 293, Instytut Informatyki PB, Białystok, 1999.
- [14] M. Kozłowski: Klasyfikacja wstępnie przygotowanych obrazów akustycznych izolowanych liter mowy i przygotowanie ich do rozpoznawania., Praca magisterska nr 446, Instytut Informatyki PB, Białystok, 2001.
- [15] R. G. Lyons: Wprowadzenie do cyfrowego przetwarzania sygnałów, WKiŁ, Warszawa, 1999.
- [16] Sadaoki Furui: Digital Speech Processing, Synthesis, and Recognition, Marcel Dekker, Inc. 2001.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPB2-0005-0098