The use of speech recognition and user verification in closed-circuit television systems

Kubanek, M.

Artykuł - szczegóły

Tytuł artykułu

The use of speech recognition and user verification in closed-circuit television systems

Autorzy

Kubanek M.

Identyfikatory

Warianty tytułu

Zastosowanie rozpoznawania mowy i weryfikacji użytkownika w systemach telewizji przemysłowej

Języki publikacji

Abstrakty

Speech recognition systems, and the verification of persons on the basis of independent speech are widely used. In the speech recognition systems, we need to know what said examined person. These recognized words we can used to controlling any devices, which is controlled by computer. In a speaker verification, the prime interest is not in recognizing the words but determining who is speaking the words. In systems of speaker verification, a test of signal from an known speaker, user gives his own login, is compared to all known speaker signals in the set. If the vocal is the same and the user login is the same, the system accepts the user. In this work, it was proposed use speech recognition method to control the movement of the camera of closed-circuit television system, and use user verification method to log on to this system. Extraction of the audio features of person's speech is done using modified mechanism of cepstral speech analysis. Speech recognition is done using hidden Markov models. The main aim of this work, excepting the practical implementation of both methods, is show, how to modify the MFCC for speech recognition and user verification.

Systemy rozpoznawania mowy i weryfikacji osób na podstawie mowy niezależnej są coraz częściej powszechnie używane. W systemach rozpoznawania mowy musimy wiedzieć, co zostało wypowiedziane przez testowaną osobę. Takie rozpoznane słowa można stosować do sterowania różnymi urządzeniami, kontrolowanymi przez komputer. W przypadku weryfikacji tożsamości nie jest ważne, co zostało wypowiedziane, ale kto to wypowiedział. W systemach weryfikacji tożsamości, gdzie każdy z zarejestrowanych użytkowników posiada swój własny unikalny login, zarejestrowana wypowiedź weryfikowanego użytkownika jest porównywana z wszystkimi wypowiedziami z bazy. Jeśli login się zgadza i charakterystyki głosowe są zgodne, wówczas system akceptuje weryfikowaną osobę. W artykule zaproponowano rozpoznawanie mowy do sterowania ruchem kamery przemysłowej, oraz weryfikację użytkownika na podstawie mowy niezależnej do logowania do systemu. Do ekstrakcji i kodowania charakterystyk głosowych zastosowano analizę cepstralną mowy. Jako aparat rozpoznający przyjęto ukryte modele Markowa. Głównym zadaniem tej pracy - oprócz oczywiście praktycznej implementacji opisanych metod - jest pokazanie, w jaki sposób należy zmodyfikować mechanizm analizy cepstralnej na potrzeby rozpoznawania mowy, a w jaki sposób na potrzeby weryfikacji tożsamości na podstawie mowy niezależnej.

Słowa kluczowe

user verification speech recognition independent speech speech coding

weryfikacja użytkownika rozpoznawanie mowy mowa niezależna kodowanie mowy

Wydawca

Wydawnictwo SIGMA-NOT

Czasopismo

Elektronika : konstrukcje, technologie, zastosowania

Rocznik

2009

Tom

Vol. 50, nr 11

Strony

65--68

Opis fizyczny

Bibliogr. 9 poz.

Twórcy

autor

Kubanek M.

Politechnika Częstochowska, Instytut Informatyki Teoretycznej i Stosowanej

Bibliografia

[1] Kubanek M.: Analysis of Signal of Audio Speech i Process of Speech Recognition. Computing, Multimedia and Intelligent Techniques, 2, pp. 5564, 2006.
[2] Kubanek M.: Method of Speech Recognition and Speaker Identification with use Audio-Visual Polish Speech and Hidden Markov Models. Biometrics, Computer Security Systems and Artificial Intelligence Applications, Saeed K., Pejas J., Mosdorof R., Springer Science + Business Media, New York, pp. 45-55, 2006.
[3] Aydin Y Nakajama H.: Realistic articulated character positioning and balance control in interactive environments. Proceedings Computer Animation, pp. 160-168, 1999.
[4] Chu Wai C.: Speech coding algorithms. Foundation and Evolution of Standardized Coders. A John Wiley & Sons, New Jersey 2000.
[5] Rabiner L., Yuang B. H.: Fundamentals of Speech Recognition. Prentice Hall Signal Processing Series, 1993.
[6] Wiśniewski A. M.: Hidden Markov Models in Speech Recognition. Bulletin IAiR WAT, 7, Wrocław 1997 [In Polish].
[7] Kanyak M. N. N., Zhi Q., Cheok A., D., Sengupta K., Chung K. C.: Audio-Visual Modeling for Bimodal Speech Recognition. Proc. Symp. Time Series Analysis, 2001.
[8] Wahab A., See Ng G., Dickiyanto R.: Speaker Verification System Based on Human Auditory and Fuzzy Neural Network System. Neurocomputing Manuscript Draft, Singapore.
[9] Sayood K.: Data compression - introduction. Publisher RM. War-saw, 2002 [In Polish].

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BWAK-0019-0026