Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Project of automatic speaker recognition system based on homomorphic processing methods
Języki publikacji
Abstrakty
W referacie przedstawiono zagadnienia związane z opracowaniem systemu automatycznego rozpoznawania mówcy. Autorzy skupili się na wykorzystaniu metod przetwarzania sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy, co w konsekwencji wiązało się z wykorzystaniem tzw. technik homomorficznych. W zaprojektowanym systemie kluczowe znaczenie ma zarówno proces ekstrakcji cech osobniczych, jak i towarzyszący mu proces klasyfikacji. Badania przedstawione w referacie skupiały się więc w pierwszym etapie na opracowaniu generatora cech opartego na fuzji cech cepstralnych i melcepstralnych oraz odpowiedniej selekcji deskryptorów. W drugim etapie autorzy dokonali optymalizacji parametrów generatora z uwzględnieniem docelowej metody klasyfikacji. Oceny otrzymanych wyników dokonano w oparciu o zbiór 500 próbek głosu od 50 mówców (po 10 próbek od każdego mówcy) i otrzymano 489 poprawnych klasyfikacji, co daje błąd klasyfikacji na poziomie 2,2%.
The paper examines issues related to the determination of automatic speaker recognition systems. The authors focus on the use of speech signal processing methods that consider the phenomena connected with the speech generation process, which in turn connected to using a homomorphic processing methods. In a designed system crucial issue have both the extraction process of individual characteristics and classification process. The research presented in this paper focused primarily in the first stage on determination of features distinctive to sound generators using a fusion of cepstral and mel-cepstral information and also considers the feature selection. In the second stage optimization of the generator parameters taking account of suitable classification methods has been done by the authors. Finally, the evaluation of the results was based on the set of 500 samples of the acoustic signal from the 50 speakers (10 samples for each speaker) and 489 correct classification, which gives clasification error on 2,2% level.
Wydawca
Rocznik
Tom
Strony
41--44
Opis fizyczny
Bibliogr. 4 poz., wykr.
Twórcy
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, Warszawa
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, Warszawa
Bibliografia
- [1] Dobrowolski A., Majda E.: Application of homomorphic methods of speech signal processing in speakers recognition system, Electric Review, R. 88, Nr 6/2012, str. 12-16.
- [2] Furui S.: Recent advantages in speaker recognition, Pattern Recognition Letters 18, 1997, pp. 859-1872.
- [3] Majda E., Dobrowolski A. P.: Modeling and optimization of the feature generator for speaker recognition systems, Electrical Review, 12/2012, artykuł w druku.
- [4] Osowski S., Markiewicz T., Kruk M., Kozłowski W.: Metody sztucznej inteligencji do wspomagania diagnostyki patologii tkanek, w A. Michalski (red.), Metrologia w medycynie : wybrane zagadnienia, WAT, Warszawa 2011, s. 91-126.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWA0-0057-0007