Projekt systemu automatycznego rozpoznawania mówcy w oparciu o techniki homomorficzne

Majda, E.; Dobrowolski, A. P.

Artykuł - szczegóły

Tytuł artykułu

Projekt systemu automatycznego rozpoznawania mówcy w oparciu o techniki homomorficzne

Autorzy

Majda E. , Dobrowolski A. P.

Identyfikatory

Warianty tytułu

Project of automatic speaker recognition system based on homomorphic processing methods

Języki publikacji

Abstrakty

W referacie przedstawiono zagadnienia związane z opracowaniem systemu automatycznego rozpoznawania mówcy. Autorzy skupili się na wykorzystaniu metod przetwarzania sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy, co w konsekwencji wiązało się z wykorzystaniem tzw. technik homomorficznych. W zaprojektowanym systemie kluczowe znaczenie ma zarówno proces ekstrakcji cech osobniczych, jak i towarzyszący mu proces klasyfikacji. Badania przedstawione w referacie skupiały się więc w pierwszym etapie na opracowaniu generatora cech opartego na fuzji cech cepstralnych i melcepstralnych oraz odpowiedniej selekcji deskryptorów. W drugim etapie autorzy dokonali optymalizacji parametrów generatora z uwzględnieniem docelowej metody klasyfikacji. Oceny otrzymanych wyników dokonano w oparciu o zbiór 500 próbek głosu od 50 mówców (po 10 próbek od każdego mówcy) i otrzymano 489 poprawnych klasyfikacji, co daje błąd klasyfikacji na poziomie 2,2%.

The paper examines issues related to the determination of automatic speaker recognition systems. The authors focus on the use of speech signal processing methods that consider the phenomena connected with the speech generation process, which in turn connected to using a homomorphic processing methods. In a designed system crucial issue have both the extraction process of individual characteristics and classification process. The research presented in this paper focused primarily in the first stage on determination of features distinctive to sound generators using a fusion of cepstral and mel-cepstral information and also considers the feature selection. In the second stage optimization of the generator parameters taking account of suitable classification methods has been done by the authors. Finally, the evaluation of the results was based on the set of 500 samples of the acoustic signal from the 50 speakers (10 samples for each speaker) and 489 correct classification, which gives clasification error on 2,2% level.

Słowa kluczowe

rozpoznawanie mówcy automatyczne analiza cepstralna ekstrakcja cech klasyfikacja

automatic speaker recognition cepstral analysis feature generator classification

Wydawca

Wydawnictwo SIGMA-NOT

Czasopismo

Elektronika : konstrukcje, technologie, zastosowania

Rocznik

2013

Tom

Vol. 54, nr 3

Strony

41--44

Opis fizyczny

Bibliogr. 4 poz., wykr.

Twórcy

autor

Majda E.

Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, Warszawa

autor

Dobrowolski A. P.

Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, Warszawa

Bibliografia

[1] Dobrowolski A., Majda E.: Application of homomorphic methods of speech signal processing in speakers recognition system, Electric Review, R. 88, Nr 6/2012, str. 12-16.
[2] Furui S.: Recent advantages in speaker recognition, Pattern Recognition Letters 18, 1997, pp. 859-1872.
[3] Majda E., Dobrowolski A. P.: Modeling and optimization of the feature generator for speaker recognition systems, Electrical Review, 12/2012, artykuł w druku.
[4] Osowski S., Markiewicz T., Kruk M., Kozłowski W.: Metody sztucznej inteligencji do wspomagania diagnostyki patologii tkanek, w A. Michalski (red.), Metrologia w medycynie : wybrane zagadnienia, WAT, Warszawa 2011, s. 91-126.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BWA0-0057-0007