PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Modelowanie i optymalizacja generatora cech dla systemu rozpoznawania mówcy

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Modeling and optimization of features generator for speaker recognition systems
Języki publikacji
PL
Abstrakty
PL
W pracy przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition - ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzględniającej dodatkowo selekcję cech. Oceny otrzymanych wyników dokonano w oparciu o analizę składników głównych (ang. Principal Component Analysis - PCA) zbioru deskryptorów wyznaczonych dla próbek głosu pochodzących od 24 mówców.
EN
The paper presents issues related to modeling and optimization of the features generator for the speaker recognition system (ASR - Automatic Speakers Recognition). Parameterization's stage of the speech signal (features generation) is fundamental in this type of systems, due to the fact that the unique vector of features is crucial in the process of recognition. The task is to describe the speech signal using descriptors as little as possible, without loss of relevant information to the speaker recognition. In addition, parametrization should have robust to acoustic and technical registration conditions and the recorded linguistic material. The research presented in this paper is focused primarily on the multicriteria optimization of selected parameters of the features generator based on cepstral analysis, additionally allowing features selection. Finally, evaluation of the results was based on the analysis of main components, a set of descriptors for the samples voice acquired from 24 speakers.
Rocznik
Strony
153--168
Opis fizyczny
Bibliogr. 8 poz., tab., wykr.
Twórcy
autor
  • Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. S. Kaliskiego 2, ewelina.majda@wat.edu.pl
Bibliografia
  • [1] S. Furui, Recent advantages in speaker recognition, Pattern Recognition Letters, 18, 1997, 859-1872.
  • [2] T. Kinnunen, H. Li, An overview of text-independent speaker recognition: From feature to supervectors, Speech Communication, 2010, 12-40.
  • [3] Z. Pawłowski, Foniatryczna diagnostyka wykonawstwa emisji głosu śpiewaczego i mówionego, Impuls, 2005.
  • [4] Z. Ciota, Metody przetwarzania sygnałów akustycznych w komputerowej analizie mowy, Exit, 2010.
  • [5] A. Dobrowolski, E. Majda, Ocena przydatności wybranych cech sygnału mowy w systemach automatycznego rozpoznawania mówcy, Przegląd Elektrotechniczny, R. 87, 10, 2011, 193-197.
  • [6] A. Dobrowolski, E. Majda, Cepstral analysis in the speakers recognition systems, 15th IEEE SPA Conference, Poznań, 2011, 85-90.
  • [7] A. Dobrowolski, E. Majda, Application of homomorphic methods of speech signal processing in speakers recognition system, Przegląd Elektrotechniczny, artykuł w recenzji.
  • [8] S. Osowski, T. Markiewicz, M. Kruk, W. Kozłowski, Metody sztucznej inteligencji do wspomagania diagnostyki patologii tkanek, red. A. Michalski, Metrologia w medycynie – wybrane zagadnienia, WAT, Warszawa, 2011, 91-126.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAD-0031-0011
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.