Analiza cepstralna w systemach rozpoznawania mówców

Dobrowolski, A.; Majda, E.

Artykuł - szczegóły

Tytuł artykułu

Analiza cepstralna w systemach rozpoznawania mówców

Autorzy

Dobrowolski A. , Majda E.

Identyfikatory

Warianty tytułu

Cepstral analysis in speaker recognition systems

Języki publikacji

Abstrakty

W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy (ASR – ang. Automatic Speakers Recognition). Sygnał mowy w postaci pierwotnej charakteryzuje się dużą nadmiarowością, dlatego konieczna jest ekstrakcja specyficznych cech sygnału, za pomocą których możliwy będzie efektywny opis właściwości sygnał, ważnych z punktu widzenia rozpoznawania mówcy. Z tego względu parametryzacja sygnału w procesie rozpoznawania jest niezwykle istotna. Autorzy podjęli się próby wyboru optymalnego (najbardziej dyskryminującego) zestawu parametrów opisujących sygnału w oparciu o metody przetwarzania homomorficznego. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy w systemach rozpoznawania na podstawie pozyskanych w postaci cyfrowej próbek głosu.

The present paper addresses issues related to the speaker recognition system (ASR – Automatic Speakers Recognition). In its primary form, a speech signal is characterized by a high redundancy, so it is necessary to extract the specific features of the signal that would allow to efficiently describing the properties thereof that are important from the viewpoint of speaker recognition. Therefore, parameterization of the signal in the process of recognition is extremely important. The authors have attempted to select the optimal (most discriminating) set of parameters describing the signal by using a homomorphic processing method. The study has primarily focused on assessing applicability of the cepstral analysis in speakers recognition systems based on the acquired digitized voice samples.

Słowa kluczowe

ASR ekstrakcja cech analiza cepstralna PCA

ASR PCA speakers recognition systems

Wydawca

Sieć Badawcza Łukasiewicz - Poznański Instytut Technologiczny

Czasopismo

Logistyka

Rocznik

2011

Tom

nr 6

Opis fizyczny

Pełny tekst na CD, Bibliogr. 3 poz., rys.

Twórcy

autor

Dobrowolski A.

autor

Majda E.

Wojskowa Akademia Techniczna, Wydział Elektroniki; 00-908 Warszawa; ul. Gen. Kaliskiego 2, andrzej.dobrowolski@wat.edu.pl

Bibliografia

[1] A. Shomali, Rozpoznawanie mówcy na podstawie długookresowego histogramu amplitud sygnału mowy, Rozprawa doktorska, AGH, 1999
[2] Z. Pawłowski, Foniatryczna diagnostyka wykonawstwa emisji głosu śpiewaczego i mówionego, Impuls, 2005
[3] J. Ming, T. Hazen, J. R Glass, D. A. Reynolds, Robust Speaker Recognition In Noisy Conditions, IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 5, 2007, pp. 1711-1723

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BPG8-0087-0021