PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Analiza cepstralna w systemach rozpoznawania mówców

Identyfikatory
Warianty tytułu
EN
Cepstral analysis in speaker recognition systems
Języki publikacji
PL
Abstrakty
PL
W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy (ASR – ang. Automatic Speakers Recognition). Sygnał mowy w postaci pierwotnej charakteryzuje się dużą nadmiarowością, dlatego konieczna jest ekstrakcja specyficznych cech sygnału, za pomocą których możliwy będzie efektywny opis właściwości sygnał, ważnych z punktu widzenia rozpoznawania mówcy. Z tego względu parametryzacja sygnału w procesie rozpoznawania jest niezwykle istotna. Autorzy podjęli się próby wyboru optymalnego (najbardziej dyskryminującego) zestawu parametrów opisujących sygnału w oparciu o metody przetwarzania homomorficznego. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy w systemach rozpoznawania na podstawie pozyskanych w postaci cyfrowej próbek głosu.
EN
The present paper addresses issues related to the speaker recognition system (ASR – Automatic Speakers Recognition). In its primary form, a speech signal is characterized by a high redundancy, so it is necessary to extract the specific features of the signal that would allow to efficiently describing the properties thereof that are important from the viewpoint of speaker recognition. Therefore, parameterization of the signal in the process of recognition is extremely important. The authors have attempted to select the optimal (most discriminating) set of parameters describing the signal by using a homomorphic processing method. The study has primarily focused on assessing applicability of the cepstral analysis in speakers recognition systems based on the acquired digitized voice samples.
Słowa kluczowe
Czasopismo
Rocznik
Tom
Opis fizyczny
Pełny tekst na CD, Bibliogr. 3 poz., rys.
Twórcy
autor
Bibliografia
  • [1] A. Shomali, Rozpoznawanie mówcy na podstawie długookresowego histogramu amplitud sygnału mowy, Rozprawa doktorska, AGH, 1999
  • [2] Z. Pawłowski, Foniatryczna diagnostyka wykonawstwa emisji głosu śpiewaczego i mówionego, Impuls, 2005
  • [3] J. Ming, T. Hazen, J. R Glass, D. A. Reynolds, Robust Speaker Recognition In Noisy Conditions, IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 5, 2007, pp. 1711-1723
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG8-0087-0021
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.