PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Application of homomorphic methods of speech signal processing in speakers recognition system

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
PL
Zastosowanie homomorficznych metod przetwarzania sygnału mowy w systemach rozpoznawania mówcy
Języki publikacji
EN
Abstrakty
EN
The paper presents the problem of automatic speaker recognition system. Automatic recognition of speaker is a process designed to determine, whether a particular statement belongs to the speaker. The speech signal is a carrier of both physiological and behavioral features. No two individuals sound identical, because their vocal tract shapes, larynx sizes, and other parts of their voice production organs are different. This paper contains a description of the speech signal analysis algorithms, designed based on normalized real cepstrum. The authors have attempted to select the optimal set of parameters describing the speaker. The study has primarily focused on assessing applicability of the cepstral analysis of speech signal. In addition results of experiments are presented using a PCA method.
PL
W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy. Automatyczne rozpoznawanie mówcy jest procesem mającym na celu określenie, czy dana wypowiedź należy do określonego mówcy. Sygnał mowy jest nośnikiem zarówno cech fizjologicznych, jak i behawioralnych. Nie ma dwóch identycznie brzmiących osób, ze względu na fakt występujących różnic w budowie krtani, głośni, traktu wokalnego oraz innych organów artykulacyjnych u każdego człowieka. Praca zawiera opis algorytmów analizy sygnału mowy opracowanych w oparciu o rzeczywiste cepstrum. Dzięki tej technice multiplikatywny związek pobudzenia i traktu głosowego zastąpiony zostaje związkiem addytywnym, co znacznie upraszcza separację obu składników. Autorzy podjęli się próby wyboru optymalnego zestawu cech charakteryzujących danego mówcę. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy. Dodatkowo uzyskane wyniki eksperymentów przedstawiono przy pomocy metody PCA.
Rocznik
Strony
12--16
Opis fizyczny
Bibliogr. 5 poz., wykr.
Twórcy
autor
Bibliografia
  • [1] Feng L., Speaker recognition, Kgs, Lynby, 2004
  • [2] Rabiner L., Juang B.H., Fundamentals of speech recognition, PTR Prentice-Hall, 1993
  • [3] Ferras M., Leung C., Barras C., Gauvain J.L., Comparison of Speaker Adaptation Methods as Feature Extraction for SVM-Based Speaker Recognition, IEEE Transactions on Audio, Speech, and Language Processing, VOL. 18, NO. 6, 2010, pp. 1366-1378
  • [4] Ming J., Hazen T., Glass J.R., Reynolds D.A., Robust Speaker Recognition In Noisy Conditions, IEEE Transactions on Audio, Speech, and Language Processing, vol. 15, no. 5, 2007, pp. 1711-1723
  • [5] Zhou G., Mikhael W.B., Speaker identification based on adaptive discriminative vector quantisation, Vision, Image and Signal Processing, IEE Proceedings, vol. 153, no. 6, 2007, pp. 754 – 760
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOK-0039-0003
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.