Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 2

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  prosodic features
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
In this article the text independent speaker verification problem is considered. The approach, in which SVM and prosodic features are employed, has been chosen. Prosodic features are modelled by Legendre polynomials. In order to map a sequence of prosodic vectors to the fixed dimensional vector, three kernels were used: VQ kernel, GMM supervector kernel, and Fisher kernel. These three kernels were compared and their combination was evaluated. Finally, a combination with spectral features was investigated.
PL
W artykule jest rozważany problem automatycznej weryfikacji mówcy niezależnej od tekstu. Przedstowiono system oparty na maszynach wektorów nośnych (SVM - support vector machines) oraz cechach prozodycznych. Cechy prozodyczne są modelowane z wykorzystaniem wielomianów Legendre’a. W celu przekształcenia wektorów prozodycznych na wektory o ustalonej liczbie elementów zasotosowano trzy funkcje jądra: VQ, superwektor GMM oraz jądro Fishera. Wymienione funkcje zostały porównane oraz przetestowano skuteczność systemu w przypadku kombinacji wektorów. Zbadano także skuteczność systemu w połączeniu z cechami spektralnymi.
PL
W artykule oceniano skuteczność systemu automatycznej weryfikacji mówcy opartego na cechach prozodycznych. Poprawność rozpoznawania mówcy zbadano za pomocą modeli opartych na bigramach. Na podstawie uzyskanych rezultatów wykazano, że rytm prozodii niesie istotne informacje zależne od mówcy. Ponadto opracowano metodę doboru liczby poziomów kwantyzacji w zależności od czasów trwania segmentów.
EN
In this paper accuracy of the speaker verificatipn system based on prosodic features was evaluated. Efficiency of bigram models for the speaker recognition was assessed. The results showed that in speech the prosody rhythm carries valuable speaker specific information. Appropriate numbers of quantization levels in relation to segments' duration was determined.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.