Wyniki wyszukiwania - BazTech

Ograniczanie wyników

Znaleziono wyników: 2

Liczba wyników na stronie

Wyniki wyszukiwania

Wyszukiwano:
w słowach kluczowych: prosodic features

Sortuj według:

Ogranicz wyniki do:

Speaker verification using various dynamic kernels for prosodic features combined with spectral information

Drgas S., Dąbrowski A., Zamorski D.

Przegląd Elektrotechniczny

2012

R. 88, nr 6

51-54

In this article the text independent speaker verification problem is considered. The approach, in which SVM and prosodic features are employed, has been chosen. Prosodic features are modelled by Legendre polynomials. In order to map a sequence of prosodic vectors to the fixed dimensional vector, three kernels were used: VQ kernel, GMM supervector kernel, and Fisher kernel. These three kernels were compared and their combination was evaluated. Finally, a combination with spectral features was investigated.

W artykule jest rozważany problem automatycznej weryfikacji mówcy niezależnej od tekstu. Przedstowiono system oparty na maszynach wektorów nośnych (SVM - support vector machines) oraz cechach prozodycznych. Cechy prozodyczne są modelowane z wykorzystaniem wielomianów Legendre’a. W celu przekształcenia wektorów prozodycznych na wektory o ustalonej liczbie elementów zasotosowano trzy funkcje jądra: VQ, superwektor GMM oraz jądro Fishera. Wymienione funkcje zostały porównane oraz przetestowano skuteczność systemu w przypadku kombinacji wektorów. Zbadano także skuteczność systemu w połączeniu z cechami spektralnymi.

Automatyczna weryfikacja mówcy oparta na cechach prozodycznych

Drgaś S., Cetnarowicz D., Dąbrowski A.

Elektronika : konstrukcje, technologie, zastosowania

2009

Vol. 50, nr 3

21-24

W artykule oceniano skuteczność systemu automatycznej weryfikacji mówcy opartego na cechach prozodycznych. Poprawność rozpoznawania mówcy zbadano za pomocą modeli opartych na bigramach. Na podstawie uzyskanych rezultatów wykazano, że rytm prozodii niesie istotne informacje zależne od mówcy. Ponadto opracowano metodę doboru liczby poziomów kwantyzacji w zależności od czasów trwania segmentów.

In this paper accuracy of the speaker verificatipn system based on prosodic features was evaluated. Efficiency of bigram models for the speaker recognition was assessed. The results showed that in speech the prosody rhythm carries valuable speaker specific information. Appropriate numbers of quantization levels in relation to segments' duration was determined.