Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych

Kamiński, K.; Dobrowolski, A. P.; Majda-Zdancewicz, E.

doi:10.5604/12345865.1197999

Artykuł - szczegóły

Tytuł artykułu

Selekcja cech osobniczych sygnału mowy z wykorzystaniem algorytmów genetycznych

Autorzy

Kamiński K. , Dobrowolski A. P. , Majda-Zdancewicz E.

Treść / Zawartość

Pełne teksty:

Pobierz

Identyfikatory

DOI

10.5604/12345865.1197999

Warianty tytułu

Selection of individual features of a speech signal using genetic algorithms

Języki publikacji

Abstrakty

W artykule przedstawiono system automatycznego rozpoznawania mówcy zaimplementowany w środowisku Matlab oraz pokazano sposoby realizacji i optymalizacji poszczególnych elementów tego systemu. Główny nacisk położono na wyselekcjonowanie cech dystynktywnych głosu mówcy z wykorzystaniem algorytmu genetycznego, który pozwala na uwzględnienie synergii cech podczas selekcji. Pokazano również wyniki optymalizacji wybranych elementów klasyfikatora, m.in. liczby rozkładów Gaussa użytych do zamodelowania każdego z głosów. Ponadto, podczas tworzenia modeli poszczególnych głosów zastosowano uniwersalny model głosów.

The paper presents an automatic speaker’s recognition system, implemented in the Matlab environment, and demonstrates how to achieve and optimize various elements of the system. The main emphasis was put on features selection of a speech signal using a genetic algorithm which takes into account synergy of features. The results of optimization of selected elements of a classifier have been also shown, including the number of Gaussian distributions used to model each of the voices. In addition, for creating voice models, a universal voice model has been used.

Słowa kluczowe

biometria rozpoznawanie mówcy automatyczne algorytmy genetyczne selekcja cech

biometrics automatic speaker recognition genetic algorithms feature selection

Wydawca

Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego

Czasopismo

Biuletyn Wojskowej Akademii Technicznej

Rocznik

2016

Tom

Vol. 65, nr 1

Strony

147--158

Opis fizyczny

Bibliogr. 9 poz., tab., wykr.

Twórcy

autor

Kamiński K.

kkw.kaminski@gmail.com.

Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2

autor

Dobrowolski A. P.

Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2

autor

Majda-Zdancewicz E.

Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2

Bibliografia

[1] Osowski S., Metody i narzędzia eksploracji danych, BTC, Legionowo, 2013.
[2] Garofolo J.S. et al., TIMIT Acoustic-Phonetic Continuous Speech Corpus LDC93S1, Linguistic Data Consortium, Philadelphia, 1993.
[3] Martin A., Przybocki M., 2002 NIST Speaker Recognition Evaluation LDC2004S04, Linguistic Data Consortium, Philadelphia, 2004.
[4] Brookes M., VOICEBOX: Speech Processing Toolbox for MATLAB, http://www.ee.ic.ac.uk/np/staff/dmb/voicebox/voicebox.html, 2002.
[5] Kamiński K., Majda E., Dobrowolski A.P., Automatic speaker recognition using Gaussian Mixture Models, 17th IEEESPAConference, 2013, 220-225.
[6] Dobrowolski A.P., Majda E., Cepstral analysis in the speakers recognition systems, 15th IEEESPAConference, 2011, 85-90.
[7] Ludwig O., Nunes U., Novel Maximum-Margin Training Algorithms for Supervised Neural Networks, IEEETransactions on Neural Networks, t. 21, nr 6, 2010, 972-984.
[8] Reynolds D.A., Quatieri T.F., Dunn R.B., Speaker Verification Using Adapted Gaussian Mixture Models, Digital Signal Processing, nr 10, 2000, 19-41.
[9] Goldberg D.E., Algorytmy genetyczne i ich zastosowanie, WNT, Warszawa, 2003.

Uwagi

2. Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-ad45d219-e0f7-48e2-8c0f-375aa5f16c89