Tytuł artykułu
Treść / Zawartość
Pełne teksty:
Identyfikatory
Warianty tytułu
Selection of individual features of a speech signal using genetic algorithms
Języki publikacji
Abstrakty
W artykule przedstawiono system automatycznego rozpoznawania mówcy zaimplementowany w środowisku Matlab oraz pokazano sposoby realizacji i optymalizacji poszczególnych elementów tego systemu. Główny nacisk położono na wyselekcjonowanie cech dystynktywnych głosu mówcy z wykorzystaniem algorytmu genetycznego, który pozwala na uwzględnienie synergii cech podczas selekcji. Pokazano również wyniki optymalizacji wybranych elementów klasyfikatora, m.in. liczby rozkładów Gaussa użytych do zamodelowania każdego z głosów. Ponadto, podczas tworzenia modeli poszczególnych głosów zastosowano uniwersalny model głosów.
The paper presents an automatic speaker’s recognition system, implemented in the Matlab environment, and demonstrates how to achieve and optimize various elements of the system. The main emphasis was put on features selection of a speech signal using a genetic algorithm which takes into account synergy of features. The results of optimization of selected elements of a classifier have been also shown, including the number of Gaussian distributions used to model each of the voices. In addition, for creating voice models, a universal voice model has been used.
Czasopismo
Rocznik
Tom
Strony
147--158
Opis fizyczny
Bibliogr. 9 poz., tab., wykr.
Twórcy
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki, Instytut Systemów Elektronicznych, 00-908 Warszawa, ul. gen. S. Kaliskiego 2
Bibliografia
- [1] Osowski S., Metody i narzędzia eksploracji danych, BTC, Legionowo, 2013.
- [2] Garofolo J.S. et al., TIMIT Acoustic-Phonetic Continuous Speech Corpus LDC93S1, Linguistic Data Consortium, Philadelphia, 1993.
- [3] Martin A., Przybocki M., 2002 NIST Speaker Recognition Evaluation LDC2004S04, Linguistic Data Consortium, Philadelphia, 2004.
- [4] Brookes M., VOICEBOX: Speech Processing Toolbox for MATLAB, http://www.ee.ic.ac.uk/np/staff/dmb/voicebox/voicebox.html, 2002.
- [5] Kamiński K., Majda E., Dobrowolski A.P., Automatic speaker recognition using Gaussian Mixture Models, 17th IEEESPAConference, 2013, 220-225.
- [6] Dobrowolski A.P., Majda E., Cepstral analysis in the speakers recognition systems, 15th IEEESPAConference, 2011, 85-90.
- [7] Ludwig O., Nunes U., Novel Maximum-Margin Training Algorithms for Supervised Neural Networks, IEEETransactions on Neural Networks, t. 21, nr 6, 2010, 972-984.
- [8] Reynolds D.A., Quatieri T.F., Dunn R.B., Speaker Verification Using Adapted Gaussian Mixture Models, Digital Signal Processing, nr 10, 2000, 19-41.
- [9] Goldberg D.E., Algorytmy genetyczne i ich zastosowanie, WNT, Warszawa, 2003.
Uwagi
PL
2. Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ad45d219-e0f7-48e2-8c0f-375aa5f16c89