PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

System automatycznego rozpoznawania mówcy z wykorzystaniem techniki cepstralnej i modeli mieszanin gaussowskich

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
EN
Automatic speaker recognition system using cepstral technique and Gaussian Mixture Models
Języki publikacji
PL
Abstrakty
PL
W niniejszym artykule zaprezentowano zaimplementowany w środowisku Matlab system automatycznego rozpoznawania mówcy, wykorzystujący do opisu głosu unikatowy wektor cech, tzw. „odcisk głosu” (VP – ang. Voice Print). System używa w procesie klasyfikacji tzw. modele mieszanin Gaussowskich (GMM – ang. Gaussian Mixture Model). W końcowej części artykułu przedstawione są badania skuteczności rozpoznawania mówców dla różnych wariantów systemu oraz w różnych konfiguracjach jego parametrów.
EN
The paper discusses the system of automatic speaker recognition, implemented in Matlab environment and using a unique vector of features, the so-called voice print (VP) for voice description. The system uses the so-called Gaussian Mixture Models (GMM) for the classification process. The final section of the paper presents the studies on the efficiency of speaker recognition for various system versions and for different system parameter configurations.
Rocznik
Strony
83--93
Opis fizyczny
Bibliogr. 17 poz., rys., wykr.
Twórcy
autor
  • Wojskowa Akademia Techniczna, Wydział Elektroniki
  • Wojskowa Akademia Techniczna, Wydział Elektroniki
Bibliografia
  • [1] Ciota Z., Metody przetwarzania sygnałów akustycznych w komputerowej analizie mowy, Exit (2010)
  • [2] Dobrowolski A., Majda E., Cepstral analysis in the speakers recognition systems, 15th IEEE SPA Conference, Poznań (2011), 85-90
  • [3] Dobrowolski A., Majda E., Application of homomorphic methods of speech signal processing in speakers recognition system, Przegląd Elektrotechniczny, 88 (2012), nr 6, 12-16
  • [4] Feng L., Speaker recognition, Kgs. Lynby, (2004)
  • [5] Ferras M., Leung C., Barras C., Gauvain J. L., Comparison of Speaker Adaptation Methods as Feature Extraction for SVM-Based Speaker Recognition, IEEE Transactions on Audio, Speech, and Language Processing, 18 (2010), nr 6, 1366-1378
  • [6] Kamiński K., Implementacja systemu identyfikacji słów izolowanych przy zastosowaniu modeli mikstur Gaussowskich, Zeszyty Naukowe WETI PG, (2012), nr 20, 111-119
  • [7] Kamiński K., Wojtuń J., Piotrowski Z., Subscriber authentication using GMM and TMS320C6713DSP, Przegląd Elektrotechniczny, 88 (2012) nr 12a, 127-130
  • [8] Kasprzak W., Rozpoznawanie obrazów i sygnałów mowy, OWPW, (2009)
  • [9] Kinnunen T., Li H., An overview of text-independent speaker recognition: From feature to supervectors, Speech Communication, 2010, 12-40
  • [10] Kwiatkowski W., Metody automatycznego rozpoznawania wzorców, Wydawnictwo WAT, (2001)
  • [11] Ming J., Hazen T., Glass J. R., Reynolds D. A., Robust Speaker Recognition In Noisy Conditions, IEEE Transactions on Audio, Speech, and Language Processing, 15 (2007), nr 5, 1711-1723
  • [12] Rabiner L., Juang B. H., Fundamentals of speech recognition, PTR Prentice-Hall, (1993)
  • [13] Reynolds D., Gaussian Mixture Models, MIT Lincoln Laboratory, (2007)
  • [14] Tadeusiewicz Z., Sygnał mowy, WKŁ, (1988)
  • [15] Tran D., Wagner M., Fuzzy Gaussian Mixture Models for Speaker Recognition, University of Canberra, (2006)
  • [16] Zhou G., Mikhael W.B., Speaker identification based on adaptive discriminative vector quantisation, Vision, Image and Signal Processing, IEEE Proceedings, 153 (2007), nr 6, 754-760
  • [17] Ziółko B. i M., Przetwarzanie mowy, Wydawnictwa AGH, (2011)
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-b1e02c55-81a9-4042-858f-87f00d27c0ea
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.