PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Fast speaker recognition based on short Polish sequences

Identyfikatory
Warianty tytułu
PL
Szybkie rozpoznawanie mówcy na podstawie krótkich wypowiedzi w języku polskim
Języki publikacji
EN
Abstrakty
EN
This paper presents results of speaker recognition experiments using short Polish sentences. We developed and analyzed various parameters in speech signal modeling in order to first maximize identification effectiveness and second to compare VQ (vector quantization) and GMM (Gaussian mixture model) approaches. For the research and experiments we created and exploited a database, containing specially prepared short Polish speech sequences typical for emergency phone calls.
PL
Artykuł prezentuje wyniki badań nad rozpoznawaniem mówcy na podstawie krótkich wypowiedzi w języku polskim. Przeanalizowano dobór parametrów modelowania sygnału mowy w celu maksymalizacji skuteczności identyfikacji oraz porównania rozwiązań wykorzystujących kwantyzację sektorową VQ oraz sumę rozkładów normalnych GMM. Do badań eksperymentalnych utworzono i wykorzystano przygotowaną przez autorów bazę nagrań zawierającą specjalnie dobrane krótkie wypowiedzi w języku polskim, typowe dla rozmów telefonicznych na numery alarmowe.
Rocznik
Strony
103--105
Opis fizyczny
Bibliogr. 16 poz., wykr.
Twórcy
autor
autor
autor
  • Poznań University of Technology, Chair of control and System Engineering, Division of Signal Processing Electronic Systems
Bibliografia
  • [1] Govindaraju V.: Advances in Biometrics - Sensors, Algorithms and Systems. Springer-Verlag London Limited 2008.
  • [2] Dąbrowski A., Marciniak T., Drgas Sz., Pawłowski P.: Ekstrakcja informacji z obrazów, wideo i mowy w systemach ochrony i bezpieczeństwa. Rozdział w monografii Ergonomia - Technika i Technologia - Zarządzanie, red. Marek Fertsch, ss. 151-167, Wydawnictwo Politechniki Poznańskiej, Poznań 2009.
  • [3] Biometrics Market and industry Report 2009-2014, http://www.biometricgroup.com/reports/public/market_report.php.
  • [4] O'Shaughnessy D.: Speech Communications: Human and Machine. Wiley-IEEE Press, 2000.
  • [5] Furui S.: Digital Speech Processing, Synthesis, and Recognition, Second Edition, Revised and Expanded. Marcel Dekker, Inc., New York, 2001.
  • [6] Furui S.: Speaker recognition. Scholarpedia (2008), http://www.scholarpedia.org/wiki/index.php?title=Speaker_recognition&printable=yes
  • [7] Reynolds D.: Robust text-independent speaker identification using Gaussian Mixture Speaker Models, IEEE Trans. Speech Audio Proc. Vol. 3, No. 1. 1995.
  • [8] Oppenheim A. V., Shafer R. W.: From Frequency to Quefrency: A History of the Cepstrum, IEEE Signal Processing Mag., pp. 95-99, Sep. 2000.
  • [9] Keshet J., Bengio S.: Automatic Speech and Speaker Recognition: Large Margin and Kernel Methods. John Wiley & Sons, 2009.
  • [10] DSP Mini-Project: An Automatic Speaker Recognition System http://www.ifp.uiuc.edu/~minhdo/teaching/speaker_recognition. R. Chassaing, Digitai Signal Processing and Applications with the TMS320C6713 and TMS320C6416 DSK Second Edition, John Wiley & Sons, Inc., 2008.
  • [11] Linde Y., Buzo A., Gray R. M.: An algorithm for vector quantizer design, IEEE Trans. Commun., vol. COM-28, no. 1, pp. 84-95, Jan. 1980.
  • [12] Marciniak T, Dąbrowski A.: Influence of subband signal denoising for voice activity detection, Elektronika - konstrukcje, technologie, zastosowania, nr 3/2009, ss. 67-70.
  • [13] Dempster A., Laird N., Rubin D.: „Maximum likelihood from incomplete data via the EM algorithm", Journal of the Royal Statisticai Society, Series B, 39(1):1-38, 1977.
  • [14] Alexander A., Drygajlo A.: Speaker identification: A demonstration using Matlab,  http://scgwww.epfl.ch/matlab/student_labs/2005/labs/.
  • [15] VOICEBOX: Speech Processing Toolbox for Matlab http://www.ee.ic.ac.uk/hp/staff/dmb/voicebox/voicebox.html.
  • [16] Weychan R., Marciniak T., Dąbrowski A.: „Akwizycja i parametryzacja sygnału mowy w czasie rzeczywistym z zastosowaniem pakietu Target Support Package TC6", VII Sympozjum MiS, materiały konferencyjne, ss. 185-188.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAK-0024-0019
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.