PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Porównanie działania metod YIN i MAWT w estymacji tonu krtaniowego mowy zaburzonej

Autorzy
Identyfikatory
Warianty tytułu
EN
A comparison of YIN and MAWT algorithms for pitch detection of disordered speech signals
Języki publikacji
PL
Abstrakty
PL
W pracy przedstawiono i dokonano porównania dwóch metod estymacji tonu krtaniowego, YIN i MAWT, ze szczególnym uwzględnieniem tych cech, które mają znaczenie w przetwarzaniu mowy zaburzonej. Algorytmy zaimplementowane w środowisku MATLAB poddano testom za pomocą odpowiednio dobranych nagrań mowy zaburzonej i niezaburzonej. Niniejsza praca zawiera wyniki tych testów oraz sporządzoną na ich podstawie analizę porównawczą. Skróty LPC liniowe kodowanie predykcyjne (ang. Linear Predictive Coding) MAWT (ang. Multi-feature, Autocorrelation and Wavelet Technique) PDA algorytm estymacji częstotliwości podstawowej (ang. Pitch Detection Algorithm) RMS błąd średni kwadratowy (ang. Root Mean Square) STE krótkookresowa energia sygnału (ang. Short-Time Energy) ZCR liczba przejść sygnału przez zero (ang. Zero Crossing Rate)
EN
In this paper two methods of pitch detection of the vocal tone, YIN and MAWT, have been described and com-pared. All the factors, that are important while using the algorithms for disordered speech, have been taken into particular consideration. Implemented in the MATLAB environment algorithms have been tested with appropriately chosen speech recordings. The results of these tests, as well as the comparative analysis of the two algorithms, have been presented in this work.
Twórcy
autor
  • Katedra Systemów Multimedialnych, Politechnika Gdańska
Bibliografia
  • [1] Rabiner L, Cheng M.J., Rosenberg A.E., McGonegal C.A.: A comparative performance study of several pitch detection algorithms. W: IEEE Trans. on ASSP, 24, 5, 399-418, October 1976.
  • [2] Cheveigne A., Kawahara H.: YIN, a fundamental frequency estimator for speech and music. W: JASA, 111,4, 1917-1930, April 2002.
  • [3] Charalampidis D., Kura V.B.: Novel wavelet-based pitch estimation and segmentation of non-stationary speech. W: Proc. 7ili International Conference on Information Fusion, 2, 1383-1387, 25-28 July 2005.
  • [4] Barnwell T.P.: Recursive windowing for generating autocorrelation coefficients for LPC analysis. W: IEEE Trans. on ASSP, 29, 5, 1062-1066, October 1981
  • [5] Kadambe S., Boureaux-Bartels G.F.: A comparison of a wavelet functions for pitch detection of speech signals. W: International Conference on ASSP, 1,449-452, 14-17 April 1991.
  • [6] Boudraa M., Boudraa B., Sayoud H., Guerin B.: Post-processing in PDAs in corrupted speech. W: Proc. of the 30th Southeastern Symposium on System Theory, 329-333,8-10 March 1998.
  • [7] Kasi K., Zahorian S.: Yet another algorithm for pitch tracking. W: International Conference on ASSP, 1, 361-364, Orlando, Florida, 13-17 May 2002.
  • [8] Quatieri T.F.: Discrete-time speech signal processing. W: Principles and practice, Prentice Hall PTR, Upper Saddle River 2002.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG5-0028-0038
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.