PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Properties of feature contours for audio classification tasks

Autorzy
Identyfikatory
Warianty tytułu
PL
Właściwości konturów cech w zadaniach klasyfikacji sygnałów akustycznych
Języki publikacji
EN
Abstrakty
EN
A technique for classifying audio segments based on properties of feature contours is described. The proposed approach uses a simple method utilizing peaks detection procedure with adaptive thresholding and fusion of contours attributes. It is possible to determine the signal class based on statistical analysis of the distances set between peaks for selected feature contours. In order to validate presented method, results analysis of feature contours along with decision function was applied to the discrimination problem between speech and music signals. In the result, obtained classification accuracy was 98% for the considered test set.
PL
W pracy przedstawiono technikę pozwalającą na określanie klasy sygnału dźwiękowego poprzez wykorzystanie właściwości konturów cech. W zaproponowanym podejściu zastosowano wykrywanie pików w konturach przy użyciu zmiennego progu decyzyjnego oraz fuzji atrybutów konturów. Na podstawie analizy statystycznej uzyskanego zbioru odległości między pikami dla określonych konturów cech, możliwe jest określenie klasy sygnału. W celu weryfikacji prezentowanego podejścia przedstawiono zastosowanie wyników analizy konturów cech oraz funkcji decyzyjnej pozwalające w efektywny sposób (z dokładnością 98% dla użytego zbioru testowego) dokonywać klasyfikacji segmentów dźwiękowych zawierających mowę oraz muzykę.
Rocznik
Strony
134--136
Opis fizyczny
Bibliogr. 12 poz., tab., wykr.
Twórcy
autor
  • Zachodniopomorski Uniwersytet Technologiczny w Szczecinie
Bibliografia
  • [1] Thiran J., Marques F., Bourlard H.: Multimodal Signal Processing - Theory and Applications for Human-Computer Interaction. Academic Press, 2010.
  • [2] Hanna P., et. al.: Audio Features for Noisy Sound Segmentation. ISMIR'04 Conference, Barcelona, Spain, 2004.
  • [3] Aggarwal C.: On classification and segmentation of massive audio data streams. Knowledge Information Systems, 20, Springer-Verlag, 2009, pp. 137-156.
  • [4] Pachet F., Roy P.: Exploring Billions of Audio Features, CBMI'07, Bordeaux, 2007.
  • [5] Kim H., Moreau N., Sikora T.: MPEG-7 Audio and Beyond. John Wiley & Sons, Ltd., 2005.
  • [6] Al-Shoshan A.: Speech and Music Classification and Separation: A Review, J. King Saud Univ., Eng. Sci., vol. 19 (1), Riyadh, 2006, pp. 95-133.
  • [7] Rabaoui A., et. al.: Using Robust Features with Multi-Class SVMs to Classify Noisy Sounds. ISCCSP'08, Malta, 2008.
  • [8] Zibert J., Brodnik A., Michelic F.: An adaptive BIC approach for robust audio segmentation. Interspeech, Brighton, 2009.
  • [9] Schutte K., Glass J.: Features and Classifiers for Robust Automatic Speech Recognition, Research Abstracts, Research Project. MIT CSAIL Publications and digital archives, 2007.
  • [10] Tian Y., Wang Z., Lu D.: Nonspeech segment rejection based on prosodic information for robust speech recognition. IEEE Signal Processing Letters, vol. 9, issue 11, 2002, pp. 364-367.
  • [11] Kondoz A.: Digital Speech - Coding for Low Bit Rate Communication Systems. John Wiley & Sons, Ltd., 2004.
  • [12] Krimphoff J., McAdams S., Winsberg S.: Characterization of the timbre of complex sounds. 2. Acoustic analysis and psychophysical quantification. J. de Physique, 4(C5), 1994, pp. 625-628.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAN-0007-0055
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.