Properties of feature contours for audio classification tasks

Mąka, T.

Artykuł - szczegóły

Tytuł artykułu

Properties of feature contours for audio classification tasks

Autorzy

Mąka T.

Identyfikatory

Warianty tytułu

Właściwości konturów cech w zadaniach klasyfikacji sygnałów akustycznych

Języki publikacji

Abstrakty

A technique for classifying audio segments based on properties of feature contours is described. The proposed approach uses a simple method utilizing peaks detection procedure with adaptive thresholding and fusion of contours attributes. It is possible to determine the signal class based on statistical analysis of the distances set between peaks for selected feature contours. In order to validate presented method, results analysis of feature contours along with decision function was applied to the discrimination problem between speech and music signals. In the result, obtained classification accuracy was 98% for the considered test set.

W pracy przedstawiono technikę pozwalającą na określanie klasy sygnału dźwiękowego poprzez wykorzystanie właściwości konturów cech. W zaproponowanym podejściu zastosowano wykrywanie pików w konturach przy użyciu zmiennego progu decyzyjnego oraz fuzji atrybutów konturów. Na podstawie analizy statystycznej uzyskanego zbioru odległości między pikami dla określonych konturów cech, możliwe jest określenie klasy sygnału. W celu weryfikacji prezentowanego podejścia przedstawiono zastosowanie wyników analizy konturów cech oraz funkcji decyzyjnej pozwalające w efektywny sposób (z dokładnością 98% dla użytego zbioru testowego) dokonywać klasyfikacji segmentów dźwiękowych zawierających mowę oraz muzykę.

Słowa kluczowe

feature contours peaks detection audio classification

kontury cech wykrywanie pików klasyfikacja akustyczna

Wydawca

Wydawnictwo SIGMA-NOT

Czasopismo

Elektronika : konstrukcje, technologie, zastosowania

Rocznik

2010

Tom

Vol. 51, nr 11

Strony

134--136

Opis fizyczny

Bibliogr. 12 poz., tab., wykr.

Twórcy

autor

Mąka T.

Zachodniopomorski Uniwersytet Technologiczny w Szczecinie

Bibliografia

[1] Thiran J., Marques F., Bourlard H.: Multimodal Signal Processing - Theory and Applications for Human-Computer Interaction. Academic Press, 2010.
[2] Hanna P., et. al.: Audio Features for Noisy Sound Segmentation. ISMIR'04 Conference, Barcelona, Spain, 2004.
[3] Aggarwal C.: On classification and segmentation of massive audio data streams. Knowledge Information Systems, 20, Springer-Verlag, 2009, pp. 137-156.
[4] Pachet F., Roy P.: Exploring Billions of Audio Features, CBMI'07, Bordeaux, 2007.
[5] Kim H., Moreau N., Sikora T.: MPEG-7 Audio and Beyond. John Wiley & Sons, Ltd., 2005.
[6] Al-Shoshan A.: Speech and Music Classification and Separation: A Review, J. King Saud Univ., Eng. Sci., vol. 19 (1), Riyadh, 2006, pp. 95-133.
[7] Rabaoui A., et. al.: Using Robust Features with Multi-Class SVMs to Classify Noisy Sounds. ISCCSP'08, Malta, 2008.
[8] Zibert J., Brodnik A., Michelic F.: An adaptive BIC approach for robust audio segmentation. Interspeech, Brighton, 2009.
[9] Schutte K., Glass J.: Features and Classifiers for Robust Automatic Speech Recognition, Research Abstracts, Research Project. MIT CSAIL Publications and digital archives, 2007.
[10] Tian Y., Wang Z., Lu D.: Nonspeech segment rejection based on prosodic information for robust speech recognition. IEEE Signal Processing Letters, vol. 9, issue 11, 2002, pp. 364-367.
[11] Kondoz A.: Digital Speech - Coding for Low Bit Rate Communication Systems. John Wiley & Sons, Ltd., 2004.
[12] Krimphoff J., McAdams S., Winsberg S.: Characterization of the timbre of complex sounds. 2. Acoustic analysis and psychophysical quantification. J. de Physique, 4(C5), 1994, pp. 625-628.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BWAN-0007-0055