PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Passive sound source localization system

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Pasywny system lokalizacji źródeł dźwięku
Języki publikacji
EN
Abstrakty
EN
Acoustic source localization system for speech signals based on five microphone array was developed. Three dimensional position computation is based on time delay estimation between pairs of microphones. The psyhoacoustically motivated voice activity detector was used to robustly determine activity of speaker in presence of background noise. The detector was based on modulation properties of human speech. Good performance was obtain by selecting frames with speech and nulling frequency bands without speech components. As the result more precisely computation of the time delay was possible. Real experiments shown good immunity of the proposed algorithm to noise and reverberation.
PL
Opracowano metodę lokalizacji akustycznych źródeł dźwięku zorientowaną na sygnału mowy. System zbudowano w oparciu o macierz pięciu mikrofonów. Obliczenia pozycji źródła w trzech wymiarach dokonano na podstawie estymacji różnicy czasu przybycia dla par mikrofonów. Zastosowany psychoakustycznie motywowany detektor mowy umożliwia ocenę aktywności mówcy w obecności zakłóceń. Dobrą efektywność uzyskano poprzez selekcję ramek z mową oraz zerowanie zakresów częstotliwości w których sygnał zakłócający maskuje sygnał mowy. Jego zaletą jest możliwość precyzyjnego obliczania czasu opóźnienia. Eksperymenty w warunkach rzeczywistych pokazują dobrą odporność zaproponowanego algorytmu na szum i pogłos.
Rocznik
Tom
Strony
5--16
Opis fizyczny
Bibliogr. 14 poz., rys., tab., wykr.
Twórcy
autor
  • Bialystok University of Technology, Faculty of Computer Science, Białystok, Poland
Bibliografia
  • [1] Baszun J., Voice Activity Detection for Speaker Verification Systems. Joint Rougth Set Symposium, Toronto, Canada, (14-16 May, 2007), 181–186.
  • [2] Benesty J., Chen J., Huang Y., Microphone Array Signal Processing, Springer Topics in Signal Processing Series, Vol. 1, Springer-Verlag, 2010.
  • [3] Brutti A.B., Omologo M., Svaizer P., Comparision Between Different Sound Localization Techniques Based on a Real Data Collection IEEE HSCMA, (2008), 69–72.
  • [4] Carter C.G., Nuttal A.H., Cable P.G., The Smoothed Coherence Transform, Proc. IEEE (Letter), Vol. 61, (Oct. 1973), 1497–1498.
  • [5] Dmochowski J.P., Benesty J., Affes S., A Generalized Steered Response Power Method for Computationally Viable Source Localization, Audio, Speech and Language Processing, IEEE Trans. on, Vol. 15, I. 8, (Nov. 2007), 2510–2526.
  • [6] Elhilali M., Chi T., Shamma S., A Spectro-temporal Modulation Index (STMI) for Assesment of Speech Intelligibility. Speech Communication, Vol. 41. (2003), 331–348. 15 Jarosław Baszun
  • [7] El-Maleh K., Kabal P., Comparision of Voice Activity Detection Algorithms for Wireless Personal Communications Systems. Proc. IEEE Canadian Conference Electrical and Computer Engineering, (May 1997), 470–473.
  • [8] Houtgast T., Steeneken H.J.M., A Review of the MTF Concept in Room Acoustics and its Use for Estimating Speech Intelligibility in Auditoria. J. Acoust. Soc. Am., Vol. 77, No. 3 (Mar. 1985), 1069–1077.
  • [9] Huang Y.A., Benesty J., (Eds.), Audio Signal Processing for Next Generation Multimedia Communication Systems, Kluwer Academic Publishers, 2004.
  • [10] Knapp C.H., Carter C., The Generalized Correlation Method for Estimation of Time Delay, IEEE Transaction on Acoustics, Speech, And Signal Processing, Vol. ASSP-24, No. 4 (Aug. 1976), 320–327.
  • [11] Mesgarani N., Shamma S., Slaney M., Speech Discrimination Based on Multiscale Spectro-Temporal Modulations. ICASSP, (2004), 601–604.
  • [12] Moghaddam P.P., Amindavar H., Kirlin R.L., A New Time-Delay Estimation in Multipath, IEEE Transaction on Signal Processing, Vol. 51, (May 2003), 1129–1142.
  • [13] Sovka P., Pollak P., The Study of Speech/Pause Detectors for Speech Enhancement Methods. Proc. of the 4th European Conference on Speech Communication and Technology, Madrid, Spain (Sep. 1994), 1575–1578.
  • [14] Wang H., Chu P., Voice Source Localization for Automatic Camera Pointing System in Videoconferencing Proc. IEEE ASSP Workshop Applications on Signal Processing Audio Acoustics, (Oct. 1997), 1497–1498.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPB1-0051-0001
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.