Acoustic source localization system for speech signals based on five microphone array was developed. Three dimensional position computation is based on time delay estimation between pairs of microphones. The psyhoacoustically motivated voice activity detector was used to robustly determine activity of speaker in presence of background noise. The detector was based on modulation properties of human speech. Good performance was obtain by selecting frames with speech and nulling frequency bands without speech components. As the result more precisely computation of the time delay was possible. Real experiments shown good immunity of the proposed algorithm to noise and reverberation.
PL
Opracowano metodę lokalizacji akustycznych źródeł dźwięku zorientowaną na sygnału mowy. System zbudowano w oparciu o macierz pięciu mikrofonów. Obliczenia pozycji źródła w trzech wymiarach dokonano na podstawie estymacji różnicy czasu przybycia dla par mikrofonów. Zastosowany psychoakustycznie motywowany detektor mowy umożliwia ocenę aktywności mówcy w obecności zakłóceń. Dobrą efektywność uzyskano poprzez selekcję ramek z mową oraz zerowanie zakresów częstotliwości w których sygnał zakłócający maskuje sygnał mowy. Jego zaletą jest możliwość precyzyjnego obliczania czasu opóźnienia. Eksperymenty w warunkach rzeczywistych pokazują dobrą odporność zaproponowanego algorytmu na szum i pogłos.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.