W artykule przedstawiono eksperymentalne urządzenie do śledzenia poruszającego się mówcy. Urządzenie wykorzystuje informację audio-wideo uzyskaną z kamery i mikrofonów. W obrazie z kamery wykrywana jest twarz i jej położenie. Dwie pary mikrofonów pozwalają na estymację kierunku nadejścia dźwięku przy użyciu uogólnionej metody korelacji wzajemnej. W artykule przedstawiono wyniki eksperymentów.
EN
In this paper an audio-video system for tracking of a moving speaker is reported. The system utilizes audio visual information acquired from a camera and microphones. Using the camera a face of the speaker is detected. Two pairs of microphones allow for estimation of direction of sound arrival using general cross-correlation method. The results of experiments are described.
The paper presents issues of time-delay estimation with application to the direction of sound arrival discovering. During the estimation of the time-delay from a voice signal propagated in room acoustic a significant number of false results occur. In order to reduce the number of false estimates the averaging of cross-correlation functions is proposed. The result of the experiment in an office room shows that the direction of the voice arrival can be estimated much more precisely.
PL
Poznań University of Technology, Chair of Control and Systems Engineering Politechnika Poznańska, Katedra Sterowania i Inżynierii Systemów. Artykuł prezentuje zagadnienie estymacji czasu opóźnienia w zastosowaniu do określania kierunku nadejścia dźwięku. Estymacja czasu opóźnienia występującego w sygnale mowy propagowanym w pomieszczeniu dostarcza znaczącą liczbę fałszywych wyników. W celu redukcji liczby błędnych estymat zaproponowano uśrednianie funkcji korelacji wzajemnej. Wynik eksperymentu w pomieszczeniu biurowym pokazuje, że uzyskana dokładność estymacji kierunku nadejścia dźwięku mówcy jest znacznie lepsza.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.