PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Audio features for speech detection in adverse conditions

Autorzy
Identyfikatory
Warianty tytułu
PL
Cechy akustyczne dedykowane wykrywaniu mowy w niesprzyjających warunkach
Języki publikacji
EN
Abstrakty
EN
The paper presents an analysis of the audio features for speech processing systems, where speech signal is contaminated by background noise. To determine robustness of speech features for different audio environments, a comparison between feature contours in clean and noisy conditions using mean-square error criterion was performed. The obtained results have been exploited to simple, low-complexity speech detection algorithm. Experimental results show that accurate determination of speech regions is highly dependent on recording conditions and speaker characteristics. However, such approach is suitable for automatic detection of sentence boundaries for speech processing systems.
PL
W pracy przedstawiono analizę cech wykorzystywanych w systemach przetwarzania sygnału mowy w kontekście jego detekcji w niekorzystnych warunkach rejestracji. W wyniku przeprowadzonej analizy określono zbiór cech, których kontury ulegają najmniejszym zniekształceniom na podstawie pomiaru błędu średniokwadratowego dla sygnału bez zakłóceń i zdegradowanego. Z użyciem tych cech zaproponowano prosty algorytm detekcji sygnału mowy o niskiej złożoności. Wyniki przeprowadzonych badań pokazują, że określenie dokładnych granic poszczególnych słów jest ściśle uzależnione od warunków akwizycji oraz rodzaju mówcy. Pomimo tego, proponowane podeście umożliwia określenie w sposób automatyczny granic wypowiedzi w systemach przetwarzania sygnału mowy.
Rocznik
Strony
38--40
Opis fizyczny
Bibliogr. 13 poz., wykr.
Twórcy
autor
  • West Pomeranian University of Technology, Szczecin
Bibliografia
  • [1] Moatar M., Homayounpour M.: A Simple But Efficient Real-Time Voice Detection Algorithm. 17th European Signal Processing Conference-EUSIPCO'09, Glasgow, Scotland, 2009.
  • [2] Hu Y., Loizou P.: Subjective Evaluation and Comparison of Speech Enhancement Algorithms. Speech Communication, 49, pp. 588-601, 2007.
  • [3] Peinado A., Segura J.: Speech Recognition Over Digital Channels-Robustness and Standards. John Wiley & Sons, 2006
  • [4] Al-Shoshan A. I.: Speech and Music Classification and Separation: A Review, J. King Saud Univ., Eng. Sci., vol. 19 (1), pp. 95-133, Riyadh, 2006.
  • [5] Cournapeau D., Kawahara T.: Evaluation of Real-time Voice Activity Detection based on High Order Statistics. Proc. Interspech 2007, pp. 2945-2948, 2007.
  • [6] Ding H., Yamamoto K., Akamine M.: Comparative Evaluation of Different Methods for Voice Activity Detection. Proc. Interspeech 2008, pp. 107-110,2008.
  • [7] Shafiee S., Almasganj F., Jafari A.: Speech/Non-Speech Segments Detection Based On Chaotic and Prosodic Features. Proc. Interspeech 2008, pp. 111-114, 2008.
  • [8] Tian Y., Wang Z., Lu D.: Nonspeech segment rejection based on prosodic information for robust speech recognition. IEEE Signal Processing Letters, vol. 9, issue 11, pp. 364-367, 2002. |
  • [9] Kondoz A. M.: Digital Speech-Coding for Low Bit Rate Communication Systems. John Wiley & Sons, Ltd., 2004.
  • [10] Jabloun F., Cetin A.: The Teager Enargy Based Feature Parameters for Robust Speech Recognition. IEEE International Conference on Acoustics, Speech, and Signal Processing CASSP'99, 1999.
  • [11] Krimphoff J., McAdams S., Winsberg S.: Characterization of the timbre of complex sounds. 2. Acoustic analysis and psychophysical quantification. J. de Physique, 4 (C5), pp. 625-628, 1994.
  • [12] Hanna P., Louis N., Desainte-catherine M., Benois-pineau J., Labri S.,: Audio Features for Noisy Sound Segmentation. ISMIR'04 Conference, Barcelona, Spain, 2004.
  • [13] Bessette В., Lefebvre R., Salami R.: Universal Speech/Audio Coding Using Hybrid ACELP/TCX Techniques. IEEE Int. Conf. On Acoustics, Speech and Signal Processing: ICASSP'05, 2005.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAW-0004-0006
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.