PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!
  • Sesja wygasła!
  • Sesja wygasła!
Tytuł artykułu

Poprawa obiektywnych wskaźników jakości mowy w warunkach hałasu

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
A study on improving objective quality indicators of speech utterances in noise conditions
Konferencja
XXVIII cykl seminarów zorganizowanych przez PTETiS Oddział w Gdańsku ZASTOSOWANIE KOMPUTERÓW W NAUCE I TECHNICE 2018 (XXVIII; 2018; Gdańsk, Polska)
Języki publikacji
PL
Abstrakty
PL
Celem pracy jest modyfikacja sygnału mowy, aby uzyskać zwiększenie poprawy obiektywnych wskaźników jakości mowy po zmiksowaniu sygnału użytecznego z szumem bądź z sygnałem zakłócającym. Wykonane modyfikacje sygnału bazują na cechach mowy lombardzkiej, a w szczególności na efekcie podniesienia częstotliwości podstawowej F0. Sesja nagraniowa obejmowała zestawy słów i zdań w języku polskim, nagrane w warunkach ciszy, jak również w obecności sygnałów zakłócających, tj. szumu różowego oraz tzw. gwaru (ang. babble speech), określanego też jako efekt „cocktail-party”. W ramach badań przetwarzano próbki mowy głosów męskich. W pracy wykazano, że podniesienie częstotliwości podstawowej skutkuje zwiększonymi wartościami wskaźnika jakości mowy, mierzonymi przy użyciu standardu PESQ (Perceptual Evaluation of Speech Quality).
EN
The aim of the work is to modify the speech signal in order to improve objective speech quality indicators after mixing the useful signal with noise or with an interfering signal. Modifications made to the signal are based on the characteristics of the Lombard speech, and in particular on the effect of raising the fundamental frequency F0. The recording session included sets of words and sentences in Polish, recorded in silence, as well as in the presence of interfering signals, i.e. pink noise and so-called babble speech, also referred to as the "cocktail-party" effect. As a part of the research, speech samples were processed - both sentences and words spoken by men. The study shows that raising the fundamental frequency results in increased values of the speech quality index, measured using the PESQ (Perceptual Evaluation of Speech Quality) standard.
Rocznik
Tom
Strony
45--50
Opis fizyczny
Bibliogr. 26 poz., rys., wykr., tab.
Twórcy
autor
  • Wydział Elektroniki, Telekomunikacji i Informatyki, Politechnika Gdańska
autor
  • Laboratorium Akustyki Fonicznej, Wydział Elektroniki, Telekomunikacji i Informatyki, Politechnika Gdańska
Bibliografia
  • 1. Lombard E., Le signe de l’élévation de la voix (translated from French), Ann. des Mal. l’oreille du larynx, vol. 37, no. 2, pp. 101–119, 1911.
  • 2. Lu Y., Cooke M., Speech production modifications produced by competing talkers, babble, and stationary noise, Journal of the Acoustical Society of America, 124, 2008, 3261–3275.
  • 3. Kleczkowski P., Żak A., Król-Nowak A., Lombard Effect in Polish Speech and its Comparison in English Speech, Archives of Acoustics, vol. 42, no. 4, pp. 561–569, 2017, doi: 10.1515/aoa-2017-0060.
  • 4. Boril H., Fousek P., Höge H., Two-Stage System for Robust Neutral/Lombard Speech Recognition, Interspeech, 2007.
  • 5. Therrien A. S., Lyons J., Balasubramaniam R., Sensory Attenuation of Self-Produced Feedback: The Lombard Effect Revisited, PLoS One, vol. 7, no. 11, 2012.
  • 6. Zollinger S.A., Brumm H., The evolution of the Lombard effect: 100 years of psychoacoustic research, Behaviour, 148, 2011, 1173–1198.
  • 7. Bapineedu G., Analysis of Lombard effect speech and its application in speaker verification for imposter detection, Language Technologies Research Centre, International Institute of Information Technology.
  • 8. Lau P., The Lombard Effect as a Communicative Phenomenon, UC Berkeley Phonology Lab Annual Report, 2008.
  • 9. Junqua J.-C., Fincke S., Field K., The Lombard effect: a reflex to better communicate with others in noise, 1999 IEEE Int. Conf. Acoust. Speech, Signal Process. Proceedings. ICASSP99 (Cat. No.99CH36258), pp. 2083–2086 vol. 4, 1999.
  • 10. Whitepaper PESQ: An Introduction, Psytechnics Limited, 2001.
  • 11. Single-ended method for objective speech quality assessment in narrow-band telephony applications, ITUT Recommendation P.563, 2004.
  • 12. ITU-T. Methods for subjective determination of transmission quality. Recommendation P.800, Aug. 1996.
  • 13. ITU-T. Perceptual evaluation of speech quality (PESQ), an objective method for end-to-end speech quality assessment of narrow band telephone networks and speech codecs. Recommendation P.862, Feb. 2001.
  • 14. Nishiura T., Detection for Lombard speech with secondorder mel-frequency cepstral coefficient and spectral envelope in beginning of talking speech, The Journal of the Acoustical Society of America, 2013.
  • 15. ITU-T. Mean opinion score (MOS) terminology. Recommendation P.800.1, July 2006.
  • 16. ITU-R BS.1284: ogólne metody subiektywnej oceny jakości dźwięku.
  • 17. ITU-R BS.1116: ocena małych zniekształceń dźwięku (test ABC).
  • 18. ITU-T. Mapping function for transforming P.862 raw result scores to MOS-LQO. Recommendation P.862.1, Nov. 2003.
  • 19. Poremski T., Szymański P., Kostek B., Aparat słuchowy a alternatywne urządzenia poprawiające słyszenie, Otorynolaryngologia 2018, 17(2): 49-56, www.mediton.pl/orl.
  • 20. Marxer, R. Barker J. Alghamdi N., The impact of the Lombard effect on audio and visual speech recognition systems, Speech Communication, vol. 100, pp. 58-68, June 2018, https://doi.org/10.1016/j.specom.2018.04.006.
  • 21. Boril H., Fousek P., Sündermann D., Cerva P., Zdansky J., Lombard Speech Recognition: A Comparative Study, InterSpeech 2007.
  • 22. Boril H., Pollák P., Design and Collection of Czech Lombard Speech Database, http://www.iscaspeech.org/archive/interspeech_2005/i05_1577.html.
  • 23. Vlaj D., Kacic Z., The Influence of Lombard Effect on Speech Recognition in: Speech Technologies, Chapter 7, pp. 151-168.
  • 24. Egan J. P., Psychoacoustics of the Lombard voice response, J. Aud. Res. 12, 1972, 318–324.
  • 25. Zollinger S. A., Brumm H., The Lombard effect, Curr. Biol., vol. 21, no. 16, pp. R614–R615, 2011.
  • 26. Stowe L. M., Golob E. J. Evidence that the Lombard effect is frequency-specific in humans. The Journal of the Acoustical Society of America, 134(1):640-647, 2013, doi:10.1121/1.4807645.
Uwagi
PL
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2019).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-641a1224-8878-4fa3-b68b-f0f80f271e0b
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.