PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Powiadomienia systemowe
  • Sesja wygasła!
  • Sesja wygasła!
Tytuł artykułu

Wykorzystanie metody niejawnych modeli Markowa w automatycznej detekcji wybranych wad wymowy

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Application Hidden Markov Models to Automatic Detection of Speech Disorder
Języki publikacji
PL
Abstrakty
PL
W artykule przedstawiono wyniki badań dotyczących automatycznej detekcji wad wymowy u dzieci. Jako materiał badawczy zostały wykorzystane nagrania pochodzące od dzieci z wadami wymowy. Zadanie polegało na rozpoznaniu nieprawidłowo realizowanego fonemu w wybranych słowach testowych. Detekcja była dokonywana za pomocą metod rozpoznawania mowy, w których jako cec sygnału mowy użyto dwóch najbardziej obiecujących rodzajów cech: współczynnika MFCC praz współczynników HFCC. Jako klasyfikatora użyto metody niejawnych modeli Markowa (HMM), gdzie modelowanymi jednostkami fonetycznimi były zarówno fonemy jak i całe słowa. W badanych metodach dobrano ich parametry w celu zmaksymalizowania skuteczności rozpoznawania. W artykule zaprezentowano również analizę porównawczą wyników rozpoznawania otrzymanych z wykorzystaniem metody HMM oraz testowanej w poprzednich pracach metody nieliniowej transformacji czasowej (DTW).
EN
The results of research on automatic detection of the pathological phoneme pronunciation are presented in the paper. Speech samples came from speech impaired children and persons who imitated pathological phoneme pronunciation. The recognition task was to find wrongly realized phoneme in the selected test utterances. At the reature extraction stage the most effective features` types have been used: standard Mel-Frequency Cepstral Coefficients (MFCC) and recently proposed Human Factor Cepstral Coefficients (HFCC). As a classificator hidden Markov models, with modeled speech unit being a phoneme as well as a whole word, have been used. The parameters of the HMMs were adjusted in order to achieve the best recognition accuracy. Comparision of the HMM and DTW methods is also presented in the paper.
Wydawca
Rocznik
Strony
417--420
Opis fizyczny
Bibliogr. 8 poz., rys., tab., wzory
Twórcy
autor
  • Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny,ul. Mickiewicza 8, 33-100 Tarnów
  • Akademia Górniczo-Hutnicza, Katedra Telekomunikacji, al. Mickiewicza 30, 30-059 Kraków
  • Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny,ul. Mickiewicza 8, 33-100 Tarnów
  • Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny, ul. Mickiewicza 8, 33-100 Tarnów
autor
  • UMCS, Zakład Logopedii i Językoznawstwa Stosowanego, ul. Sowińskiego 17, 20-040 Lublin
autor
  • UMCS, Zakład Logopedii i Językoznawstwa Stosowanego, ul. Sowińskiego 17, 20-040 Lublin
autor
  • Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny, ul. Mickiewicza 8, 33-100 Tarnów
Bibliografia
  • [1] J. Surowaniec, Computerized Therapeutic Programs for Children with Communication Disorders, [in:] Abstracts. 4th International Congress of Neurolinguisucs, Cracow, Poland, 14-17 September 1994.
  • [2] J. Carmichael, A Quantitative Approach to Dysarthria Diagnosis and Treatment, Symposium on Speech Technolog)' for Cluneal and Educational Applications. Antwerp. Belgium, September 2, 2005.
  • [3] J. T. Kania, Podstawy językoznawczej klasyfikacji zaburzeń mowy, [w:] Szkice logopedyczne. Lublin. Polskie Towarzystwo Logopedyczne 2001, pp. 11-30.
  • [4] M. D. Skowroński, J. G. Harris, Exploiting mdependent filter band-width of human factor cepstral coefficients in automatic speech recoemnon. J. Acoust. Soc. Am. 116 (3). September 2004, pp. 1774-1780.
  • [5] R. Wielgat, T. Zieliński, L. Hołda, D. Król, T. Woźniak, S. Grabias, HFCC Based Pathological Speech Recognition. AQL'2006, Advances m Quantitative Laryngology, Voice and Speech Research, Groningen, Netherlands, 6-7 October, 2006.
  • [6] T. Zieliński, P. Gajda, M. Stachura, R. Wielgat, D. Król, T. Woźniak, S- Grabias, Zastosowanie współczynników HFCC jako cech sygnału mony w automatycznej detekcji wad wymowy, MiSSP`2006, Krynica,17-21 września 2006.
  • [7] S. Young, D. Kershaw, J. Odell, D. Ollason, V. Valtchev, P. Woodland, The HTK Book (for HTK Version 3.0), http: htk.eng.cam.ac.uk Jul. 2000.
  • [8] S. J. Young, N. H. Russell, J. H. S. Thornton, Token Passing: a Conceptual Model for Connected Speech Recognition Systems, CUEDJ Technical Report F_INFENG/TR38, Cambridge University, 1989.
Uwagi
PL
Całość opisywanych w pracy badań była sponsorowana z grantu KBN nr 1 H01F 046 28
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-2cd915fc-8c3d-44c1-ac2b-2f7d9830ed72
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.