Wykorzystanie metody niejawnych modeli Markowa w automatycznej detekcji wybranych wad wymowy

Wielgat, R.; Zieliński, T.; Świętojański, P.; Żołądź, P.; Woźniak, T.; Grabias, S.; Król, D.

Powiadomienia systemowe

Sesja wygasła!
Sesja wygasła!

Artykuł - szczegóły

Tytuł artykułu

Wykorzystanie metody niejawnych modeli Markowa w automatycznej detekcji wybranych wad wymowy

Autorzy

Wielgat R. , Zieliński T. , Świętojański P. , Żołądź P. , Woźniak T. , Grabias S. , Król D.

Treść / Zawartość

Pełne teksty:

Pobierz

Identyfikatory

Warianty tytułu

Application Hidden Markov Models to Automatic Detection of Speech Disorder

Języki publikacji

Abstrakty

W artykule przedstawiono wyniki badań dotyczących automatycznej detekcji wad wymowy u dzieci. Jako materiał badawczy zostały wykorzystane nagrania pochodzące od dzieci z wadami wymowy. Zadanie polegało na rozpoznaniu nieprawidłowo realizowanego fonemu w wybranych słowach testowych. Detekcja była dokonywana za pomocą metod rozpoznawania mowy, w których jako cec sygnału mowy użyto dwóch najbardziej obiecujących rodzajów cech: współczynnika MFCC praz współczynników HFCC. Jako klasyfikatora użyto metody niejawnych modeli Markowa (HMM), gdzie modelowanymi jednostkami fonetycznimi były zarówno fonemy jak i całe słowa. W badanych metodach dobrano ich parametry w celu zmaksymalizowania skuteczności rozpoznawania. W artykule zaprezentowano również analizę porównawczą wyników rozpoznawania otrzymanych z wykorzystaniem metody HMM oraz testowanej w poprzednich pracach metody nieliniowej transformacji czasowej (DTW).

The results of research on automatic detection of the pathological phoneme pronunciation are presented in the paper. Speech samples came from speech impaired children and persons who imitated pathological phoneme pronunciation. The recognition task was to find wrongly realized phoneme in the selected test utterances. At the reature extraction stage the most effective features` types have been used: standard Mel-Frequency Cepstral Coefficients (MFCC) and recently proposed Human Factor Cepstral Coefficients (HFCC). As a classificator hidden Markov models, with modeled speech unit being a phoneme as well as a whole word, have been used. The parameters of the HMMs were adjusted in order to achieve the best recognition accuracy. Comparision of the HMM and DTW methods is also presented in the paper.

Słowa kluczowe

współczynniki HFCC współczynniki MFCC niejawne modele Markowa terapia logopedyczna

human factor cepstral coefficients Mel-frequency cepstral coefficients hidden markov models logopedic therapy

Wydawca

Wydawnictwo PAK

Czasopismo

Pomiary Automatyka Kontrola

Rocznik

2007

Tom

R. 53, nr 9 bis

Strony

417--420

Opis fizyczny

Bibliogr. 8 poz., rys., tab., wzory

Twórcy

autor

Wielgat R.

rwielgat@poczta.onet.pl

Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny,ul. Mickiewicza 8, 33-100 Tarnów

autor

Zieliński T.

tzielin@agh.edu.pl

Akademia Górniczo-Hutnicza, Katedra Telekomunikacji, al. Mickiewicza 30, 30-059 Kraków

autor

Świętojański P.

Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny,ul. Mickiewicza 8, 33-100 Tarnów

autor

Żołądź P.

Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny, ul. Mickiewicza 8, 33-100 Tarnów

autor

Woźniak T.

twozniak@vp.pl

UMCS, Zakład Logopedii i Językoznawstwa Stosowanego, ul. Sowińskiego 17, 20-040 Lublin

autor

Grabias S.

grabiasl@vp.pl

UMCS, Zakład Logopedii i Językoznawstwa Stosowanego, ul. Sowińskiego 17, 20-040 Lublin

autor

Król D.

danielkrol@poczta.onet.pl

Państwowa Wyższa Szkoła Zawodowa, Instytut Politechniczny, ul. Mickiewicza 8, 33-100 Tarnów

Bibliografia

[1] J. Surowaniec, Computerized Therapeutic Programs for Children with Communication Disorders, [in:] Abstracts. 4th International Congress of Neurolinguisucs, Cracow, Poland, 14-17 September 1994.
[2] J. Carmichael, A Quantitative Approach to Dysarthria Diagnosis and Treatment, Symposium on Speech Technolog)' for Cluneal and Educational Applications. Antwerp. Belgium, September 2, 2005.
[3] J. T. Kania, Podstawy językoznawczej klasyfikacji zaburzeń mowy, [w:] Szkice logopedyczne. Lublin. Polskie Towarzystwo Logopedyczne 2001, pp. 11-30.
[4] M. D. Skowroński, J. G. Harris, Exploiting mdependent filter band-width of human factor cepstral coefficients in automatic speech recoemnon. J. Acoust. Soc. Am. 116 (3). September 2004, pp. 1774-1780.
[5] R. Wielgat, T. Zieliński, L. Hołda, D. Król, T. Woźniak, S. Grabias, HFCC Based Pathological Speech Recognition. AQL'2006, Advances m Quantitative Laryngology, Voice and Speech Research, Groningen, Netherlands, 6-7 October, 2006.
[6] T. Zieliński, P. Gajda, M. Stachura, R. Wielgat, D. Król, T. Woźniak, S- Grabias, Zastosowanie współczynników HFCC jako cech sygnału mony w automatycznej detekcji wad wymowy, MiSSP`2006, Krynica,17-21 września 2006.
[7] S. Young, D. Kershaw, J. Odell, D. Ollason, V. Valtchev, P. Woodland, The HTK Book (for HTK Version 3.0), http: htk.eng.cam.ac.uk Jul. 2000.
[8] S. J. Young, N. H. Russell, J. H. S. Thornton, Token Passing: a Conceptual Model for Connected Speech Recognition Systems, CUEDJ Technical Report F_INFENG/TR38, Cambridge University, 1989.

Uwagi

Całość opisywanych w pracy badań była sponsorowana z grantu KBN nr 1 H01F 046 28

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-2cd915fc-8c3d-44c1-ac2b-2f7d9830ed72