Zastosowanie sieci Kohonena do rozpoznawania mowy patologicznej

Kapusta, M.; Gajer, M.; Shomali, A.

Artykuł - szczegóły

Tytuł artykułu

Zastosowanie sieci Kohonena do rozpoznawania mowy patologicznej

Autorzy

Kapusta M. , Gajer M. , Shomali A.

Treść / Zawartość

Pełne teksty:

Pobierz

Identyfikatory

Warianty tytułu

The usage of the Kohonen neural networks for the pathological speech recognition

Języki publikacji

Abstrakty

Sygnał mowy posiada bardzo skomplikowana naturę, która sprawia że jago zobrazowanie oraz dalsza analiza bez operacji wstępnego przetworzenia sygnałów są trudne i nie zawsze przynoszą pożądane efekty. W wielu pracach sygnał mowy przedstawiony jest w postaci wideogramów, będących wykresami czsowo-częstotliwościowymi, jednakże analiza tych obrazów nie jest łatwa ze względu na ich trudną interpretację. W pracy niniejszej zaproponowano wykorzystanie sieci neuronowej Kohonena do generacji obrazów sygnałów mowy patologicznej, występujacej u dzieci z rozszczepem podniebienia. Opisano sposób przekształcenia sygnału mowy do postaci macierzy widm chwilowych, stanowiącej zbiór danych wejściowych dla układu sieci neuronowej Kohonena. Nastepnie omówiono metodę generacji obrazu przez sieć neuronową oraz zaproponowano przykladowy obraz pozyskanych sygnałów mowy. Ponadto zaproponowano metodę identyfikacji mowy patologicznej na podstawie otrzymanych obrazów, opierającą się na pomiarze długości linii.

The nature of speech signal is very complicated, that causes its visualisation and further analysis, without some initial pre-processing, is very complicated and doesnát always bring the desired effects. Speech signal in most cases is represented by videograms. The analysis of these forms of signal visualisation is not easy because of difficulties is their interpretation. In this article the usage of Kohonen neural network for visualising speech signals uttered by children with a cleft palate, was proposed. Speech signal is converted to its spectrum matrices representation, which in tern constitutes the input for Kohonen neural network. Further a method for generating a simplified form of speech signal (a poly-line figure) based on the networkás output, was discused. In addition , a method for pathological speech signal recognition was proposed. Tests results based on utterances obtained form children with a cleft palate were also presented.

Słowa kluczowe

sieć Kohonena mowa patologiczna

Wydawca

Wydawnictwo PAK

Czasopismo

Pomiary Automatyka Kontrola

Rocznik

2000

Tom

R. 46, nr 7

Strony

10--15

Opis fizyczny

Bibliogr. 16 poz., rys., tab.

Twórcy

autor

Kapusta M.

Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie

autor

Gajer M.

Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie

autor

Shomali A.

Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie

Bibliografia

[1] B.C.J. Moore: Wprowadzenie do psychologii słyszenia. Wydawnictwo Naukowe PWN, Poznań, 1999
[2] A. Izworski, W. Wszołek: Wykorzystanie metod sztucznej inteligencji w diagnostyce i przetwarzaniu patologicznych sygnałów mowy. W: Speech And Language Technology, Vol. 3, edited by: W. Jassem, Cz. Basztura, G. Demenko, K. Jassem, Poznań 1999
[3] R. Tadeusiewicz, W. Wszołek, A. Izworski: Application of Neural Networks in Diagnosis of Pathological Speech. W materiałach konferencji NC98 International ICSC/IFAC Symposium On Neural Computation, Vienna, Austria, September 1998
[4] R. Tadeusiewicz, W. Wszołek, M. Modrzejewski: The Evaluation of Speech Deformation Treated for Larynx Cancer Using The Neural Network and Pattern Recognition Methods. W materiałach konferencji IV International Conference on Engineering Applications of Neural Networks, pp. 613-616. Gibraltar, June 1998
[5] C. Basztura: Komputerowe systemy diagnostyki akustycznej. WNT, Warszawa, 1996
[6] S. Osowski: Sieci neuronowe w ujęciu algorytmicznym. Wydawnictwa Naukowo-Techniczne, Warszawa, 1996
[7] C. Bishop: Neural networks lor paltem recognition. Clarendon Press, Oxford, 1995
[8] J.R. Deller. J.G. Proakis, J.H.L. Hansen: Discrete-Time Processing of Speech Signals. Macmillan Publishing Company, New York, 1994
[9] S. Haykin: Neural networks, a comprehensive foundation. Macmillan College Publishing Company, New York, 1994
[10] W. Wszołek: Analiza i ocena obrazów dźwiękowych w procesach wibroakustycznych. Rozprawa doktorska, AGH Kraków, 1994
[11] L.R. Rabiner, J. Biing-Hwang: Fundamentals of Speech Recognition. Prentice Hall, New Jersey, 1993.
[12] R. Tadeusiewicz: Sieci neuronowe. Akademicka Oficyna Wydawnicza RM, Warszawa, 1993
[13] R. Tadeusiewicz, M. Flasiński: Rozpoznawanie obrazów. PWN, Warszawa , 1991
[14] R. Sadaoki: Digital speech processing. Synthesis, and Recognition. New York, 1989
[15] R. Tadeusiewicz: Sygnał mowy. WKiŁ, Warszawa, 1988
[16] R.W.Schafer: Digital Representation of Speech Signals. Proceedings of the IEEE, Vol. 63, No. 4, April 1981

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-article-BSW9-0011-2383