PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Zastosowanie sieci Kohonena do rozpoznawania mowy patologicznej

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
The usage of the Kohonen neural networks for the pathological speech recognition
Języki publikacji
PL
Abstrakty
PL
Sygnał mowy posiada bardzo skomplikowana naturę, która sprawia że jago zobrazowanie oraz dalsza analiza bez operacji wstępnego przetworzenia sygnałów są trudne i nie zawsze przynoszą pożądane efekty. W wielu pracach sygnał mowy przedstawiony jest w postaci wideogramów, będących wykresami czsowo-częstotliwościowymi, jednakże analiza tych obrazów nie jest łatwa ze względu na ich trudną interpretację. W pracy niniejszej zaproponowano wykorzystanie sieci neuronowej Kohonena do generacji obrazów sygnałów mowy patologicznej, występujacej u dzieci z rozszczepem podniebienia. Opisano sposób przekształcenia sygnału mowy do postaci macierzy widm chwilowych, stanowiącej zbiór danych wejściowych dla układu sieci neuronowej Kohonena. Nastepnie omówiono metodę generacji obrazu przez sieć neuronową oraz zaproponowano przykladowy obraz pozyskanych sygnałów mowy. Ponadto zaproponowano metodę identyfikacji mowy patologicznej na podstawie otrzymanych obrazów, opierającą się na pomiarze długości linii.
EN
The nature of speech signal is very complicated, that causes its visualisation and further analysis, without some initial pre-processing, is very complicated and doesnát always bring the desired effects. Speech signal in most cases is represented by videograms. The analysis of these forms of signal visualisation is not easy because of difficulties is their interpretation. In this article the usage of Kohonen neural network for visualising speech signals uttered by children with a cleft palate, was proposed. Speech signal is converted to its spectrum matrices representation, which in tern constitutes the input for Kohonen neural network. Further a method for generating a simplified form of speech signal (a poly-line figure) based on the networkás output, was discused. In addition , a method for pathological speech signal recognition was proposed. Tests results based on utterances obtained form children with a cleft palate were also presented.
Słowa kluczowe
Wydawca
Rocznik
Strony
10--15
Opis fizyczny
Bibliogr. 16 poz., rys., tab.
Twórcy
autor
  • Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
autor
  • Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
autor
  • Katedra Automatyki, Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Bibliografia
  • [1] B.C.J. Moore: Wprowadzenie do psychologii słyszenia. Wydawnictwo Naukowe PWN, Poznań, 1999
  • [2] A. Izworski, W. Wszołek: Wykorzystanie metod sztucznej inteligencji w diagnostyce i przetwarzaniu patologicznych sygnałów mowy. W: Speech And Language Technology, Vol. 3, edited by: W. Jassem, Cz. Basztura, G. Demenko, K. Jassem, Poznań 1999
  • [3] R. Tadeusiewicz, W. Wszołek, A. Izworski: Application of Neural Networks in Diagnosis of Pathological Speech. W materiałach konferencji NC98 International ICSC/IFAC Symposium On Neural Computation, Vienna, Austria, September 1998
  • [4] R. Tadeusiewicz, W. Wszołek, M. Modrzejewski: The Evaluation of Speech Deformation Treated for Larynx Cancer Using The Neural Network and Pattern Recognition Methods. W materiałach konferencji IV International Conference on Engineering Applications of Neural Networks, pp. 613-616. Gibraltar, June 1998
  • [5] C. Basztura: Komputerowe systemy diagnostyki akustycznej. WNT, Warszawa, 1996
  • [6] S. Osowski: Sieci neuronowe w ujęciu algorytmicznym. Wydawnictwa Naukowo-Techniczne, Warszawa, 1996
  • [7] C. Bishop: Neural networks lor paltem recognition. Clarendon Press, Oxford, 1995
  • [8] J.R. Deller. J.G. Proakis, J.H.L. Hansen: Discrete-Time Processing of Speech Signals. Macmillan Publishing Company, New York, 1994
  • [9] S. Haykin: Neural networks, a comprehensive foundation. Macmillan College Publishing Company, New York, 1994
  • [10] W. Wszołek: Analiza i ocena obrazów dźwiękowych w procesach wibroakustycznych. Rozprawa doktorska, AGH Kraków, 1994
  • [11] L.R. Rabiner, J. Biing-Hwang: Fundamentals of Speech Recognition. Prentice Hall, New Jersey, 1993.
  • [12] R. Tadeusiewicz: Sieci neuronowe. Akademicka Oficyna Wydawnicza RM, Warszawa, 1993
  • [13] R. Tadeusiewicz, M. Flasiński: Rozpoznawanie obrazów. PWN, Warszawa , 1991
  • [14] R. Sadaoki: Digital speech processing. Synthesis, and Recognition. New York, 1989
  • [15] R. Tadeusiewicz: Sygnał mowy. WKiŁ, Warszawa, 1988
  • [16] R.W.Schafer: Digital Representation of Speech Signals. Proceedings of the IEEE, Vol. 63, No. 4, April 1981
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSW9-0011-2383
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.