PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Diagnostic significance of phase spectrum in acoustic analysis of pathological voice

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Diagnostyczne znaczenie widma fazowego w analizie akustycznej głosu patologicznego
Języki publikacji
EN
Abstrakty
EN
The paper regards the possibility of using new numerical features extracted from the phase spectrum of a speech signal for voice quality estimation in acoustic analysis for medical purposes. This novel approach does not require detection or estimation of the fundamental frequency and works on all types of speech signal: euphonic, dysphonic and aphonic as well. The experiment results presented in the paper are very promising: the developed F0-independant voice features are strongly correlated with two voice quality indicators: grade of hoarseness G (r>0.8) and roughness R (r>0.75) from GIRBAS scale, and exceed the standard voice parameters: jitter and shimmer.
PL
Artykuł dotyczy możliwości ekstrakcji cech numerycznych z widma fazowego sygnału mowy w celu wykorzystania w analizie akustycznej na potrzeby medyczne. Podejście to umożliwia uzależnienie analizy akustycznej od zawodnych metod wykrywania/wyznaczania częstotliwości podstawowej (tonu krtaniowego) i dzięki temu przeznaczone jest do badania wszystkich typów sygnału mowy (również afonicznych). Wyniki eksperymentu są bardzo obiecujące - proponowane cechy Ph1 i Ph2 są silnie skorelowane z dwoma kategoriami percepcyjnymi: stopniem chrypki (r>0.8) oraz szorstkością głosu (r>0.75) ze skali GIRBAS, wykazując silniejsze znaczenie diagnostyczne niż znane i stosowane od dawna wskaźniki jitter i shimmer. Proponowane podejście oprócz skuteczności charakteryzuje się szeregiem dodatkowych korzyści: algorytm metody z powodu niskiej złożoności jest szybki i niekosztowny, interpretacja matematyczna jest prosta i jednoznaczna oraz spójna z obserwowanym obrazem widma fazowego głosu. Ponadto uniezależnienie od detekcji częstotliwości podstawowej sprawia, że algorytm jest deterministyczny oraz efektywny dla każdego typu sygnału mowy.
Wydawca
Rocznik
Strony
1547--1550
Opis fizyczny
Bibliogr. 23 poz., rys., tab., wzor
Twórcy
Bibliografia
  • [1] Kent R. D., Ball, M. J.: Voice quality measurement. San Diego, Singular, 2000.
  • [2] Buder E. H.: Acoustic Analysis of Voice Quality: A Tabulation of Algorithms 1902-1990. [in Ball M. J., Kent R. D, Voice Quality Measurement]. San Diego, Singular, 2000.
  • [3] Titze I.: Workshop on Acoustic Voice Analysis: Summary Statement. Denver, 1995.
  • [4] KayPENTAX. Disordered Voice Database Model 4337 - operations manual. Lincoln Park, NJ, KayPENTAX, 2002.
  • [5] KayPENTAX. Multidimensional Voice Program, model 5105 - software instruction manual. Lincoln Park NY, KayPENTAX, 2002.
  • [6] Deliyski D. D.: Acoustic Model and Evaluation of Pathological Voice Production. Proceeding of EUROSPEECH’93. Berlin, 1993.
  • [7] Mitev P.: System for acoustic analysis of the pathological voices. PhD thesis. Sofia, Center on Biomedical Engineering, Bulgarian Academy of Sciences, 2000.
  • [8] Hadjitodorov S., Mitev P. A: computer system for acoustic analysis of pathological voices and laryngeal diseases screening. Medical Engineering and Physics. 2002, Vol 24, 6.
  • [9] CTS Informática. VoxMetria - Voice Analysis and Vocal Quality. Voice, Speech and Language Software. [online] http://www.ctsinformatica.com.br/english/#voxMetria.html
  • [10] Samborska-Owczarek A.: Heuristic classification methods for vocal tract efficiency diagnostics, Phd Thesis (polish title: Metody heurystycznej klasyfikacji we wspomaganiu diagnozowania wydolności traktu głosowego). Szczecin, West Pomeranien University of Technology, 2009.
  • [11] Fröhlich M., et al.: Acoustic voice quality description: Case studies for different regions of the hoarseness diagram. Advances in Quantitative Laryngoscopy, 2nd ‘Round Table’. Erlangen, 1997.
  • [12] Michaelis D.: Das Göttinger Heiserkeits-Diagramm - Entwicklung und Prüfung eines akustischen Verfahrens zur objektiven Stimmgütebeurteilung pathologischer Stimmen. PhD thesis. Göttingen, Georg-August-Universitat zu Göttingen, 1999.
  • [13] Michaelis D., Gramss T., Strube H. W:. Glottal to noise excitation ratio - a new measure for describing pathological voices. Acta acustica. 1997, Vol. 83.
  • [14] Fröhlich M., Michaelis D., Strube H. W.: Acoustic “breathiness measures” in the description of pathologic voices. In Proceedings ICASSP’98. 1998.
  • [15] Kiritani S.: High-speed digital image recording for observing vocal fold vibration. [in R. D. Kent, M. J. Ball, Voice Quality Measurement]. San Diego, Singular, 2000.
  • [16] Baken R. J., Orlikoff R. F: Clinical Measurement of Speech and Voice. Cengage Learning, 2000.
  • [17] Bozkurt B., at al.: Improved Differential Phase Spectrum Processing For Formant Tracking. Proc. Icslp. Jeju Island, 2004.
  • [18] Paliwal K. K.: Usefulness of Phase in Speech Processing. Proc. IPSJ Spoken Language Processing Workshop. Gifu, Japan, Feb. 2003.
  • [19] O’Shaughnessy D.: Speech Communications: Human and Machine. IEEE Press, 2000.
  • [20] Webb A. L., at al.: The reliability of three perceptual evaluation scales for dysphonia. European Archives of Oto-Rhino-Laryngology. 2004.
  • [21] von Eye A.: Mun Young, E., Analyzing Rater Agreement: Manifest Variable Methods. Routledge, 2005.
  • [22] Shrout P. E., Fleiss J. L.: Intraclass correlations: uses in assessing rater reliability. Psychological Bulletin. 1979, Vol 86, 2.
  • [23] Kasuya H., Endo Y., Saliu S.: Novel acoustic measurements of jitter and shimmer characteristics from pathological voice. In Eurospeech’93. 1993, Vol 3.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSW4-0088-0043
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.