PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Classification of Parkinson’s disease and other neurological disorders using voice features extraction and reduction techniques

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Klasyfikacja choroby Parkinsona i innych zaburzeń neurologicznych z wykorzystaniem ekstrakcji cech głosowych i technik redukcji
Języki publikacji
EN
Abstrakty
EN
This study aimed to differentiate individuals with Parkinson's disease (PD) from those with other neurological disorders (ND) by analyzing voice samples, considering the association between voice disorders and PD. Voice samples were collected from 76 participants using different recording devices and conditions, with participants instructed to sustain the vowel /a/ comfortably. PRAAT software was employed to extract features including autocorrelation (AC), cross-correlation (CC), and Mel frequency cepstral coefficients (MFCC) from the voice samples. Principal component analysis (PCA) was utilized to reduce the dimensionality of the features. Classification Tree (CT), Logistic Regression, Naive Bayes (NB), Support Vector Machines (SVM), and Ensemble methods were employed as supervised machine learning techniques for classification. Each method provided distinct strengths and characteristics, facilitating a comprehensive evaluation of their effectiveness in distinguishing PD patients from individuals with other neurological disorders. The Naive Bayes kernel, using seven PCA-derived components, achieved the highest accuracy rate of 86.84% among the tested classification methods. It is worth noting that classifier performance may vary based on the dataset and specific characteristics of the voice samples. In conclusion, this study demonstrated the potential of voice analysis as a diagnostic tool for distinguishing PD patients from individuals with other neurological disorders. By employing a variety of voice analysis techniques and utilizing different machine learning algorithms, including Classification Tree, Logistic Regression, Naive Bayes, Support Vector Machines, and Ensemble methods, a notable accuracy rate was attained. However, further research and validation using larger datasets are required to consolidate and generalize these findings for future clinical applications.
PL
Przedstawione badanie miało na celu różnicowanie osób z chorobą Parkinsona (PD) od osób z innymi zaburzeniami neurologicznymi poprzez analizę próbek głosowych, biorąc pod uwagę związek między zaburzeniami głosu a PD. Próbki głosowe zostały zebrane od 76 uczestników przy użyciu różnych urządzeń i warunków nagrywania, a uczestnicy byli instruowani, aby wydłużyć samogłoskę /a/ w wygodnym tempie. Oprogramowanie PRAAT zostało zastosowane do ekstrakcji cech, takich jak autokorelacja (AC), krzyżowa korelacja (CC) i współczynniki cepstralne Mel (MFCC) z próbek głosowych. Analiza składowych głównych (PCA) została wykorzystana w celu zmniejszenia wymiarowości cech. Jako techniki nadzorowanego uczenia maszynowego wykorzystano drzewa decyzyjne (CT), regresję logistyczną, naiwny klasyfikator Bayesa (NB), maszyny wektorów nośnych (SVM) oraz metody zespołowe. Każda z tych metod posiadała swoje unikalne mocne strony i charakterystyki, umożliwiając kompleksową ocenę ich skuteczności w rozróżnianiu pacjentów z PD od osób z innymi zaburzeniami neurologicznymi. Naiwny klasyfikator Bayesa, wykorzystujący siedem składowych PCA, osiągnął najwyższy wskaźnik dokładności na poziomie 86,84% wśród przetestowanych metod klasyfikacji. Należy jednak zauważyć, że wydajność klasyfikatora może się różnić w zależności od zbioru danych i konkretnych cech próbek głosowych. Podsumowując, to badanie wykazało potencjał analizy głosu jako narzędzia diagnostycznego do rozróżniania pacjentów z PD od osób z innymi zaburzeniami neurologicznymi. Poprzez zastosowanie różnych technik analizy głosu i wykorzystanie różnych algorytmów uczenia maszynowego, takich jak drzewa decyzyjne, regresja logistyczna, naiwny klasyfikator Bayesa, maszyny wektorów nośnych i metody zespołowe, osiągnięto znaczący poziom dokładności. Niemniej jednak, konieczne są dalsze badania i walidacja na większych zbiorach danych w celu skonsolidowania i uogólnienia tych wyników dla przyszłych zastosowań klinicznych.
Rocznik
Strony
16--22
Opis fizyczny
Bibliogr. 32 poz., tab.
Twórcy
  • Mohammed V University in Rabat, National School of Arts and Crafts, Electronic Systems Sensors and Nanobiotechnology, Rabat, Morocco
autor
  • Mohammed V University in Rabat, National School of Arts and Crafts, Electronic Systems Sensors and Nanobiotechnology, Rabat, Morocco
  • Mohammed V University in Rabat, National School of Arts and Crafts, Electronic Systems Sensors and Nanobiotechnology, Rabat, Morocco
Bibliografia
  • [1] Abramson E. L. et al.: Physician experiences transitioning between an older versus newer electronic health record for electronic prescribing. International journal of medical informatics 81(8), 2012, 539–548.
  • [2] Andersen T. et al.: Designing for collaborative interpretation in telemonitoring: Re-introducing patients as diagnostic agents. International journal of medical informatics 80(8), 2011, e112–e126.
  • [3] Baker K. K. et al.: Thyroarytenoid muscle activity associated with hypophonia in Parkinson disease and aging. Neurology 51(6), 1998, 1592–1598.
  • [4] Benba A. et al.: Discriminating between patients with Parkinson’s and neurological diseases using cepstral analysis. IEEE transactions on neural systems and rehabilitation engineering 24(10), 2016, 1100–1108.
  • [5] Benba A. et al.: Hybridization of best acoustic cues for detecting persons with Parkinson's disease. Second World Conference on Complex Systems (WCCS), IEEE, 2014, 622–625.
  • [6] Benba A. et al.: Using RASTA-PLP for discriminating between different neurological diseases. International Conference on Electrical and Information Technologies (ICEIT), IEEE, 2016, 406–409.
  • [7] Boersma P. et al.: Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound. Proceedings of the institute of phonetic sciences, 1993, 97–110.
  • [8] De Colle W.: Voce & Computer – analisi acustica digitale del segnale verbale. Omega, 2001.
  • [9] Gales M. et al.: The application of hidden Markov models in speech recognition. Foundations and Trends in Signal Processing 1(3), 2008, 195–304.
  • [10] Gillies G. E., et al.: Sex differences in Parkinson’s disease. Frontiers in neuroendocrinology 35(3), 2014, 370–384.
  • [11] Gorris C. et al.: Acoustic analysis of normal voice patterns in Italian adults by using Praat. Journal of Voice 34(6), 2020, 961.e9–961.e18.
  • [12] Goyal J. et al.: A hybrid approach for Parkinson’s disease diagnosis with resonance and time-frequency based features from speech signals. Expert Systems with Applications 182, 2021, 115283.
  • [13] Gupta S. et al.: Feature extraction using MFCC. Signal & Image Processing. An International Journal 4(4), 2013, 101–108.
  • [14] Holi M. S. et al.: Automatic detection of neurological disordered voices using mel cepstral coefficients and neural networks. IEEE Point-of-Care Healthcare Technologies (PHT), IEEE, 2013, 76–79.
  • [15] Islam M. R., Nahiduzzaman M.: Complex features extraction with deep learning model for the detection of COVID19 from CT scan images using ensemble based machine learning approach. Expert Systems with Applications 195, 2022, 116554.
  • [16] Lieberman P.: Perturbations in vocal pitch. The Journal of the Acoustical Society of America 33, 1961, 597–602.
  • [17] Lieberman P.: Some acoustic measures of the fundamental periodicity of normal and pathologic larynges. The Journal of the Acoustical Society of America 35(3), 1963, 344–353.
  • [18] Little M. et al. Suitability of dysphonia measurements for telemonitoring of Parkinson’s disease. Nature Precedings, 2008, 1–1.
  • [19] Little M. et al.: Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection. Nature Precedings, 2007, 1–1.
  • [20] Mandal I., Sairam N.: Accurate telemonitoring of Parkinson's disease diagnosis using robust inference system. International journal of medical informatics 82(5), 2013, 359–377.
  • [21] O'Sullivan S. B., Schmitz T. J.: Parkinson disease. Physical Rehabilitation 5th ed., F. A. Davis Company, Philadelphia 2007, 856–894.
  • [22] Pahuja G., Nagabhushan T. N.: A comparative study of existing machine learning approaches for Parkinson's disease detection. IETE Journal of Research 67(1), 2021, 4–14.
  • [23] Parkinson J.: An Essay on Shaking Palsy. Whittingham and Rowland Printing, London 1817.
  • [24] Rahman A. et al.: Parkinson’s disease diagnosis in cepstral domain using MFCC and dimensionality reduction with SVM classifier. Mobile Information Systems 2021, 1–10.
  • [25] Rahn III. et al.: Phonatory impairment in Parkinson's disease: evidence from nonlinear dynamic analysis and perturbation analysis. Journal of Voice 21(1), 2007, 64–71.
  • [26] Sharanyaa S. et al.: An Exploration on Feature Extraction and Classification Techniques for Dysphonic Speech Disorder in Parkinson’s Disease. Inventive Communication and Computational Technologies: Proceedings of ICICCT 2021, Springer Singapore, 2022, 33–48.
  • [27] Stelzig Y. et al.: Laryngeal manifestations in patients with Parkinson disease. Laryngo-rhino-otologie 78(10), 1999, 544–551.
  • [28] Teixeira J. P. et al.: Vocal acoustic analysis–jitter, shimmer and hnr parameters. Procedia Technology 9, 2013, 1112–1122.
  • [29] Teston B.: L'évaluation objective des dysfonctionnements de la voix et de la parole; 2e partie: les dysphonies. Travaux Interdisciplinaires du Laboratoire Parole et Langage d'Aix-en-Provence (TIPA) 20, 2001, 169–232.
  • [30] Tiwari V.: MFCC and its applications in speaker recognition. International journal on emerging technologies 1(1), 2010, 19–22.
  • [31] Van Den E. et al.: Incidence of Parkinson’s disease: variation by age, gender, and race/ethnicity. American Journal of Epidemiology 157(11), 2003, 1015–1022.
  • [32] Wendahl R. W.: Laryngeal analog synthesis of jitter and shimmer auditory parameters of harshness. Folia Phoniatrica et Logopaedica 18(2), 1966, 98–108.
Uwagi
Opracowanie rekordu ze środków MNiSW, umowa nr SONP/SP/546092/2022 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2024).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-6be75bd4-d71b-45cd-b689-f1e10c650ddc
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.