More than 90% of patients with Parkinson’s disease suffer from hypokinetic dysarthria. This paper proposes a novel end-to-end deep learning model for Parkinson’s disease detection from speech signals. The proposed model extracts time series dynamic features using time-distributed two-dimensional convolutional neural networks (2D-CNNs), and then captures the dependencies between these time series using a one-dimensional CNN (1D-CNN). The performance of the proposed model was verified on two databases. On Database-1, the proposed model outperformed expert features-based machine learning models and achieved promising results, showing accuracies of 81.6% on the speech task of sustained vowel /a/ and 75.3% on the speech task of reading a short sentence (/si shi si zhi shi shi zi/) in Chinese. On Database-2, the proposed model was assessed on multiple sound types, including vowels, words, and sentences. An accuracy of up to 92% was obtained on the speech tasks, which included reading simple (/loslibros/) and complex (/viste/) sentences in Spanish. By visualizing the features generated by the model, it was found that the learned time series dynamic features are able to capture the characteristics of the reduced overall frequency range and reduced variability of Parkinson’s disease sounds, which are important clinical evidence for detecting Parkinson’s disease patients. The results also suggest that the low-frequency region of the Mel-spectrogram is more influential and important than the high-frequency region for Parkinson’s disease detection from speech.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
Celem pracy jest elektrofizjologiczna ocena endogennych potencjałów wywołanych (słuchowy potencjał P300) u pacjentów z dysartrycznymi zaburzeniami mowy i naczyniopochodnym uszkodzeniem mózgu. Badaniem objęto grupę 30 pacjentów z niedokrwiennym udarem mózgu, potwierdzonym tomografią komputerową (TK) oraz 25-osobową odpowiednio dobraną wiekowo grupę kontrolną. U pacjentów po przebytym naczyniopochodnym uszkodzeniu mózgu zanotowano znacznie wydłużony czas latencji fali potencjału P300 oraz obniżenie jego amplitudy, bez istotnych korelacji pomiędzy parametrami P300 a stopniem nasilenia dysartrii.
EN
The purpose of the study was electrophysiological assessment of endogenous evoked potentials in patients with dysarthria after ischaemic cerebral damage, based on event-related auditory P300 potential. The study comprised 30 patients with ischaemic cerebral damage confirmed by CT (computer tomography) head scan and 25 age-matched control group. In patients with dysarthria after ischaemic cerebral damage significantly prolonged P300 latency and decrease in amplitude was found, with no significant correlation between P300 parameters and with the severity of dysarthria.
Ocenia się, że dysartryczne zaburzenia mowy w chorobie Parkinsona występują u 70-90% chorych, a leczenie farmakologiczne przynosi niewielkie efekty. Celem pracy była analiza komputerowa wpływu postępowania logopedycznego na strukturę akustyczną dźwięków mowy w grupie chorych z rozpoznaniem choroby Parkinsona. Materiał stanowiło 10 chorych (6 kobiet, 4 mężczyzn, w wieku 59-75 lat, średnio - 68,2), z rozpoznaniem choroby Parkinsona i z zaburzeniami mowy o charakterze dysar-trycznym. Wszyscy byli leczeni preparatami L-dopy. Przeprowadzono u nich terapię z uwzględnieniem ćwiczeń fonacji, artykulacji; ukierunkowanych na zmniejszenie sztywności mięśni ust i twarzy oraz ćwiczeń oddechowych. W celu oceny skuteczności postępowania logopedycznego wykorzystano komputerową akustyczną analizę mowy, ze szczególnym uwzględnieniem następujących parametrów: selektywności poszczególnych elementów wypowiedzi, tempa oraz stabilności dźwięków mowy. W analizie akustycznej zastosowano programy komputerowe IRIS oraz Wavelab. Stwierdzono, że systematycznie stosowane postępowanie logopedyczne u pacjentów z rozpoznaniem choroby Parkinsona i towarzyszącymi zaburzeniami mowy o typie dysartrii wpływa na stabilizację wybranych parametrów akustycznych mowy oraz poprawę sprawności mowy, co znalazło potwierdzenie w akustycznej analizie komputerowej.
EN
Dysarthria occurs in case of 70-90% of patients with Parkinson's disease (PD). Pharmacological treatment of this symptom is not effective enough. The aim of this work was the computer analysis of the influence of speech therapy on the acoustic structure of speech sounds in patients with Parkinson's disease. Material and methods: 10 patients (6 women and 4 men) aged from 59 to 75 years (mean age - 68.2) with PD and dysarthria were examined. All patients were treated by the L-Dopa and the logopedie examination was carried out. The administrated pronation and articulation exercises aimed to facial and oral muscle rigidity reduction. The breathing training was included in the therapeutic programme, as well. Computer speech analysis was applied for the evaluation of speech rehabilitation efficacy. Selectiveness of the individual parts of speech and stability of frequency estimation were analyzed using IRIS and Wavelab computer programs. Systematic logopedie therapy in PD patients with dysarthria influences the speech acoustic parameters and enables the speech efficiency improvement. Computer acoustic analysis allows to follow the therapy efficacy.
4
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
W artykule przedstawiono przegląd badań nad wykorzystaniem metod akustycznych w diagnozowaniu i terapii zaburzeń mowy. Wykazano, na przykładzie jąkania, przydatność analiz sygnału w dziedzinie czasu i częstotliwości w praktyce logopedycznej. Z porównania przebiegów spektralnych i wyznaczonych częstotliwości i poziomów formantów w wypowiedziach płynnych i niepłynnych można wnioskować o zaburzeniach w ustawieniu artykulatorów. Scharakteryzowano parametry struktury czasowej istotne w ocenie zaburzenia płynności mowy oraz rolę amplitudowej obwiedni w terapii przy wykorzystaniu słuchowego i pozasłuchowych kanałów kontroli. Omówiono postępy prac nad wizualizacją opóźnionych sygnałów mowy do celów terapii jąkania.
EN
In the article a review of research on the employment of acoustic methods in the diagnosis and therapy of speech disorders is presented. On the example of stuttering, it has been shown that signal analysis concerning time and frequency are useful in logopaedic practice. From the comparison of spectral courses as well as frequencies and formant levels, articulator position disorders may be inferred. Time structure parameters have been characterised, which are significant in fluency assessment, as well as the role of amplitude envelope in therapy with the use of auditory and extra auditory control channels. Progress in works on visualisation of delayed speech signals for stuttering therapy has also been described.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.