Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 25

Liczba wyników na stronie
first rewind previous Strona / 2 next fast forward last
Wyniki wyszukiwania
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 2 next fast forward last
PL
Celem artykułu jest przedstawienie wyników analizy czasowo-częstotliwościowej sygnałów fonokardiograficznych. Powodem podjęcia działań dotyczących badania tego typu sygnałów są statystyki Światowej Organizacji Zdrowia, które od lat wskazują, iż pierwszą przyczyną zgonów na świecie są choroby układu sercowo-naczyniowego [1]. Powodem dominacji tego typu schorzeń w statystykach jest rosnący stres psychospołeczny oraz malejąca aktywność fizyczna społeczeństwa. Badanie tonów serca i detekcja schorzeń w oparciu o sygnał fonokardiograficzny na wczesnym etapie badań lekarskich może skutecznie przyczynić się do zmniejszenia wysokich statystyk umieralności. W artykule przedstawiono wyniki opracowanego algorytmu, który dla 15 osobowego zbioru przypadków charakteryzuje się czułością na poziomie 100% i specyficznością równą 87,50%, co z medycznego punktu widzenia jest wynikiem satysfakcjonującym.
EN
The aim of this article is to present the results of time-frequency analysis of phonocardiographic signals. The reason for undertaking such studies is the World Health Organization (WHO) statistics, which for years have shown that cardiovascular disease is the leading cause of death in the world [1]. The reason for the dominance of this type of illness in statistics is the increasing psychosocial stress and decreasing physical activity of the population. Heart rate and disease detection based on phonocardiographic data at an early stage of medical examination can effectively contribute to the reduction of high mortality statistics. The paper presents the results of the developed algorithm, which for the 15-person case collection is characterized by a sensitivity of 100% and a specificity of 87.50%, which is a satisfactory result from the medical point of view.
2
Content available remote Wieloaspektowa analiza spektralna sygnałów fonokardiograficznych
PL
W artykule przedstawiono koncepcję analizy spektralnej sygnałów fonokardiograficznych. Zaprezentowano wyniki analizy sygnałów zawierających od kilku do kilkunastu uderzeń serca oraz sygnałów krótkich zawierających pojedyncze uderzenie serca. Przedstawiono propozycje kilkudziesięciu widmowych cech dystynktywnych oraz ocenę ich przydatności w diagnostyce schorzeń kardiologicznych.
EN
The article presents the idea of spectral analysis of phonocardiographic signals. The results of analysis of signals containing from several to over a dozen heartbeats and short signals containing only one heartbeat. Proposals dozens of spectral distinctive features and evaluate their usefulness in the diagnosis of cardiac diseases.
PL
W elektrofizjologicznym badaniu wzroku najczęściej wykorzystuje się wzrokowe potencjały wywołane, które charakteryzują się kolejno ułożonymi w funkcji czasu ekstremami, zwanymi falami lub załamkami. Morfologia przebiegu, a w szczególności zależności czasowe i amplitudowe poszczególnych fal, umożliwiają neurologowi postawienie diagnozy, co nie jest zadaniem prostym. Wymaga od neurologa doświadczenia, skupienia uwagi i bardzo dobrej percepcji. W celu wsparcia procesu diagnostycznego autor opracował algorytm realizujący zautomatyzowaną klasyfikację słuchowych potencjałów wywołanych do grupy przypadków patologicznych lub prawidłowych. Czułość metody w 100 osobowym zbiorze przypadków określono na 94%, przy 16% prawdopodobieństwie fałszywego alarmu, co z medycznego punktu widzenia jest wynikiem satysfakcjonującym.
EN
In electrophysiological examination of sight are most often used visual evoked potentials which are characterized by extremes, called waves, successively arranged on timeline. Morphology of the waveforms, in particular, the timing and amplitude of each wave, allow neurologist diagnosis, which is not an easy task. Neurologist requires experience, attention and very good perception. In order to support the diagnostic process, the author have developed an algorithm implementing the automated classification of visual evoked potentials to the group of pathological or physiological cases. For a set of cases numbering 100 people, the sensitivity of the method is 94%, with 16% probability of false alarm. The obtained result is satisfactory from a medical point of view.
PL
W artykule przedstawiono system automatycznego rozpoznawania mówcy zaimplementowany w środowisku Matlab oraz pokazano sposoby realizacji i optymalizacji poszczególnych elementów tego systemu. Główny nacisk położono na wyselekcjonowanie cech dystynktywnych głosu mówcy z wykorzystaniem algorytmu genetycznego, który pozwala na uwzględnienie synergii cech podczas selekcji. Pokazano również wyniki optymalizacji wybranych elementów klasyfikatora, m.in. liczby rozkładów Gaussa użytych do zamodelowania każdego z głosów. Ponadto, podczas tworzenia modeli poszczególnych głosów zastosowano uniwersalny model głosów.
EN
The paper presents an automatic speaker’s recognition system, implemented in the Matlab environment, and demonstrates how to achieve and optimize various elements of the system. The main emphasis was put on features selection of a speech signal using a genetic algorithm which takes into account synergy of features. The results of optimization of selected elements of a classifier have been also shown, including the number of Gaussian distributions used to model each of the voices. In addition, for creating voice models, a universal voice model has been used.
5
Content available remote Text Independent Automatic Speaker Recognition System using fusion of features
EN
This paper presents a speaker recognition system, which is independent of the linguistic context. The solved task includes: the preprocessing stage, the segmentation of speech signal leading to the extraction of features based on three techniques, selection of the most important features, and the classification stage involving a serial combination of classifiers. Sets of descriptors were obtained using three techniques: cepstral coefficients, mel-cepstral coefficients and original weighted cepstral coefficients. Optimal robust “Voice Print” has been determined using fisher coefficients and PCA analysis. Experiments on the 2002 NIST Speaker Recognition Evaluation corpus show that the proposed system is able to recognise the speaker, regardless on the speech content, even language content with great accuracy.
PL
W pracy przedstawiono system rozpoznawania mówcy niezależny od tekstu wypowiedzi. Rozwiązane problemy obejmują: etap przetwarzania wstępnego, segmentację sygnału mowy prowadzącą do etapu ekstrakcji cech bazującej na trzech technikach analizy sygnału mowy, selekcję najbardziej istotnych cech oraz etap klasyfikacji obejmujący analizę kaskady klasyfikatorów. Zestaw cech uzyskano przy użyciu trzech technik: cepstrum, mel-cepstrum oraz autorskich ważonych cech cesptralnych. Optymalny wektor cech wyekstrahowano przy użyciu współczynników istotności Fishera oraz analizy PCA. Eksperymenty z wykorzystaniem bazy 2002 NIST Speaker Recognition Evaluation pokazują, że przedstawiony system rozpoznaje mówcę niezależnie od ograniczeń lingwistycznych treści, a nawet języka wypowiedzi, z zadowalającą dokładnością.
PL
W referacie pokazano sposoby optymalizacji poszczególnych elementów systemu automatycznego rozpoznawania mówcy w warunkach zróżnicowanych torów akustycznych. Dokonano tego za pomocą algorytmu genetycznego poprzez wyselekcjonowanie optymalnego zbioru cech silnie zależnych od głosu mówcy przy jednoczesnej minimalizacji wzajemnej korelacji cech oraz ich wrażliwości na zróżnicowanie toru akustycznego. Przedstawiono również wyniki optymalizacji wybranych elementów klasyfikatora, m.in. liczby rozkładów Gaussa.
EN
This paper presents optimization methods of an automatic speaker recognition system parameters for various acoustic paths. This idea has been performed using the genetic algorithm. The main goal of the proposed algorithm is to select the most important features, minimize correlation between the features and their sensitivity for various acoustic path. Additionally results of classifier optimization (for example number of Gaussian distributions), have been shown.
7
Content available remote Identyfikacja głosowa w otwartym zbiorze mówców
PL
W artykule zaprezentowano wyniki badań systemu automatycznego rozpoznawania mówcy, przeprowadzane z wykorzystaniem komercyjnej bazy głosów TIMIT. Głównym celem badań było rozszerzenie funkcjonalności systemu rozpoznawania mówcy poprzez dodanie układu progowego, a tym samym umożliwienie identyfikacji w otwartym zbiorze mówców. Przedstawiono różne warianty zastosowanego układu progowego oraz dokonano próby wzbogacenia wektora cech dystynktywnych o różnicę częstotliwości podstawowej wyznaczanej dwiema różnymi metodami.
EN
In the article there are presented the test results of the automatic speaker recognition system, conducted while using the commercial voice basis TIMIT. The main purpose of the test was to extend the functionality of the speaker recognition system by adding the threshold based system, and consequently to enable the identification in the open set of speakers. There are presented different application variants of the threshold based system and there is an attempt to enrich the vector of distinctive features with the fundamental frequency difference determined with two different methods.
PL
Zaprezentowane w niniejszym artykule badania stanowią kontynuację dotychczasowych prac mających na celu opracowanie mobilnego detektora upadków. Przedstawiony algorytm opiera się na dyskretnej transformacji falkowej sygnałów z dostępnych w detektorze sensorów oraz pojedynczym klasyfikatorze w postaci sieci wektorów nośnych - SVM (ang. Support Vector Machine). Do procesu redukcji cech zastosowano miarę istotności Fishera. W wyniku zmniejszenia liczby cech zmniejszeniu uległa również liczba wektorów nośnych sieci SVM, mająca bezpośredni wpływ na górne oszacowanie błędu klasyfikacji. Na podstawie otrzymanych wyników wyznaczono parametry klasyfikatora pozwalające na zaprezentowanie opracowanej koncepcji w polu krzywych ROC (ang. Receiver Operating Characteristics) oraz porównanie ich z wynikami otrzymanymi dla pojedynczych sensorów detektora. Opracowana koncepcja daje zdecydowanie lepsze rezultaty niż każdy z sensorów działający niezależnie. Rezultaty przeprowadzonych badań dały bardzo dobre wyniki w porównaniu z dotychczasowymi wynikami, przy znacznej redukcji liczby wymaganych deskryptorów. Z uwagi na ścisłą zależność pomiędzy liczbą danych uczących oraz liczbą wektorów nośnych, które bezpośrednio wpływają na górne oszacowanie błędu klasyfikacji, dokonano redukcji deskryptorów. W rezultacie uzyskano zadowalające efekty przy redukcji liczby deskryptorów z 38 do zaledwie 6, zapewniając, że górne oszacowanie błędu klasyfikacji, w zbiorze nowych danych testowych nie przekracza 5,3%.
EN
The studies presented in this article are the continuation of previous work to develop a mobile fall detector. The algorithm is based on a discrete wavelet transform of the signals from the sensors available at the detector and a linear support vector machine as a classifier. Fisher score method is used for feature selection in the proposed algorithm. As a result of reducing the number of features, the number of support vectors has been also reduced - it has a direct impact on the upper estimate of the classification error. On the basis of the obtained results, the classifier parameters have been calculated. This allows presenting the developed concept in the field of ROC curves (Receiver Operating Characteristics) and their comparison with the results obtained for individual sensors. The developed concept gives much better results than each of the sensors acting independently. The findings of this study have given very good results in comparison with the previous findings, with a significant reduction in the number of required features. Due to the close relationship between the number of training data and the number of support vectors which directly affect the upper estimate of the classification error, the number of features has been reduced. Finally, satisfactory results have been obtained with the reduction of the number of features from 38 to just six, ensuring that the upper estimation of the classification error in the set of the new test data does not exceed 5.3%.
PL
W artykule przedstawiono wyniki badań automatycznego systemu rozpoznawania mówcy (ASR – ang. Automatic Speaker Recognition), przeprowadzonych na podstawie komercyjnej bazy głosów TIMIT. Badania prowadzone były pod kątem zastosowania ASR jako systemu automatycznego rozpoznawania rozmówcy telefonicznego. Przedstawiono również wpływ liczebności bazy głosów oraz stopień oddziaływania kompresji stratnej MP3 na skuteczność rozpoznawania mówcy.
EN
The article presents the results of tests of an automatic speaker recognition system (ASR) conducted on the basis of the TIMIT commercial voice database. The research was conducted with the aim of using ASR as a system for automatic recognition of telephone callers. The impact of the number of voices in the database and the effect of lossy MP3 compression on the effectiveness of speaker recognition has also been shown.
PL
W artykule zaprezentowano wyniki badań opracowanego mechanizmu detekcji upadków. Wysoką niezawodność oraz niski poziom fałszywych alarmów uzyskano w wyniku zastosowania czterech niezależnych sensorów różnych wielkości fizycznych oraz wyrafinowanych metod przetwarzania sygnałów i eksploracji danych. Przeprowadzone badania pozwalają na stwierdzenie, że pominięcie znaku deskryptorów znacznie poprawia skuteczność prawidłowej klasyfikacji upadków. Z tego powodu w dalszych pracach zostanie przyjęty algorytm wykorzystujący wartości bezwzględne wyznaczanych cech. W trakcie badań zaobserwowano, że zwiększanie liczby cech użytych w procesie uczenia oraz testowania nie prowadzi do zwiększenia jakości klasyfikacji. Wynika stąd potrzeba dobrania optymalnej liczby deskryptorów. Dlatego istotnym warunkiem poprawy skuteczności systemu jest przeprowadzenie właściwej selekcji cech, co jest głównym celem kolejnego etapu badań.
EN
The paper presents the results of research on a fall detection algorithm. The high reliability and a low level of false alarms were obtained by the use of four independent sensors of various physical quantities as well as sophisticated methods of signal processing and data mining. The algorithm was implemented and tested in Matlab. It was based on the discrete wavelet transform and a support vectors machine. The source of the data was processed by the detector presented in [5, 6]. The device integrates four MEMS sensors. It includes an atmospheric pressure sensor and three triaxial sensors, such as an accelerometer, a gyroscope and a magnetometer. The signal from each of the available sensors was sampled at a frequency of 25 Hz. The processed and analyzed frame had the length of 100 samples, which equaled four-second registration. The scheme of the measurement system is shown in Figure 3. The obtained findings were the basis for the presentation of each sensor in the field of ROC curves in two variants (taking into account an extracted feature with the sign and with its omission). Definitely, better results were obtained using the absolute values of the descriptors in the process of learning/testing. The best results of fall detection were received for a gyroscope and an accelerometer, followed by a magnetometer and a barometric pressure sensor. From the studies one can draw a conclusion that the omission of the sign descriptors significantly improves the correct classification of falls. For this reason, in further work there will be adopted an algorithm using the absolute values of extracted features. During the study it was observed that the increase in the number of features used in learning and testing did not lead to the increase in the quality of classification. This calls for the selection of the optimum number of descriptors. Therefore, an important prerequisite to improve the efficiency of the system is a proper feature selection, which is the main objective of the next stage of investigations. In further research, we plan to implement the data fusion algorithm in order to increase the effectiveness of the mechanisms developed.
PL
Artykuł prezentuje algorytm do detekcji niekontrolowanych upadków człowieka. Wiele dostępnych rozwiązań bazuje na pojedynczych sensorach, a uzyskiwane rezultaty są zazwyczaj wynikiem implementacji algorytmów bazujących na progach, po przekroczeniu których uruchamiana jest procedura alarmowa. W odróżnieniu do takiego podejścia w artykule zaprezentowano i przebadano algorytm detekcji upadków bazujący na dekompozycji falkowej oraz liniowej sieci wektorów nośnych. Uzyskane wyniki dały w rezultacie poprawną klasyfikację wszystkich badanych zdarzeń upadków, z niewielką liczbą zgłaszanych fałszywych alarmów. Zaprezentowane badania są kontynuacja prac mających na celu opracowanie mobilnego detektora upadków.
EN
This article presents an algorithm for the detection of uncontrolled falls. Many of the available solutions are based on data from individual sensors. The results obtained through them are usually based on thresholds algorithms beyond which the alarm is triggered. In contrast to this approach, in this article falls detection algorithm based on wavelet decomposition and linear support vector machine has been presented and tested. The results have given the correct classification of all fall events, with a small number of false positives. The presented study is the continuation of the work to develop a mobile fall detector.
EN
The paper describes the problems associated with electroencephalographic examination of hearing. Due to the fact that the current methods are mainly based on the interpretation of the timing electroencephalograms and require a large experience of examining neurologist, a task was undertaken to eliminate the subjective evaluation of results, and to automate testing. The authors, using the CPS methods have identified distinctive features differentiating evoked potentials well differentiating normal cases from pathological ones.
PL
Artykuł opisuje problemy związane z oceną zmysłu słuchu przy pomocy elektroencefalografu. Ponieważ aktualne metody są skupione na interpretacji czasowej elektroencefalogramów i wymagają dużego doświadczenia egzaminującego neurologa, podjęto się zadania wyeliminowania subiektywnej oceny wyników i automatyzacji badań. Autorzy używając metod CPS wskazali dystynktywne cechy wywołanych potencjałów, które pozwalają na łatwe odróżnienie przypadków patologicznych od zdrowych
PL
W niniejszym artykule zaprezentowano zaimplementowany w środowisku Matlab system automatycznego rozpoznawania mówcy, wykorzystujący do opisu głosu unikatowy wektor cech, tzw. „odcisk głosu” (VP – ang. Voice Print). System używa w procesie klasyfikacji tzw. modele mieszanin Gaussowskich (GMM – ang. Gaussian Mixture Model). W końcowej części artykułu przedstawione są badania skuteczności rozpoznawania mówców dla różnych wariantów systemu oraz w różnych konfiguracjach jego parametrów.
EN
The paper discusses the system of automatic speaker recognition, implemented in Matlab environment and using a unique vector of features, the so-called voice print (VP) for voice description. The system uses the so-called Gaussian Mixture Models (GMM) for the classification process. The final section of the paper presents the studies on the efficiency of speaker recognition for various system versions and for different system parameter configurations.
PL
W artykule przedstawiono projekt zestawu do rejestracji dźwięków mowy zaimplementowanego w biometrycznym systemie identyfikacji osób. Zaprezentowano także problematykę związaną z torem dźwiękowym pomiędzy mówcą a systemem decyzyjnym, klasyfikację źródeł zakłóceń i zniekształceń towarzyszących procesowi rejestracji i obróbki dźwięku oraz klasyfikację metod i algorytmów poprawy jakości rejestrowanego sygnału mowy.
EN
The paper presents the project of a specialized kit for adaptive method reduction speech sounds in biometric identification system. There are the voice path from the speaker’s mouth to the decision system, a classification of various sources of interferences and distortions connected with the sound recording, as well as classification of methods and algorithms for improvement of the voice quality described.
PL
W artykule opisano problematykę związaną z elektroencefalograficznym badaniem słuchu. Ze względu na to, że obecne metody opierają się głównie na interpretacji przebiegów czasowych elektroencefalogramów i wymagają od badającego neurologa dużego doświadczenia, podjęto się zadania, które ma na celu eliminację subiektywnej oceny wyników oraz zautomatyzowanie badania. Autorzy korzystając z metod CPS wyodrębnili cechy dystynktywne potencjałów wywołanych dobrze różnicujące przypadki prawidłowe od patologicznych.
EN
The paper describes the problems associated with electroencephalographic examination hearing. Due to the fact that the current methods are mainly based on the interpretation of the timing electroencephalograms and require a large experience of examining neurologist, it was a task that aims to eliminate the subjective evaluation of results, and test automation. The authors use the CPS methods have identified distinctive features of evoked potentials well differentiating normal form pathological cases.
PL
W referacie przedstawiono zagadnienia związane z opracowaniem systemu automatycznego rozpoznawania mówcy. Autorzy skupili się na wykorzystaniu metod przetwarzania sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy, co w konsekwencji wiązało się z wykorzystaniem tzw. technik homomorficznych. W zaprojektowanym systemie kluczowe znaczenie ma zarówno proces ekstrakcji cech osobniczych, jak i towarzyszący mu proces klasyfikacji. Badania przedstawione w referacie skupiały się więc w pierwszym etapie na opracowaniu generatora cech opartego na fuzji cech cepstralnych i melcepstralnych oraz odpowiedniej selekcji deskryptorów. W drugim etapie autorzy dokonali optymalizacji parametrów generatora z uwzględnieniem docelowej metody klasyfikacji. Oceny otrzymanych wyników dokonano w oparciu o zbiór 500 próbek głosu od 50 mówców (po 10 próbek od każdego mówcy) i otrzymano 489 poprawnych klasyfikacji, co daje błąd klasyfikacji na poziomie 2,2%.
EN
The paper examines issues related to the determination of automatic speaker recognition systems. The authors focus on the use of speech signal processing methods that consider the phenomena connected with the speech generation process, which in turn connected to using a homomorphic processing methods. In a designed system crucial issue have both the extraction process of individual characteristics and classification process. The research presented in this paper focused primarily in the first stage on determination of features distinctive to sound generators using a fusion of cepstral and mel-cepstral information and also considers the feature selection. In the second stage optimization of the generator parameters taking account of suitable classification methods has been done by the authors. Finally, the evaluation of the results was based on the set of 500 samples of the acoustic signal from the 50 speakers (10 samples for each speaker) and 489 correct classification, which gives clasification error on 2,2% level.
PL
Co trzeci człowiek powyżej 65. roku życia przynajmniej raz do roku narażony jest na upadek [1, 2]. W roku 2002 z powodu upadków zmarło 391 tysięcy ludzi [1]. Upadki oraz urazy nimi spowodowane stanowią istotny problem zdrowia publicznego i często wymagają natychmiastowej pomocy medycznej. Bardzo szybka detekcja niekontrolowanego upadku pozwala na skrócenie czasu hospitalizacji, a przede wszystkim zmniejszenie potencjalnego ryzyka wystąpienia groźnych powikłań pourazowych. W niniejszym artykule zaprezentowano projekt bezprzewodowego urządzenia do detekcji niekontrolowanych upadków. Zaprojektowane urządzenie zaopatrzone jest w cztery sensory: żyroskop, akcelerometr, magnetometr oraz sensor ciśnienia. Dane z sensorów przetwarzane są w mikrokontrolerze, który w pierwszym etapie dokonuje operacji związanych z fuzją i integracją danych. Następnie w module decyzyjno-wnioskującym podejmowana jest decyzja o detekcji upadku i wyzwoleniu procedury alarmowej. Zgłoszenie alarmu odbywa się za pośrednictwem sieci bezprzewodowej, umożliwiającej podłączenie urządzenia do integratora sensorycznego, którym może być np. telefon komórkowy z dedykowaną aplikacją.
EN
At least once a year every third person over 65 years of age is exposed to a fall [1, 2]. 391,000 people died due to falls in 2002 [1]. Falls and injuries caused by them are an important public health problem and often require immediate medical attention. Very fast detection of uncontrolled falls shortens the duration of hospitalization and reduces the potential risk of serious complications of injuries. This paper presents the design of a wireless device for the detection of uncontrolled falls. The device consists of four sensors: a gyroscope, an accelerometer, a magnetometer, and a pressure sensor. Data from the sensors are processed in the microcontroller, which performs the operations of data fusion and integration. The decision about the fall detection is made in the next step and if it is needed, it triggers an alarm. Alarm notification is sent via wireless network. The device can be connected to the sensor integrator, i.e. a mobile phone with the dedicated application, which can call for help.
18
Content available remote Modeling and optimization of the feature generator for speaker recognition systems
EN
This paper presents issues related to modeling and optimization of the feature generator for the speaker recognition system (ASR – Automatic Speakers Recognition). The parameterization stage of generating a speech signal (features generation) is fundamental in this type of system because the unique vector of features is crucial in the process of speech recognition. The task is to describe the speech signal using as few descriptors as possible without loss of relevant information for speaker recognition. In addition, the parameterization should be robust to acoustic and technical registration conditions and to the recorded linguistic material. The research presented in this paper focused primarily on the multicriteria optimization of selected parameters of the feature generator based on cepstral analysis that additionally enables the selection of features. Finally, the evaluation of the results was based on the analysis of the main components of a set of descriptors for the samples of voice acquired from 24 speakers.
PL
W referacie przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition – ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzgledniającej dodatkowo selekcję cech. Oceny otrzymanych wyników dokonano w oparciu o analizę składników głównych (ang. Principal Component Analysis – PCA) zbioru deskryptorów wyznaczonych dla próbek głosu pochodzących od 24 mówców.
EN
The paper presents the problem of automatic speaker recognition system. Automatic recognition of speaker is a process designed to determine, whether a particular statement belongs to the speaker. The speech signal is a carrier of both physiological and behavioral features. No two individuals sound identical, because their vocal tract shapes, larynx sizes, and other parts of their voice production organs are different. This paper contains a description of the speech signal analysis algorithms, designed based on normalized real cepstrum. The authors have attempted to select the optimal set of parameters describing the speaker. The study has primarily focused on assessing applicability of the cepstral analysis of speech signal. In addition results of experiments are presented using a PCA method.
PL
W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy. Automatyczne rozpoznawanie mówcy jest procesem mającym na celu określenie, czy dana wypowiedź należy do określonego mówcy. Sygnał mowy jest nośnikiem zarówno cech fizjologicznych, jak i behawioralnych. Nie ma dwóch identycznie brzmiących osób, ze względu na fakt występujących różnic w budowie krtani, głośni, traktu wokalnego oraz innych organów artykulacyjnych u każdego człowieka. Praca zawiera opis algorytmów analizy sygnału mowy opracowanych w oparciu o rzeczywiste cepstrum. Dzięki tej technice multiplikatywny związek pobudzenia i traktu głosowego zastąpiony zostaje związkiem addytywnym, co znacznie upraszcza separację obu składników. Autorzy podjęli się próby wyboru optymalnego zestawu cech charakteryzujących danego mówcę. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy. Dodatkowo uzyskane wyniki eksperymentów przedstawiono przy pomocy metody PCA.
EN
The article presents issues related with examination of auditory evoked potentials. The current methods are mainly based on timing interpretation of waveform potentials. Such method requires significant experience from examining neurologist. From this reason the authors have undertaken the task aimed at elimination of subjective assessment of results and automation of the tests. To isolate distinctive features of evoked potentials and differentiate the normal results from pathological cases, authors used methods of digital signal processing. The use of wavelet decomposition and linear SVM network has ensured correct classification of 40 different clinical cases, including 20 normal and 20 pathological cases.
PL
Artykuł przedstawia problemy związane z badaniem słuchowych potencjałów wywołanych. Obecne metody bazują głównie na czasowej interpretacji przebiegów potencjałów. Metody te wymagają dużego doświadczenia ze strony neurologa przeprowadzającego badanie. Uwzględniając powyższe, autorzy podjęli się zadania wyeliminowania subiektywnej oceny wyników oraz zautomatyzowania badania. W celu wyodrębnienia cech dystynktywnych z potencjałów wywołanych oraz rozróżnienia przypadków poprawnych i patologicznych, autorzy użyli metod cyfrowego przetwarzania sygnałów. Użycie dekompozycji falkowej oraz liniowych sieci SVM dało w rezultacie poprawną klasyfikację 40 przypadków klinicznych, zawierających 20 poprawnych i 20 patologicznych przebiegów.
first rewind previous Strona / 2 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.