Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 13

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  features extraction
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
The spread of the coronavirus has claimed the lives of millions worldwide, which led to the emergence of an economic and health crisis at the global level, which prompted many researchers to submit proposals for early diagnosis of the coronavirus to limit its spread. In this work, we propose an automated system to detect COVID-19 based on the cough as one of the most important infection indicators. Several studies have shown that coughing accounts for 65% of the total symptoms of infection. The proposed system is mainly based on three main steps: first, cough signal detection and segmentation; second, cough signal extraction; and third, three techniques of supervised machine learning-based classification: Support Vector Machine (SVM), KNearest Neighbours (KNN), and Decision Tree (DT). Our proposed system showed high performance through good accuracy values, where the best accuracy for classifying female coughs was 99.6% using KNN and 88% for males using SVM.
EN
Parkinson's disease (PD) is a neurodegenerative disease of the central nervous system (CNS) characterized by the progressive loss of dopaminergic neurons in the substantia nigra. The article describes an analysis of pilot voice signal analysis in Parkinson's disease diagnostics. Frequency domain signal analysis was mainly used to assess the state of a patient's voice apparatus in order to support PD diagnostics. The recordings covered uttering the “a” sound at least twice with extended phonation. The research utilized real recordings acquired in the Department of Neurology at the Medical University of Warsaw, Poland. Spectral speech signal coefficients may be determined based on different defined frequency scales. The authors used four frequency scales: linear, Mel, Bark and ERB . Spectral descriptors have been defined for each scales which are widely used in machine and deep learning applications, and perceptual analysis. The usefulness of extracted features was assessed taking into account various methods. The discriminatory ability of individual coefficients was evaluated using the Fisher coefficient and LDA technique.. The results of numerical experiments have shown different efficiencies of the proposed descriptors using different frequencies scales.
PL
Choroba Parkinsona (PD) jest neurodegeneracyjną chorobą ośrodkowego układu nerwowego charakteryzującą się postępującą utratą neuronów dopaminergicznych w istocie czarnej. W artykule opisano analizę rejestracji pilotażowych sygnałów głosu w diagnostyce choroby Parkinsona. Rejestracji podlegało co najmniej dwukrotnie wypowiadanie głoski "a” o przedłużonej fonacji. Do badań wykorzystano nagrania zarejestrowane w Katedrze i Klinice Neurologii Warszawskiego Uniwersytetu Medycznego w Warszawie. Do oceny stanu aparatu głosu pacjenta celem wsparcia diagnostyki choroby Parkinsona wykorzystano w głównej mierze analizę sygnału w dziedzinie częstotliwości. Autorzy zastosowali cztery skale częstości: liniową, skalę typu Mel, skalę typu Bark oraz skalę typu ERB. Dla każdej z tych skali zdefiniowali deskryptory spektralne szeroko stosowane w aplikacjach uczenia maszynowego i głębokiego uczenia się oraz w analizie percepcyjnej. Ocena przydatności wyekstrahowanych cech została zrealizowana z uwzględnieniem różnych metod. Wykorzystano metodą oceny jakości cech przy użyciu współczynnika istotności Fischera oraz analizę LDA. Wyniki eksperymentów numerycznych wykazały różne wydajności proponowanych deskryptorów przy użyciu różnych skal częstości.
EN
The excessive drinking of alcohol can disrupt the neural system. This can be observed by properly analysing the Electroencephalogram (EEG) signals. However, the EEG is a signal of complex nature. Therefore, an accurate categorization between alcoholic (A) and nonalcoholic (NA) subjects, while using a short time EEG recording, is a challenging task. In this paper a novel hybridization of the oscillatory modes decomposition, features mining based on the Second Order Difference Plots (SODPs) of oscillatory modes, and machine learning algorithms is devised for an effective identification of alcoholism. The Empirical Mode Decomposition (EMD) and Variational Mode Decomposition (VMD) are used to respectively decompose the considered EEG signals in Intrinsic Mode Functions (IMFs) and Modes. Onward, the SODPs, derived from first six IMFs and Modes, are considered. Features of SODPs are mined. To reduce the dimension of features set and computational complexity of the classification model, the pertinent features selection is made on the basis of Wilcoxon statistical test. Three features with p-values (p) of < 0.05 are selected from each intended SODP and these are the Central Tendency Measure (CTM), area and mean. These features are used for the discrimination between A and NA classes. In order to determine a suitable EEG signal segment length for the intended application, experiments are performed by considering features extracted from three different length time windows. The classification is carried out by using the Least Square Support Vector Machine (LS-SVM), Multilayer perceptron neural network (MLPNN), K-Nearest Neighbour (KNN) and Random Forest (RF) algorithms. The applicability is tested by using the UCI-KDD EEG dataset. The results are noteworthy for MLPNN with 99.89% and 99.45% accuracies for EMD and VMD respectively for 8-second window.
4
Content available remote Text Independent Automatic Speaker Recognition System using fusion of features
EN
This paper presents a speaker recognition system, which is independent of the linguistic context. The solved task includes: the preprocessing stage, the segmentation of speech signal leading to the extraction of features based on three techniques, selection of the most important features, and the classification stage involving a serial combination of classifiers. Sets of descriptors were obtained using three techniques: cepstral coefficients, mel-cepstral coefficients and original weighted cepstral coefficients. Optimal robust “Voice Print” has been determined using fisher coefficients and PCA analysis. Experiments on the 2002 NIST Speaker Recognition Evaluation corpus show that the proposed system is able to recognise the speaker, regardless on the speech content, even language content with great accuracy.
PL
W pracy przedstawiono system rozpoznawania mówcy niezależny od tekstu wypowiedzi. Rozwiązane problemy obejmują: etap przetwarzania wstępnego, segmentację sygnału mowy prowadzącą do etapu ekstrakcji cech bazującej na trzech technikach analizy sygnału mowy, selekcję najbardziej istotnych cech oraz etap klasyfikacji obejmujący analizę kaskady klasyfikatorów. Zestaw cech uzyskano przy użyciu trzech technik: cepstrum, mel-cepstrum oraz autorskich ważonych cech cesptralnych. Optymalny wektor cech wyekstrahowano przy użyciu współczynników istotności Fishera oraz analizy PCA. Eksperymenty z wykorzystaniem bazy 2002 NIST Speaker Recognition Evaluation pokazują, że przedstawiony system rozpoznaje mówcę niezależnie od ograniczeń lingwistycznych treści, a nawet języka wypowiedzi, z zadowalającą dokładnością.
EN
Intelligent transportation systems are rapidly growing mainly due to active development of novel hardware and software solutions. In the paper a problem of automatical number plate detection is considered. An efficient two-step approach based on plate candidates extraction with further classification by neural network is proposed. Stroke width transform and contours detection techniques are utilized for the image preprocessing and extraction of regions of interest. Different local feature sets are used for the final number plate extraction step. Efficiency of the developed method is tested with real datasets.
EN
The scalability of indexing techniques and image retrieval pose many problems. Indeed, their performance degrades rapidly when the database size increases. In this paper, we propose an efficient indexing method for high-dimensional spaces. We investigate how high-dimensional indexing methods can be used on a partitioned space into clusters to help the design of an efficient and robust CBIR scheme. We develop a new method for efficient clustering is used for structuring objects in the feature space; this method allows dividing the base into data groups according to their similarity, in function of the parameter threshold and vocabulary size. A comparative study is presented between the proposed method and a set of classification methods. The experiments results on the Pascal Visual Object Classes challenges (VOC) of 2007 and Caltech-256 dataset show that our method significantly improves the performance. Experimental retrieval results based on the precision/recall measures show interesting results.
EN
In this paper, a technique for determining required link band-width of a multi-path routing algorithm dedicated to Network on Chip (NoC) is presented. The proposed algorithm is based on the linear programming and allows us to avoid deadlocks and contentions in case of Tapeworm routing used for data-dominated streaming multimedia applications realized in Multi Processor Systems on Chip. The proposed approach is illustrated with an example of features extraction module for the Automatic Speech Recognition (ASR) system.
PL
W artykule opisano technikę określania wymaganej przepustowości łączy sieci wewnątrzukładowej z routingiem wielościeżkowym. Zaproponowany algorytm bazuje na programowaniu liniowym i umożliwia unikanie blokad w routingu typu Tapeworm, wykorzystywanego dla multimedialnych aplikacji zdominowanych przez dane realizowanych w układach typu MPSoC. Autorski algorytm routingu Tapeworm dla niektórych aplikacji multimedialnych okazuje się być wydajniejszy od XY, powszechnie używanego algorytmu routingu w NoC. Zaproponowane podejście zostało zilustrowane przykładem modułu ekstrakcji cech w systemie automatycznego rozpoznawania mowy. Klasyczny diagram takiego modułu został przedstawiony na rys. 1. W celu określenia marszrut pomiędzy rdzeniami realizującymi funkcjonalności poszczególnych bloków tego modułu została zaadaptowana technika znana z tradycyjnych sieci komputerowych, opisana m.in. w [8]. W artykule zaproponowano sposób wyboru ścieżek między rdzeniem źródłowym i docelowym, opisano sposób określania ograniczeń, a także zaproponowano funkcję celu uwzględniającą długość ścieżki. Do wyszukiwania optymalnej przepustowości łączy wykorzystano algorytm przypominający wyszukiwanie binarne. Badania eksperymentalne, w ramach których zaimplementowano opisany moduł w języku SystemC, a także wykorzystano komercyjne narzędzie do rozwiązywania problemu programowania liniowego, potwierdzają skuteczność i efektywność opisywanego podejścia.
PL
Artykuł porusza zagadnienia dotyczące klasyfikacji stron internetowych. Klasyfikacja przeprowadzana jest w oparciu o analizę struktury oraz zawartości stron. Pod uwagę brane są cechy zróżnicowanym charakterze, w tym między innymi cechy strukturalne, wizualne, tekstowe, łączy internetowych. Przy budowie klasyfikatorów wykorzystano algorytm AdaBoost. Skupiono się na wpływie metody selekcji słów kluczowych na skuteczność procesu klasyfikacji.
EN
The paper concerns the issues of web pages analysis process. The classification is performed based on the analysis of the structure as well content of pages. Various characteristics are taken into account including inter alia, structural, visual, text, web and links features. During the construction of classifiers the AdaBoost algorithm was applied. This paper focuses on the impact of keyword selection methods on the effectiveness of the classification process.
PL
W pracy przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition - ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzględniającej dodatkowo selekcję cech. Oceny otrzymanych wyników dokonano w oparciu o analizę składników głównych (ang. Principal Component Analysis - PCA) zbioru deskryptorów wyznaczonych dla próbek głosu pochodzących od 24 mówców.
EN
The paper presents issues related to modeling and optimization of the features generator for the speaker recognition system (ASR - Automatic Speakers Recognition). Parameterization's stage of the speech signal (features generation) is fundamental in this type of systems, due to the fact that the unique vector of features is crucial in the process of recognition. The task is to describe the speech signal using descriptors as little as possible, without loss of relevant information to the speaker recognition. In addition, parametrization should have robust to acoustic and technical registration conditions and the recorded linguistic material. The research presented in this paper is focused primarily on the multicriteria optimization of selected parameters of the features generator based on cepstral analysis, additionally allowing features selection. Finally, evaluation of the results was based on the analysis of main components, a set of descriptors for the samples voice acquired from 24 speakers.
PL
Artykuł dotyczy analizy informacji opisujących strony internetowe. Celem analizy jest wsparcie procesu ich klasyfikacji. Brane są pod uwagę cechy o zróżnicowanym charakterze, w tym między innymi cechy: strukturalne, wizualne, tekstowe, łączy internetowych. Przy budowie klasyfikatorów wykorzystano algorytm AdaBoost. W artykule przedstawiono implementację omawianego rozwiązania oraz wyniki przeprowadzonych eksperymentów.
EN
The article concerns the analysis of information describing the web pages. The aim of the analysis is to support the process of their classification. Various characteristics are taken into account including inter alia, structural, visual, text, web and links features. During the construction of classifiers the AdaBoost algorithm was applied. The paper presents the implementation of this solution and the results of experiments.
EN
The paper regards the possibility of using new numerical features extracted from the phase spectrum of a speech signal for voice quality estimation in acoustic analysis for medical purposes. This novel approach does not require detection or estimation of the fundamental frequency and works on all types of speech signal: euphonic, dysphonic and aphonic as well. The experiment results presented in the paper are very promising: the developed F0-independant voice features are strongly correlated with two voice quality indicators: grade of hoarseness G (r>0.8) and roughness R (r>0.75) from GIRBAS scale, and exceed the standard voice parameters: jitter and shimmer.
PL
Artykuł dotyczy możliwości ekstrakcji cech numerycznych z widma fazowego sygnału mowy w celu wykorzystania w analizie akustycznej na potrzeby medyczne. Podejście to umożliwia uzależnienie analizy akustycznej od zawodnych metod wykrywania/wyznaczania częstotliwości podstawowej (tonu krtaniowego) i dzięki temu przeznaczone jest do badania wszystkich typów sygnału mowy (również afonicznych). Wyniki eksperymentu są bardzo obiecujące - proponowane cechy Ph1 i Ph2 są silnie skorelowane z dwoma kategoriami percepcyjnymi: stopniem chrypki (r>0.8) oraz szorstkością głosu (r>0.75) ze skali GIRBAS, wykazując silniejsze znaczenie diagnostyczne niż znane i stosowane od dawna wskaźniki jitter i shimmer. Proponowane podejście oprócz skuteczności charakteryzuje się szeregiem dodatkowych korzyści: algorytm metody z powodu niskiej złożoności jest szybki i niekosztowny, interpretacja matematyczna jest prosta i jednoznaczna oraz spójna z obserwowanym obrazem widma fazowego głosu. Ponadto uniezależnienie od detekcji częstotliwości podstawowej sprawia, że algorytm jest deterministyczny oraz efektywny dla każdego typu sygnału mowy.
12
Content available remote Texture Classification Using Combined Image Decomposition Methods
EN
The developments of multiresolution analysis, such as the wavelet, curvelet and contourlet transforms, have yielded adequate tools to characterize different scales of textures effectively. These methods exhibit different performances in processing texture images due to their different characteristics. In order to use those complementary characteristics simultaneously, a texture classification method by combining different image decomposition methods is proposed. The proposed method is compared with the methods where only one kind of multiresolution transform is used. The experimental results demonstrate that the combined features can effectively capture the complementary information from different image decomposition methods and obviously improve the texture classification accuracy.
EN
An improved and fully automated image segmentation method applied to radiological regions of interests is described. Pre-processed and filtered regions of interests are subjected to a segmentation function with hierarchical multigrid approach. This approach uses the Gibbs random fields method and estimation of intensity functions to separate the bony structure, soft tissue, and cartilage if any. The segmentation is performed by a maximization of the a posteriori probability density function. A known segmentation procedure is improved by implementing an adaptive method of a noise estimation and modeling of pixels interactions coefficient based on a global contrast of input image. These values do not depend on the segmentation algorithm and are not estimated during the segmentation process. Segmented regions are subjected to extraction features, which reflect the size and shape of epiphysis. The algorithm was tested on 264 regions of interest for boys population between 0 to 14 years of age.
PL
W pracy opisano ulepszoną I w pełni zautomatyzowaną metodę segmentacji obrazów zastosowaną do radiologicznych zdjęć nadgarstka. Wstępnie przetworzone i przefiltrowane regiony zainteresowań są poddawane procedurze segmentacji z wykorzystaniem techniki zmiany rozdzielczości obrazu. W procesie segmentacji w celu rozdzielenia tkanek miękkiej, kostnej oraz chrzęstnej zastosowano teorię pól losowych Gibbsa oraz estymację funkcji intensywności obrazu. Segmentacja dokonuje się przez maksymalizację funkcji gęstości prawdopodobieństwa a posteriori. Opracowana na podstawie literatury metoda segmentacji jest ulepszona o implementację adaptacyjnej metody estymacji zakłóceń oraz modelowania współczynnika interakcji pomiędzy sąsiadującymi pikselami obrazu w oparciu o globalny kontrast w analizowanym obrazie. Wartości te nie zależą od algorytmu segmentacji i nie są szacowane podczas procesu segmentacji. Wysegmentowane obszary poddawane są procesowi ekstrakcji cech, które odzwierciedlają wielkość i kształt nasady. Algorytm przetestowano na 264 przypadkach w populacji chłopców w wieku od 0 do 14 lat.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.