Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 12

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  analiza cepstralna
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
W pracy opisano przykładowy system rozpoznawania poleceń głosowych, wyposażony w bazę wiedzy zawierającą 21 słów. W systemie sygnał mowy jest dekomponowany za pomocą transformacji falkowej. Poszczególne pasma zdekomponowanego sygnału są poddawane analizie cepstralnej, w wyniku czego ekstrahowane są cechy związane z informacją, niesioną w sygnale mowy. Cechy te są następnie poddawane dwupoziomowej klasyfikacji za pomocą sieci neuronowej typu sieć samoorganizująca się. Skuteczność rozpoznawania w systemie, omówiona na końcu pracy, plasuje się na poziomie 39% (rozpoznawanie pewne) plus 43,5% (rozpoznawanie niepewne). Na końcu pracy zasugerujemy również metody potencjalnego podniesienia skuteczności rozpoznawania w proponowanym systemie.
EN
This work describes an example of voice commands recognition system, equipped with a database with 21 words included. The speech signal in the system is decomposed using Wavelet Transformation. Individual sub-bands of the decomposed signal are then analysed using cepsrtal analysis, and the features related to spoken information are extracted. This features are then classified with a self organizing map neural network. The effectiveness of recognition is about 39% (sure recognition), plus about 43,5% (unsure recognition). Addtionally, some potential improvements of the recognition effectiveness are proposed.
PL
W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy (ASR – ang. Automatic Speakers Recognition). Sygnał mowy w postaci pierwotnej charakteryzuje się dużą nadmiarowością, dlatego konieczna jest ekstrakcja specyficznych cech sygnału, za pomocą których możliwy będzie efektywny opis właściwości sygnał, ważnych z punktu widzenia rozpoznawania mówcy. Z tego względu parametryzacja sygnału w procesie rozpoznawania jest niezwykle istotna. Autorzy podjęli się próby wyboru optymalnego (najbardziej dyskryminującego) zestawu parametrów opisujących sygnału w oparciu o metody przetwarzania homomorficznego. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy w systemach rozpoznawania na podstawie pozyskanych w postaci cyfrowej próbek głosu.
EN
The present paper addresses issues related to the speaker recognition system (ASR – Automatic Speakers Recognition). In its primary form, a speech signal is characterized by a high redundancy, so it is necessary to extract the specific features of the signal that would allow to efficiently describing the properties thereof that are important from the viewpoint of speaker recognition. Therefore, parameterization of the signal in the process of recognition is extremely important. The authors have attempted to select the optimal (most discriminating) set of parameters describing the signal by using a homomorphic processing method. The study has primarily focused on assessing applicability of the cepstral analysis in speakers recognition systems based on the acquired digitized voice samples.
3
Content available remote Przetwarzanie mowy w celu sterowania urządzeniami mechatronicznymi
75%
PL
Przedstawiono etapy opracowania metody parametryzacji sygnałów mowy. Adaptowano dekompozycję paczkowej transformacji falkowej oraz zastosowano rozplot homomorficzny. Dzięki wykorzystaniu niejawnych modeli Markowa do rozpoznawania zweryfikowano działanie opracowanej metody. Badania stanowią punkt wyjścia do wdrożenia automatycznego systemu rozpoznawania mowy do sterowania urządzeniami mechatronicznymi.
EN
Illustrated are the steps to develop a method of speech parameterization. Adapted for the purpose was packet decomposition of the wavelet transformation with homomorphic deconvolution also applied. The hidden Markov Models for speech recognition as used were providing at the same time for verification of the developed method. These studies should be considered as the starting point for further implementation of an automatic speech recognition system for control of mechatronic devices.
EN
The paper presents the problem of automatic speaker recognition system. Automatic recognition of speaker is a process designed to determine, whether a particular statement belongs to the speaker. The speech signal is a carrier of both physiological and behavioral features. No two individuals sound identical, because their vocal tract shapes, larynx sizes, and other parts of their voice production organs are different. This paper contains a description of the speech signal analysis algorithms, designed based on normalized real cepstrum. The authors have attempted to select the optimal set of parameters describing the speaker. The study has primarily focused on assessing applicability of the cepstral analysis of speech signal. In addition results of experiments are presented using a PCA method.
PL
W prezentowanym referacie poruszono problematykę systemu rozpoznawania mówcy. Automatyczne rozpoznawanie mówcy jest procesem mającym na celu określenie, czy dana wypowiedź należy do określonego mówcy. Sygnał mowy jest nośnikiem zarówno cech fizjologicznych, jak i behawioralnych. Nie ma dwóch identycznie brzmiących osób, ze względu na fakt występujących różnic w budowie krtani, głośni, traktu wokalnego oraz innych organów artykulacyjnych u każdego człowieka. Praca zawiera opis algorytmów analizy sygnału mowy opracowanych w oparciu o rzeczywiste cepstrum. Dzięki tej technice multiplikatywny związek pobudzenia i traktu głosowego zastąpiony zostaje związkiem addytywnym, co znacznie upraszcza separację obu składników. Autorzy podjęli się próby wyboru optymalnego zestawu cech charakteryzujących danego mówcę. Badania koncentrowały się przede wszystkim na ocenie użyteczności analizy cepstralnej sygnału mowy. Dodatkowo uzyskane wyniki eksperymentów przedstawiono przy pomocy metody PCA.
EN
Automatic, cost-effective, and reliable detection of neurodegenerative diseases (NDs) is one of the important issues in clinical practice. The main idea of the proposed method in this study is to utilize the advantages of gait time series that can provide low-cost and noninvasive measures, homomorphic filtering that can effectively separate muscle activity from body dynamic and recurrent neural network or cascade forward neural network that can learn sequential time-varying data. Experimental results on gait time series of 16 healthy control subjects, 13 patients with amyotrophic lateral sclerosis, 15 patients with Parkinson’s disease and 20 patients with Huntington’s disease have demonstrated high detection performance with an accuracy rate of 100 % using K-fold cross validation for all three types of NDs outperforming other existing methods. The results have also indicated that the use of real cepstral coefficients, oscillation components, or basic statistics feature set has improved the detection performance.
6
Content available remote Robust Cepstrum Radio Frequency Fingerprint Transformed from BPSK Signal
75%
EN
Identifying wireless devices based on Radio Frequency fingerprint (RFF) is a promising physical layer security methodology. One practical issue is the robustness of RFF affected by wireless multi-path channels, etc. Proposed is a kind of RFF with robustness for identifying digital BPSK transmitters. The cepstrum of the received BPSK signal is obtained and then low-pass filtered, the result signal is mainly determined by device impulse response, and thus is robust. The proposed fingerprint can be used in the fusion identification of BPSK wireless transmitters.
PL
W artykule opisano sposób radiowej identyfikacji urządzeń bezprzewodowych, o bezpiecznej identyfikacji cyfrowych nadajników BPSK. Uzyskane cepstrum odebranego sygnału BPSK, poddawane jest filtracji dolno-przepustowej, co w efekcie daje sygnał wyznaczony przez odpowiedź impulsową urządzenia. Opracowany algorytm można wykorzystać w rozpoznaniu łączenia się nadajników BPSK.
PL
W pracy przedstawiono zagadnienia związane z modelowaniem i optymalizacją generatora cech dla systemu automatycznego rozpoznawania mówcy (ang. Automatic Speaker Recognition - ASR). Etap generacji cech (parametryzacji sygnału mowy) jest fundamentalny w tego typu systemach, z uwagi na fakt, że unikatowy wektor cech ma decydujące znaczenie w procesie rozpoznawania. Zadaniem generatora cech jest opisanie sygnału mowy za pomocą możliwie mało licznego zbioru deskryptorów, bez utraty informacji istotnych z punktu widzenia rozpoznawania mówcy. Ponadto parametryzacja powinna wykazywać odporność na warunki akustyczne i techniczne rejestracji oraz na zawartość lingwistyczną rejestrowanego materiału. Badania przedstawione w referacie koncentrowały się przede wszystkim na wielokryterialnej optymalizacji wybranych parametrów generatora cech opartego na analizie cepstralnej, uwzględniającej dodatkowo selekcję cech. Oceny otrzymanych wyników dokonano w oparciu o analizę składników głównych (ang. Principal Component Analysis - PCA) zbioru deskryptorów wyznaczonych dla próbek głosu pochodzących od 24 mówców.
EN
The paper presents issues related to modeling and optimization of the features generator for the speaker recognition system (ASR - Automatic Speakers Recognition). Parameterization's stage of the speech signal (features generation) is fundamental in this type of systems, due to the fact that the unique vector of features is crucial in the process of recognition. The task is to describe the speech signal using descriptors as little as possible, without loss of relevant information to the speaker recognition. In addition, parametrization should have robust to acoustic and technical registration conditions and the recorded linguistic material. The research presented in this paper is focused primarily on the multicriteria optimization of selected parameters of the features generator based on cepstral analysis, additionally allowing features selection. Finally, evaluation of the results was based on the analysis of main components, a set of descriptors for the samples voice acquired from 24 speakers.
8
Content available remote Monitoring of tool condition in drilling.
63%
EN
Requirements for flexible manufacturing have been increasing in the last years. In order to insure effective operation of expansive manufacturing equipment, which has to run automatically and unattended, tool monitoring is important. Therefore, the essential problem to be overcome to achieve the full potential of unmanned machining is the development of effective and reliably sensors systems to monitoring the process and corrective action in case abnormal operation. The ultimate goal of the development of such production equipment is to enhance the oveall economic of the manufacturing process. Even when there are at present many monitoring systems commercially available in the market for turning processes, serious difficulties still remain to be solved to apply monitoring systems successfully in machining centers. Being these difficulties mainly related with the limited accessibility to the rotating tool for sensing purposes in tool driven machining processes. Therefore, the primary objective of the lecture assess the feasibility of using force sugnature analysis as means for monitoring tool condition in drilling.
PL
Monitorowanie stanu narzędzi we współczesnych systemach obróbkowych staje się nieodzowną koniecznością. Istotnym problemem, pozwalającym na pełne wykorzystanie potencjału obróbki bez udziału człowieka jest rozwój efektywnych i niezawodnych systemów sensorowych do monitorowania procesu i korekcji funkcjonowania układu obróbkowego w przypadku odstępstwa od normy. Ostatecznym celem ich rozwoju jest poprawa ekonomiki procesu wytwarzania. Obecnie, mimo dostępności na rynku wielu różnych systemów monitorowania procesu toczenia, występują ciągle trudności w zastosowaniu systemów monitorowania w centrach obróbkowych. Są one związane przede wszystkim z ograniczoną dostępnością do wielkości pozwalających na realizację monitoringu w przypadku stosowania narzędzi obrotowych. Dlatego podstawowym celem niniejszej pracy jest zbadanie możliwości użycia analizy sygnału siły do monitorowania stanu narzędzia w procesie wiercenia.
EN
Almost all people's data is stored on their personal devices. For this reason, there is a need to protect information from unauthorized access by means of user authentication. PIN codes, passwords, tokens can be forgotten, lost, transferred, brute-force attacked. For this reason, biometric authentication is gaining in popularity. Biometric data are unchanged for a long time, different for users, and can be measured. This paper explores voice authentication due to the ease of use of this technology, since obtaining voice characteristics of users doesn't require an equipment in addition to the microphone, which is built into almost all devices. The method of voice authentication based on an anomaly detection algorithm has been proposed. The software module for text-independent authentication has been developed on the Python language. It's based on a new Mozilla's open source voice dataset "Common voice". Experimental results confirmed the high accuracy of authentication by the proposed method.
PL
W opracowaniu przedstawiono wyniki eksperymentu, którego celem było zastosowanie sieci neuronowej typu SVM w zadaniu klasyfikacji stopnia pęknięcia podstawy zęba. Klasyfikator neuronowy oparto na danych wejściowych pochodzących z analizy cepstrum.
EN
The work presents results of an experiment that employs the artificial neuronal network in the task of identification of the degree of tooth root cracking. In the experiment was used cepstrum analysis and SVM neural network.
EN
This study introduces a new and effective epileptic seizure detection system based on cepstral analysis utilizing generalized regression neural network for classifying electroen-cephalogram (EEG) recordings. The EEG recordings are obtained from an open database which has been widely studied with many different combinations of feature extraction and classification techniques. Cepstral analysis technique is mainly used for speech recognition, seismological problems, mechanical part tests, etc. Utility of cepstral analysis based features in EEG signal classification is explored in the paper. In the proposed study, mel frequency cepstral coefficients (MFCCs) are computed in the feature extraction stage and used in neural network based classification stage. MFCCs are calculated based on a frequency analysis depending on filter bank of approximately critical bandwidths. The experimental results have shown that the proposed method is superior to most of the previous studies using the same dataset in classification accuracy, sensitivity and specificity. This achieved success is the result of applying cepstral analysis technique to extract features. The system is promising to be used in real time seizure detection systems as the neural network adopted in the proposed method is inherently of non-iterative nature.
PL
W referacie przedstawiono zagadnienia związane z opracowaniem systemu automatycznego rozpoznawania mówcy. Autorzy skupili się na wykorzystaniu metod przetwarzania sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy uwzględniając zjawiska związane z procesem generacji sygnału mowy, co w konsekwencji wiązało się z wykorzystaniem tzw. technik homomorficznych. W zaprojektowanym systemie kluczowe znaczenie ma zarówno proces ekstrakcji cech osobniczych, jak i towarzyszący mu proces klasyfikacji. Badania przedstawione w referacie skupiały się więc w pierwszym etapie na opracowaniu generatora cech opartego na fuzji cech cepstralnych i melcepstralnych oraz odpowiedniej selekcji deskryptorów. W drugim etapie autorzy dokonali optymalizacji parametrów generatora z uwzględnieniem docelowej metody klasyfikacji. Oceny otrzymanych wyników dokonano w oparciu o zbiór 500 próbek głosu od 50 mówców (po 10 próbek od każdego mówcy) i otrzymano 489 poprawnych klasyfikacji, co daje błąd klasyfikacji na poziomie 2,2%.
EN
The paper examines issues related to the determination of automatic speaker recognition systems. The authors focus on the use of speech signal processing methods that consider the phenomena connected with the speech generation process, which in turn connected to using a homomorphic processing methods. In a designed system crucial issue have both the extraction process of individual characteristics and classification process. The research presented in this paper focused primarily in the first stage on determination of features distinctive to sound generators using a fusion of cepstral and mel-cepstral information and also considers the feature selection. In the second stage optimization of the generator parameters taking account of suitable classification methods has been done by the authors. Finally, the evaluation of the results was based on the set of 500 samples of the acoustic signal from the 50 speakers (10 samples for each speaker) and 489 correct classification, which gives clasification error on 2,2% level.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.