Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 8

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  głos
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
1
PL
W artykule opisano możliwe sposoby ekstrakcji parametrów z próbek danych biometrycznych, takich jak odcisk palca czy nagranie głosu. Zweryfikowano wpływ konkretnych sposobów obróbki na skuteczność algorytmów obróbki próbek biometrycznych oraz ich porównania. Wykonano badania polegające na przetworzeniu dużej liczby próbek z użyciem wybranych algorytmów. W przypadku odcisku palca wykorzystano normalizację obrazu, filtr Gabora i porównanie z użyciem deskryptorów. Dla autoryzacji głosowej analizowano algorytmy LPC i MFCC. W przypadku obu rodzajów autoryzacji uzyskano zadowalającą skuteczność rzędu 60-80%.
EN
This article describes possible ways to extract parameters from biometric data samples, such as fingerprint or voice recording. Influence of particular approaches to biometric sample preparation and comparision algorithms accuracy was verified. Experiment involving processing big ammount of samples with usage of particular algorithms was performed. In fingerprint detection case the image normalization, Gabor filtering and comparision method based on descriptors were used. For voice authorization LPC and MFCC alghoritms were used. In both cases satisfying accuracy (60-80%) was the result of the surveys.
PL
W referacie przedstawiono system automatycznego rozpoznawania mówcy zaimplementowany w środowisku Matlab oraz pokazano sposoby realizacji i optymalizacji poszczególnych elementów tego systemu. Główny nacisk położono na wyselekcjonowanie cech dystynktywnych głosu mówcy z wykorzystaniem algorytmu genetycznego, który pozwala na uwzględnienie synergii cech podczas selekcji. Pokazano również wyniki optymalizacji wybranych elementów klasyfikatora, m.in. liczby rozkładów Gaussa użytych do zamodelowania każdego z głosów. Ponadto, podczas tworzenia modeli głosów zastosowano model głosu uniwersalnego.
EN
The paper presents automatic speaker recognition system, implemented in the Matlab environment, and demonstrates how to achieve and optimize various elements of the system. The main emphasis was put on features selection of speech signal using a genetic algorithm, which takes into account synergy of features. The results of the selected elements of optimizing classifier have been also shown, including the number of Gaussian distributions used to model each of the voices. In addition during creating voice models, the universal voice model have been used.
3
Content available remote Voice control
EN
The article describes the voice control system. It is based on comparing feature vector sequence, which represents spoken word, with patters. For this purpose Dynamic Time Warping algorithm was implemented. Features extracted from voice record are Mel cepstral coefficients. Delta and delta-delta parameters were also tested. Important part of system is algorithm detecting word boundaries. It uses fundamental frequency and energy.
PL
W artykule opisano system sterowania głosowego. Opiera się on na porównywaniu sekwencji wektorów cech, która reprezentuje wypowiedziane słowo, z bazą wzorców. W tym celu zaimplementowano algorytm Dynamic Time Warping. Jako cech ekstrahowanych z nagrań użyto współczynników Mel cepstrum. Przetestowano także parametry delta oraz delta-delta. W skład systemu wchodzi również algorytm wykrywający granice wypowiedzianego słowa, działający w oparciu o częstotliwość podstawową oraz energię.
PL
Artykuł porusza zagadnienia związane z wykorzystaniem głosu w celu weryfikacji mówców. Przedstawiono w nim poszczególne etapy konstrukcji systemu informatycznego, a w szczególności wstępną obróbkę danych, ekstraktor cech osobniczych oraz klasyfikator. Ponadto z danych głosowych zostały wyodrębnione współczynniki MFCC (ang. Mel Frequency Cepstrum Coefficients), obliczono również ich pierwszą i drugą pochodną. W ostatnim - trzecim etapie, jako narzędzie klasyfikujące, wykorzystano ukryte modele Markowa. Uzyskano bardzo wysoki współczynnik pozytywnej weryfikacji mówcy na poziomie 98%.
EN
The article discusses issues related to the use of voice characteristics to verify the speakers. The various stages of system design are presented, in particular preliminary signal processing, extractor of individuals characteristics and classifier. MFCC coefficients are extracted from the voice data and then are calculated the first and second derivative of this coefficients. In the third stage, as a tool for classification, used hidden Markov models. A very high rate of positive verification of the speaker, at 98%, is achieved.
5
Content available remote W poszukiwaniu przestrzeni miejskiej
PL
Zaprojektować przestrzeń? Ale jaką? Na miarę człowieka? Matematycznego ładu i harmonii opisywaną przez Platona? A może pełną chaosu i żywiołu? Jak daleka jest droga przestrzeni miejskich złożonych z ogrodzonych zespołów mieszkaniowych i wielkich centrów handlowych do miasta zdarzenia? Do miasta oferującego swoim mieszkańcom przestrzenie społeczne wywodzące się z zapisu ruchu, głosów, przestrzenie powstałe ze zdarzenia zmieniającego "pustkę" w element dialogu?
EN
To design a space? But how? By human's extent? By mathematical order and harmony described by Plato? Or maybe by fullness of chaos and element? How far is it from urban spaces composed of compounded housing estates and huge shopping malls to the city experience? How far to the city offering it's inhabitants community spaces coming from motion records, voices, spaces created of an occurrence changing "emptiness" in to a dialog element?
PL
W artykule opisano nowe możliwości radiomodemu 7004 po wprowadzeniu modulacji 4L FSK oraz inteligentnego manipulatora. Porównano właściwości trzech modulacji: FFSK, GMSK i 4L FSK stosowanych w modemach radiowych.
EN
The aricle describes new features of the 7004 radiomodem after implementation of the 4L FSK modulation and the 7064 intelligent control unit. The properties of three modulations FFSK, GMSK, and 4L FSK used in radio modems are compared.
EN
The effects of synthesized voice warning parameters on perceived urgency were examined in order to build a detailed and usable description of the relation between the parameters of synthesized voice warnings and perceived urgency. Ten native and 10 non-native English speakers participated in 4 experiments to evaluate and quantify the effects of the voice parameters. The results showed that speech rate, average fundamental frequency (F0), voice type, and fundamental frequency contour have clear effects on the perceived urgency of synthesized voice warnings. The effects of quantitative parameters on perceived urgency were scaled using an application of Stevens's power law (1957). In addition, the results showed significant differences in the perceived urgency of average F0 and F0 contour types between native and non-native English speakers. Implications of the results for the design and improvement of synthesized voice warnings are discussed.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.