Wyniki wyszukiwania - BazTech

Ograniczanie wyników

Znaleziono wyników: 3

Liczba wyników na stronie

Wyniki wyszukiwania

Wyszukiwano:
w słowach kluczowych: współczynniki MFCC

Sortuj według:

Ogranicz wyniki do:

Rozpoznawanie wieku i płci na podstawie analizy głosu

Gabryś J., Gil G., Kiszka P.

Acta Bio-Optica et Informatica Medica. Inżynieria Biomedyczna

2015

Vol. 21, nr 3

165--169

Metody automatycznego rozpoznawania wieku i płci pozwalają na rozpoznanie cech osoby mówiącej tylko na podstawie nagrania jej wypowiedzi. Mowa ludzka, poza werbalnym komunikatem, niesie ze sobą informacje dotyczące osoby mówiącej. Nagranie mowy osoby pozwala na wyodrębnienie takich informacji, jak jej płeć, wiek, a także emocje. Zaprezentowano przegląd metod rozpoznawania wieku i płci osób na podstawie ich mowy oraz wykonano implementację i przetestowano połączenie metod wyznaczania parametrów MFCC (współczynniki analizy cepstralnej w skali mel (Mel-frequency Cepstral Coefficients) i wysokości tonu głosu f0 oraz algorytmu SVM (metoda wektorów nośnych - Support Vector Machines) do klasyfikacji próbek głosowych. Testy zaimplementowanego rozwiązania pozwalają stwierdzić, że metoda jest skuteczna w większości przypadków testowych.

Methods for automatic recognition of the age and gender characteristics allow the identification of the person only on the basis of recording of this person speech. Human speech, beyond verbal communication, gives an information about the speaking person. Speech recording allows the identification personal characteristics such as gender, age, and the emotions. The paper presents an overview of methods of age and gender recognition of people based on their speech. A combination of methods for determining the parameters MFCC (Mel-frequency Cepstral Coefficients) and pitch of voice (f0) and SVM (Support Vector Machines) algorithm for the classification of voice samples is implanted and tested. It was demonstrated that the method is effective in the majority of test cases.

HFCC based recognition of bird species

Wielgat R., Zieliński T. P., Potempa T., Lisowska-Lis A., Król D.

Elektronika : konstrukcje, technologie, zastosowania

2008

Vol. 49, nr 4

90-94

Results from preliminary research on recognition of Polish birds' species are presented in the paper. Bird voices were recorded in a highly noised municipal environment. High 96 kHz sampling frequency has been used. As a feature set standard mel-frequency cepstral coefficients (MFCC) and recently proposed human-factor cepstral coefficients (HFCC) parameters were selected. Superior performance of the HFCC features over MFCC ones has been observed. Proper limiting of the maximal frequency during HFCC feature extraction results in increasing accuracy of birds' species recognition. Good initial results are very promising for practical application of the methods described in the paper in monitoring of protected birds' area.

W artykule zaprezentowano wyniki wstępnych badań dotyczących rozpoznawania głosów ptaków. Nagrania cyfrowe ptaków dokonano z częstotliwością próbkowania 96 kHz w zaszumionym środowisku miejskim. Jako cech użyto współczynników mel-cepstralnych (MFCC) oraz ostatnio zaproponowanych współczynników human-cepstralnych (HFCC). Zaobserwowano większą skuteczność rozpoznawania, prowadzonego z użyciem tych drugich. Pokazano, że odpowiednie ograniczenie maksymalnej częstotliwości podczas wyznaczania współczynników HFCC prowadzi do podniesienia efektywności rozpoznawania. Uzyskane obiecujące wyniki są dobrym prognostykiem do planowanego, praktycznego zastosowania opisanych metod do monitorowania ostoi ptaków.

Wykorzystanie metody niejawnych modeli Markowa w automatycznej detekcji wybranych wad wymowy

Wielgat R., Zieliński T., Świętojański P., Żołądź P., Woźniak T., Grabias S., Król D.

Pomiary Automatyka Kontrola

2007

R. 53, nr 9 bis

417--420

W artykule przedstawiono wyniki badań dotyczących automatycznej detekcji wad wymowy u dzieci. Jako materiał badawczy zostały wykorzystane nagrania pochodzące od dzieci z wadami wymowy. Zadanie polegało na rozpoznaniu nieprawidłowo realizowanego fonemu w wybranych słowach testowych. Detekcja była dokonywana za pomocą metod rozpoznawania mowy, w których jako cec sygnału mowy użyto dwóch najbardziej obiecujących rodzajów cech: współczynnika MFCC praz współczynników HFCC. Jako klasyfikatora użyto metody niejawnych modeli Markowa (HMM), gdzie modelowanymi jednostkami fonetycznimi były zarówno fonemy jak i całe słowa. W badanych metodach dobrano ich parametry w celu zmaksymalizowania skuteczności rozpoznawania. W artykule zaprezentowano również analizę porównawczą wyników rozpoznawania otrzymanych z wykorzystaniem metody HMM oraz testowanej w poprzednich pracach metody nieliniowej transformacji czasowej (DTW).

The results of research on automatic detection of the pathological phoneme pronunciation are presented in the paper. Speech samples came from speech impaired children and persons who imitated pathological phoneme pronunciation. The recognition task was to find wrongly realized phoneme in the selected test utterances. At the reature extraction stage the most effective features` types have been used: standard Mel-Frequency Cepstral Coefficients (MFCC) and recently proposed Human Factor Cepstral Coefficients (HFCC). As a classificator hidden Markov models, with modeled speech unit being a phoneme as well as a whole word, have been used. The parameters of the HMMs were adjusted in order to achieve the best recognition accuracy. Comparision of the HMM and DTW methods is also presented in the paper.