Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  przetwarzanie sygnału mowy
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
Niniejsza praca podejmuje próbę pomiaru cech sygnału mowy skorelownych z jego zawartością emocjonalną (na przykładzie emocji podstawowych). Zaprezentowano korpus mowy zaprojektowany tak, by umożliwić różnicową analizę niezależną od mówcy i treści oraz przeprowadzono testy mające na celu ocenę jego przydatności do automatyzacji wykrywania emocji w mowie. Zaproponowano robocze profile wokalne emocji. Artykuł prezentuje również propozycje aplikacji medycznych opartych na pomiarach emocji w głosie.
EN
The paper presents an approach to creating new measures of emotional content of speech signals. The results of this project constitute the basis or further research in this field. For analysis of differences of the basic emotional states independently of a speaker and semantic content, a corpus of acted emotional speech was designed and recorded. The alternative methods for emotional speech signal acquisition are presented and discussed (Section 2). Preliminary tests were performed to evaluate the corpus applicability to automatic emotion recognition. On the stage of recording labeling, human perceptual tests were applied (using recordings with and without semantic content). The results are presented in the form of the confusion table (Tabs. 1 and 2). The further signal processing: parametrisation and feature extraction techniques (Section 3) allowed extracting a set of features characteristic for each emotion, and led to developing preliminary vocal emotion profiles (sets of acoustic features characteristic for each of basic emotions) - an example is presented in Tab. 3. Using selected feature vectors, the methods for automatic classification (k nearest neighbours and self organizing neural network) were tested. Section 4 contains the conclusions: analysis of variables associated with vocal expression of emotions and challenges in further development. The paper also discusses use of the results of this kind of research for medical applications (Section 5).
PL
W artykule zaproponowano nową metodę czasu rzeczywistego do segmentacji mówców w rozmowach telefonicznych. Zakładamy, że dzięki dostępowi do wyposażenia jednej ze stron (np. biura operatora centrum obsługi telefonów alarmowych) istnieje możliwość dodania cyfrowego znaku wodnego do wypowiedzi operatora. Przedstawiona procedura może służyć jako wstępny etap przetwarzania sygnału w zagadnieniach automatycznego rozpoznawania mówcy. Jej skuteczne działanie zostało przetestowane w środowisku Matlab / Simulink przy różnych tłach akustycznych.
EN
In this paper a new real-time method for speaker segmentation in telephone calls is proposed. We assume that due to access to the equipment of one side (e.g., an operator office of the emergency call service center) there a possibility to add a digital watermark to the operator's utterances. The presented procedure can serve as a pre-processing stage for automatic speaker recognition. It has been tested with various acoustic backgrounds using Matlab / Simulink environment.
EN
Speech signals are one of the essential sources of information in the field of modern intelligent robots, equipped with a microphone array as audio sensors. Applications of microphone arrays are well known. They are used to collect and measure the audio information in audio processing system of a robot. The audio information can be of different nature: music, speech, noise etc. The paper refers only to speech signals, which are used for robot control. There are many structures of the microphone arrays: linear, planar, circular etc., which can be used for collecting and measuring the speech signals with the audio system of an audio visual robot. Most often linear microphone arrays are used mainly because of theirs simplicity. They are also used for robot orientation and movement control in simple room situation, by means of the direction detection of speech arrival. The goal of this paper is presentation of the use 2D microphone array for speech signal measurement, and applying space-time filtering optimized to find speech direction of arrival (DOA). The discovered and calculated speech signal direction of arrival can be combined with the video sensor co-ordinate information to effectively control the mobile robot movements in specified direction.
PL
Sygnał mowy jest jednym z głównych źródeł informacji dla współczesnych robotów inteligentnych, wyposażonych w matryce mikrofonowe pracujące jako sensory sygnału audio. Zastosowania takich matryc są dobrze znane. Służą one do zbierania i pomiaru informacji zawartej w sygnałach audio. Informacje audio mogą mieć różną naturę: może to być muzyka, mowa, szum itp. Artykuł dotyczy jedynie sygnałów głosowych, które są używane do sterowania robota. Istnieje wiele struktur matryc mikrofonowych, np. liniowe, planarne, kołowe itd., które mogą być używane do zbierania i pomiarów parametrów sygnału mowy przez system audio robota. Najczęściej z powodu ich prostoty są stosowane matryce liniowe. Wykorzystuje się je również do orientowania robota i sterowania jego ruchem w prostej sytuacji, gdy robot pracuje w pokoju, za pomocą wykrywania kierunku z którego przychodzi sygnał głosowy. Celem artykułu jest przedstawienie zastosowania dwuwymiarowej matrycy mikrofonowej do pomiaru sygnału głosowego oraz zastosowania filtracji czasowo-przestrzennej zoptymalizowanej do znajdowania kierunku z jakiego przychodzi sygnał głosowy (DOA). Wykryty i obliczony kierunek nadchodzenia sygnału głosowego może być połączony z informacjami o współrzędnych z sensora video w celu efektywnego sterowania ruchów robota mobilnego w określonym kierunku.
4
Content available Speech signal processing and analysis tool
EN
The project's objective is to create a tool intended for processing, analysis, and parameterizing human speech signal. The main aim is to obtain a speech signal image with some selected parameterization methods. The methods include use of 2D parameterization grid [1, 2] as well as cepstral coefficients CC [3]. Obtaining signal image as well as its further analysis without signal preprocessing is extremely difficult and the process doesn't guarantee desirable results. For this reason the tool is based on two main modules. The first one is intended for signal preprocessing, preparing it for further analysis. The other one provides signal parameterization methods. The tool was implemented in Java language.
PL
W pracy podjęto próbę stworzenia narzędzia umożliwiającego przetwarzanie, analizę i parametryzację sygnału mowy. Głównym celem jest pozyskanie obrazu sygnału mowy za pomocą wybranych metod parametryzacji. Wybrane metody parametryzacji sygnału mowy to parametryzacja za pomocą siatki dwuwymiarowej [1, 2] oraz współczynniki cepstralne [3]. Zobrazowanie sygnału oraz jego dalsza analiza bez operacji wstępnego przetworzenia sygnału jest procesem trudnym i nie zawsze przynosi pożądane rezultaty. Wobec tego narzędzie wyposażono w dwa zasadnicze moduły. Pierwszy moduł odpowiedzialny jest za wstępne przetworzenie sygnału, przygotowujące sygnał do dalszej analizy. Drugi moduł dostarcza metod parametryzacji sygnału mowy. Narzędzie zaimplementowano w języku Java.
EN
The paper presents selected aspects of research concerning a new concept in application of computer technology to the analysis of acoustic signal. This new concept assumes, that during the analysis of signal the study is not focused on determining some or other signal parameters, neither it is focused on the signal classification, but it is supposed to lead to an automated understanding of the origins of the deformation, which can be revealed in analyzed signal.
PL
W pracy przedstawiono wybrane aspekty badań dotyczących nowej koncepcji zastosowania techniki komputerowej do analizy sygnału akustycznego. Ta nowa koncepcja zakłada, że podczas analizy sygnału nie dążymy do ustalenia takich czy innych parametrów sygnału, ani nie usiłujemy dokonać jego klasyfikacji, lecz zmierzamy do automatycznego zrozumienia przyczyn deformacji, jakie dają się zaobserwować w rozważanym sygnale.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.