Wyniki wyszukiwania - BazTech

1

Text to speech synthesis system with multi voice capability based on instantaneous voice conversion

Azarov E., Petrovsky A., Zubrycki P.

Elektronika : konstrukcje, technologie, zastosowania

|

2011

|

Vol. 52, nr 5

111-116

EN

The paper describes an approach to text-to-speech synthesis based on processing in harmonic domain. A special harmonic analysis technique is presented that provides accurate estimation of instantaneous harmonic parameters. The technique is based on narrow band filtering aligned to the fundamental frequency, which improves estimation accuracy of higher-order harmonics with rapid frequency changes. The advanced analysis ensures natural-sounding amplitude, pitch and phase matching because of the fine deterministic / stochastic separation. Speech synthesis is carried out using parametric representation that allows applying voice conversion techniques in order to get a multi voice synthesis system with a single voice acoustic database.

PL

W artykule przedstawiono metodę syntezy mowy z tekstu wykorzystującą przetwarzanie sygnału w dziedzinie harmonicznych. Zaprezentowano technikę analizy składowych harmonicznych pozwalającą na precyzyjną estymację chwilowych wartości parametrów harmonicznych. Technika ta jest oparta o wąskopasmową filtrację synchronizowaną częstotliwością tonu podstawowego, co poprawia dokładność estymacji parametrów wyższych harmonicznych przy dużych zmianach częstotliwości. Zaawansowana metoda analizy zapewnia naturalne brzmienie oraz dopasowanie amplitud i faz harmonicznych ze względu na precyzyjną dekompozycję na komponenty deterministyczny i stochastyczny. Synteza sygnału mowy jest przeprowadzona przy użyciu reprezentacji parametrycznej, co pozwala na zastosowanie technik konwersji głosu. Dzięki temu opracowany system pozwala na syntezę z użyciem wielu głosów wykorzystując akustyczną bazę danych jednego mówcy.

2

Design of text to speach synthesis system based on the harmonic and noise model

Sawicki A., Zubrycki P., Petrovsky A.

Zeszyty Naukowe Politechniki Białostockiej. Informatyka

|

2009

|

Z. 4

111-125

EN

This is a proposal of concatenative text to speech synthesizer for the Polish language, based on diphones and ”Harmonics and Noise Model”(HNM). HNM has been successfully applied on a speech encoder and decoder, resulting in a high-quality of processed speech at low bit rate. Applying this model to speech synthesis system allows obtaining good quality of synthesized speech, and the small size of database parameters. The proposed project consists of two main modules. The Natural Language Processing (NLP) is used to analyse and convert the written text for phonemes and diphones using morphological rules. NLP discovers at the same time prosodic features for later modification of synthesized speech parameters in order to obtain the stress and voice intonation. The second section is a synthesis system, derived from speech decoder, preceded by a system of adapting the parameters of speech based on prosodic rules. The system of speech synthesis from the parameters is working in the frequency domain and uses the frequency spectrum envelope, which easily allows modifying the frequency, amplitude and duration of the signal when applying the prosodic rules. The algorithm of continuous phase designation at the speech frame borders allows concatenating portions of synthesized speech and diphones without phase distortion on the merger. Speech synthesizer operates on the diphone database, created applying fragmentation of recorded speech signal representing the pairs of phonemes. Sounds related to diphones are analyzed by speech encoder. It provides the parameters that described harmonic and noise components of speech, using the linear prediction filter LSF coefficients, resulting in a small size of diphone database.

PL

Artykuł przedstawia projekt konkatenacyjnego syntezatora mowy z tekstu dla języka polskiego, opartego na difonach i modelu Harmoniczne i Szum. Model Harmoniczne i Szum został z powodzeniem zastosowany w układzie kodera i dekodera mowy, dając w rezultacie dobrą jakość przetwarzanej mowy przy niskiej przepływności bitowej. Zastosowanie tego modelu do układu syntezy mowy pozwala na uzyskanie dobrej jako sci syntezowanej mowy, oraz niewielki rozmiar bazy parametrów. Układ składa się z dwóch głównych modułów. Moduł Naturalnego Przetwarzania Języka służy do analizy i zamiany tekstu pisanego na fonemy oraz difony, przy wykorzystaniu reguł morfologicznych. Procesor tekstu wyznacza jednocześnie warunki prozodii związane z późniejszą modyfikacją parametrów syntezowanego głosu w celu uzyskania akcentowania i intonacji. Drugim układem jest moduł syntezy, oparty na dekoderze mowy poprzedzonym systemem adaptacji parametrów mowy w oparciu o wyznaczone wcześniej reguły prozodyczne. Układ syntezy mowy z parametrw działa w dziedzinie czstotliwości i bazuje na obwiedni spektrum, co w prosty sposób pozwala na modyfikację czstotliwości, amplitudy i czasu trwania sygnału przy stosowaniu reguł prozodycznych. Algorytm wyznaczania ciągłej fazy na granicach ramek sygnału mowy pozwala na łączenie fragmentów syntezowanej mowy oraz poszczególnych difonów bez zniekształceń fazowych na połączeniu. Syntezator mowy operuje na bazie difonów, stworzonej na podstawie fragmentaryzacji nagranego sygnału mowy na części, reprezentujące połączenia par fonemów. Dźwięki odpowiadające difonom są analizowane przez moduł analizy mowy. Dostarcza on ciąg parametrów reprezentujących harmoniczne i szumowe komponenty sygnału mowy, opisane za pomocą filtrów liniowej predykcji i współczynników LSF, dając w rezultacie niewielkiej wielkości baze difonów.

3

Wyznaczanie współczynnika tłumienia materiałowego i zespolonego modułu sprężystości w betonach drobnoziarnistych

Czech K. R., Hościło B, Ryżyński W., Zubrycki P.

Zeszyty Naukowe Politechniki Białostockiej. Budownictwo

|

2005

|

Z. 26

45-62

PL

W pracy, po krótkim omówieniu najczęściej stosowanych miar tłumienia i metod pomiarowych, przedstawiono metodykę wyznaczania składowych zespolonego modułu sprężystości i współczynnika tłumienia materiałowego w przypadku drgań wzdłużnych próbek betonowych przy wykorzystaniu wieloosiowego systemu badawczego Instron 8502 i metod cyfrowego przetwarzania sygnałów. Zaprezentowano charakterystyki techniczne maszyny wytrzymałościowej Instron 8502 i uwarunkowania prowadzenia badań na próbkach walcowych z betonów drobnoziarnistych oraz sformułowano zalecenia dotyczące metody wieloseryjnego prowadzenia pomiarów.

EN

Autor(s), after a short discussion of the most frequently applied measures of damping and methodology of their measuring, presents the methodology of determination of components of the complex modulus of elasticity and coefficient of structural damping in the conditions of longitudinal vibration of concrete samples by means of the multi-axial testing system called 'Instron 8502', and the methods of digital processing of signals. Technical characteristics of testing machine Instron 8502 were presented and conditioning of realization of investigations on cylindrical samples made of fine-grained concretes. There are also presented recommendations concerning methodology of multi-serial realization of measurements.

4

Numeryczne przetwarzanie danych do wyznaczania parametrów tłumienia materałowego w betonach drobnoziarnistych

Czech K. R., Ryżyński W., Zubrycki P.

Zeszyty Naukowe Politechniki Białostockiej. Budownictwo

|

2005

|

Z. 26

63-72

PL

W pracy przedstawiono sposób cyfrowego przetwarzania danych celem wyznaczenia współczynnika tłumienia materiałowego w modyfikowanych betonach konstrukcyjnych. Przedstawiono opis pozyskiwania danych poprzez pomiary w specjalistycznym systemie do zadawania obciążeń dynamicznych, teoretyczne podstawy cyfrowego przetwarzania sygnału oraz przykłady transformacji danych. Opisano specjalistyczny program DRG, działający w środowisku programowym MATLAB, służący przetwarzaniu danych przy zastosowaniu wielu składowych harmonicznych sygnału. Pozwoliło to na znaczną redukcję wpływów addytywnego białego szumu pozyskiwanego wraz z sygnałem podczas pomiarów oraz eliminowanie szumów pochodzących od pracy maszyny i urządzeń znajdujących się w pobliżu. Cyfrowe przetwarzanie danych pozwoliło uzyskać dokładniejsze wartości współczynnika tłumienia materiałowego w modyfikowanych betonach drobnoziarnistych.

EN

Author presents the procedure of digitally processing the data aimed for determination of the coefficient of structural damping in the modified structural concretes. Presented are: the way of gaining the data being the result of measurements within a specialist system enabling application of dynamic loads; the theoretical bases of digital processing of signal, and some examples of transformation of data; the specialist computer programme, called DRG, operating in a programmed environment MATLAB applied for data processing while taking into consideration many harmonic signal components. This method allowed for considerable reduction of influences of additive white noise obtained alongside with a signal during measurements as well as elimination of noises from machines and devices working nearby. Digital processing of data allowed acquisition of more precise values of the coefficient of structural damping in the modified fine-grained concretes.