Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 5

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  TTS
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
PL
Wraz z dynamicznym rozwojem Internetu Rzeczy (IoT), wzrasta potrzeba stosowania coraz to nowszych energooszczędnych rozwiązań komunikacyjnych. Sieci LPWAN (ang. Low-Power Wide-Area Network) umożliwiają niskoenergetyczną komunikację dalekiego zasięgu. Istotnym jest by nowe rozwiązania cechowały się łatwością konfiguracji umożliwiającą szybkie wdrożenie. W artykule dokonano przeglądu platform do komunikacji urządzeń IoT w standardzie LoRaWAN (ang. LoRa Wide Area Network) pod kątem stopnia złożoności konfiguracji. Opisano sposób konfiguracji budowanego na Wydziale Informatyki i Telekomunikacji, Politechniki Poznańskiej eksperymentalnego systemu LPWAN do badań związanych z Inteligentnymi budynkami.
EN
With the rapid growth of the Internet of Things (IoT), there is a growing need for newer energy-efficient communication solutions. Low-Power Wide-Area Networks (LPWAN) enable low-energy long-range communication. It is important for new solutions to be easy to configure and quick to implement. The paper reviews platforms for IoT device communication in LoRaWAN (LoRa Wide Area Network) standard in terms of configuration complexity. The paper describes the configuration of an experimental LPWAN system being built at the Faculty of Computing and Telecommunications, Poznan University of Technology for research related to Intelligent buildings.
EN
Speech segmentation is the process of dividing speech signal into distinct acoustic blocks that could be words, syllables or phonemes. Phonetic segmentation is about finding the exact boundaries for the different phonemes that composes a specific speech signal. This problem is crucial for many applications, i.e. automatic speech recognition (ASR). In this paper we propose a new model-based text independent phonetic segmentation method based on wavelet packet speech parametrization features and using the sparse representation classifier (SRC). Experiments were performed on two datasets, the first is an English one derived from TIMIT corpus, while the second is an Arabic one derived from the Arabic speech corpus. Results showed that the proposed wavelet packet decomposition features outperform the MFCC features in speech segmentation task, in terms of both F1-score and R-measure on both datasets. Results also indicate that the SRC gives higher hit rate than the famous k-Nearest Neighbors (k-NN) classifier on TIMIT dataset.
PL
Inteligentny System Transportu we Wrocławiu to przede wszystkim szeroki zbiór technologii (telekomunikacyjnych, informatycznych, pomiarowych i automatyki) oraz technik zarządzania ruchem stosowanych w transporcie w celu zwiększenia efektywności systemu transportowego, ochrony życia uczestników ruchu oraz ochrony zasobów środowiska naturalnego. Wrocław jako jedno z pionierskich miast zdecydował się na podjęcie ogromnego wyzwania, jakim stał się projekt ITS we Wrocławiu, który miał zostać zrealizowany w ogromnym, wielodyscyplinarnym zakresie. Było to wówczas największe przedsięwzięcie wdrożeniowe w obszarze systemów sterowania ruchem na skalę całego kraju. Do dziś nigdzie nie stworzono rozwiązania, które można porównać do wrocławskiego pod względem wielkości i stopnia zintegrowania, zrealizowanego w jednym czasie, w pełnym zakresie systemowym, sprzętowym i funkcjonalnym na tak wielu płaszczyznach wspierania użytkowników ruchu, włączając do systemu sterowania ruchem 155 skrzyżowań.
EN
Intelligent Transport System in Wroclaw is primarily a broad set of technologies (telecommunications, information technology, measurement and automation) and traffic management techniques used in the transport sector in order to increase the efficiency of the transport system, protect the lives of road users and the protection of natural resources. Wroclaw as one of the pioneering cities decided to take a huge challenge became the ITS project in Wroclaw, which was to be implemented in the vast, multidisciplinary scope. It was the biggest project implementation in the area of traffic management systems for the whole country. To this day, we never developed a solution that can be compared to Wroclaw in terms of size and degree of integration, implemented at the same time, the system correctly, hardware and featured on so many levels to support user traffic, including traffic control system 155 intersections.
4
Content available remote Voice controlled home E-banking
EN
Nowadays the progress in modern technologies in area of computer science and wide understanding communication, both using computer and communication with the computer, has a direct influence on our real life, institution and individuals. Rapid growth of the Internet and the easy access to it, makes that lots of information is available on the web. On the other hand, the Internet is not only for special groups of people. Nowadays more and more disabled people, also blind people, are using computers and the Internet. The adaptive technology industry is mainly focused on computer access, through screen readers and others specialized devices which give the blind people access to the sighted world. In the article there is presented internet.s bank application controlled by means of voice and keyboard, which helps disabled people in a prosaic tasks.
PL
Obecnie postęp nowoczesnych technologii w obszarze informatyki i szeroko rozumianej komunikacji, zarówno przy użyciu komputera jak i komunikacji z komputerem, ma bezpośredni wpływ na nasze życie, ludzi i instytucje. Szybki rozwój Internetu i łatwy do niego dostęp sprawia, że wszelkie informacje są dostępne w sieci. Z drugiej strony Internet nie jest przeznaczony dla wybranych osób. Coraz więcej niepełnosprawnych ludzi w tym niewidomych i niedowidzących używa komputera jak również korzysta z Internetu. Dlatego też rozwój technologiczny ukierunkowany jest na ułatwienie dostępu do komputera, poprzez wprowadzenie syntezatorów mowy i innych wyspecjalizowanych urządzeń, które dają niewidomym dostęp do "świata widzących". W niniejszym artykule jest przedstawiona aplikacja e-banku sterowana za pomocą głosu i klawiatury, która ma pomóc niepełnosprawnym w korzystaniu ze strony internetowej banku oraz serwisu bankowości elektronicznej.
EN
This is a proposal of concatenative text to speech synthesizer for the Polish language, based on diphones and ”Harmonics and Noise Model”(HNM). HNM has been successfully applied on a speech encoder and decoder, resulting in a high-quality of processed speech at low bit rate. Applying this model to speech synthesis system allows obtaining good quality of synthesized speech, and the small size of database parameters. The proposed project consists of two main modules. The Natural Language Processing (NLP) is used to analyse and convert the written text for phonemes and diphones using morphological rules. NLP discovers at the same time prosodic features for later modification of synthesized speech parameters in order to obtain the stress and voice intonation. The second section is a synthesis system, derived from speech decoder, preceded by a system of adapting the parameters of speech based on prosodic rules. The system of speech synthesis from the parameters is working in the frequency domain and uses the frequency spectrum envelope, which easily allows modifying the frequency, amplitude and duration of the signal when applying the prosodic rules. The algorithm of continuous phase designation at the speech frame borders allows concatenating portions of synthesized speech and diphones without phase distortion on the merger. Speech synthesizer operates on the diphone database, created applying fragmentation of recorded speech signal representing the pairs of phonemes. Sounds related to diphones are analyzed by speech encoder. It provides the parameters that described harmonic and noise components of speech, using the linear prediction filter LSF coefficients, resulting in a small size of diphone database.
PL
Artykuł przedstawia projekt konkatenacyjnego syntezatora mowy z tekstu dla języka polskiego, opartego na difonach i modelu Harmoniczne i Szum. Model Harmoniczne i Szum został z powodzeniem zastosowany w układzie kodera i dekodera mowy, dając w rezultacie dobrą jakość przetwarzanej mowy przy niskiej przepływności bitowej. Zastosowanie tego modelu do układu syntezy mowy pozwala na uzyskanie dobrej jako sci syntezowanej mowy, oraz niewielki rozmiar bazy parametrów. Układ składa się z dwóch głównych modułów. Moduł Naturalnego Przetwarzania Języka służy do analizy i zamiany tekstu pisanego na fonemy oraz difony, przy wykorzystaniu reguł morfologicznych. Procesor tekstu wyznacza jednocześnie warunki prozodii związane z późniejszą modyfikacją parametrów syntezowanego głosu w celu uzyskania akcentowania i intonacji. Drugim układem jest moduł syntezy, oparty na dekoderze mowy poprzedzonym systemem adaptacji parametrów mowy w oparciu o wyznaczone wcześniej reguły prozodyczne. Układ syntezy mowy z parametrw działa w dziedzinie czstotliwości i bazuje na obwiedni spektrum, co w prosty sposób pozwala na modyfikację czstotliwości, amplitudy i czasu trwania sygnału przy stosowaniu reguł prozodycznych. Algorytm wyznaczania ciągłej fazy na granicach ramek sygnału mowy pozwala na łączenie fragmentów syntezowanej mowy oraz poszczególnych difonów bez zniekształceń fazowych na połączeniu. Syntezator mowy operuje na bazie difonów, stworzonej na podstawie fragmentaryzacji nagranego sygnału mowy na części, reprezentujące połączenia par fonemów. Dźwięki odpowiadające difonom są analizowane przez moduł analizy mowy. Dostarcza on ciąg parametrów reprezentujących harmoniczne i szumowe komponenty sygnału mowy, opisane za pomocą filtrów liniowej predykcji i współczynników LSF, dając w rezultacie niewielkiej wielkości baze difonów.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.