PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Badania szybkości i jakości metod syntezy mowy na potrzeby zastosowania w urządzeniu przenośnym

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Research of speed and accuracy of speech synthesis methods for the purposes of deployment in embedded device
Języki publikacji
PL
Abstrakty
PL
W artykule przeanalizowano szereg metod dotyczących syntezy mowy, mając na uwadze ich wykorzystanie w urządzeniu przenośnym. Badania realizowano na urządzeniach o zróżnicowanych parametrach, a badanymi kryteriami były skuteczność danej metody i jej szybkość. Badania są częścią projektu Toucan Eye - urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano również, jak ważne jest zoptymalizowanie zastosowanych metod w fazie projektu inżynierskiego, w celu zapewnienia lepszej jakości pracy urządzenia i komfortu użytkownika końcowego.
EN
In the article, the methods concerning speech synthesis were analysed, having in mind their usage in an embedded device. Research was carried out on the devices with mixed parameters, and the criteria were accuracy and speed of the given method. The research is a part of the Toucan Eye project – an embedded device with an artificial intelligence system able to help people with impaired sight. It was shown how important is optimization of the applied methods in the phase of an engineer project to ensure better quality of a working device and the end-user’s comfort.
Rocznik
Strony
99--108
Opis fizyczny
Bibliogr. 9 poz. tab.
Twórcy
  • Akademia Marynarki Wojennej w Gdyni, Wydział Nawigacji i Uzbrojenia Okrętowego, ul. Śmidowicza 69, 81-103 Gdynia
autor
  • Toucan Systems, Sp. z o.o., Al. Grunwaldzka 103, 80-244 Gdańsk
Bibliografia
  • [1] Delgado R., Araki M., Neto J., Spoken, Multilingual and Multimodal Dialogue Systems: Development and Assessment, Wiley, USA, 2005.
  • [2] Festival, http://www.cstr.ed.ac.uk/projects/festival/, strona systemu Festival, dostęp - wrzesień 2017.
  • [3] Graliński J., Jassem K., Wagner A., Wypych M., Linguistic aspects of text normalization in Polish text-to-speech system, System Science, vol. 32, no. 4, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław, 2006, pp. 7-15.
  • [4] Łopatka K., Czyżewski A., Syntetyzer mowy uwzględniający prozodię wypowiedzi, Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej, nr 28, 2010, s. 105-108.
  • [5] MBROLA, http://tcts.fpms.ac.be/synthesis/mbrola.html, strona systemu MBROLA, dostęp - wrzesień 2017.
  • [6] NKJP, http://nkjp.pl/, strona Narodowego Korpusu Języka Polskiego, dostęp - wrzesień 2017.
  • [7] Perkins J., Python 3 Text Processing with NLTK 3 Cookbook, Packt Publishing, Birmingham, UK, 2014.
  • [8] PJWSTK, http://syntezamowy.pjwstk.edu.pl/synteza.html, strona Polsko-Japońskiej Szkoły Technik Komputerowych o syntezie mowy polskiej, dostęp - wrzesień 2017.
  • [9] Tadeusiewicz R., Sygnał mowy, Wydawnictwa Komunikacji i Łączności, Warszawa, 1988.
Uwagi
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).
Badania dotyczą projektu „System sztucznej inteligencji wspomagający osoby z dysfunkcją wzroku - Toucan Eye” realizowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014-2020 działanie 1.1/poddziałanie 1.1.1 i finansowanego przez Narodowe Centrum Badań i Rozwoju.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-c599e142-8d0a-4d64-a5f5-2167d8c40859
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.