PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Zastosowanie algorytmów normalizacji tekstu na potrzeby syntezy mowy w urządzeniach przenośnych

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Analysis of speech synthesis algorithms for the purposes of deployment in embedded device
Języki publikacji
PL
Abstrakty
PL
W artykule pokazano kolejne etapy występujące w syntezie mowy, a także sposoby postępowania z poszczególnymi fragmentami tekstu, który ma zostać przetworzony na mowę. Przedstawiono wyniki badań wydajności algorytmów normalizacji treści realizowanych na potrzeby projektu Toucan Eye - urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano, jak istotne są dobranie i optymalizacja zastosowanych algorytmów ze strony implementacyjnej, po to by zwiększyć komfort użytkownika końcowego.
EN
The article presents consecutive stages of speech synthesis and also the ways of dealing with particular fragments of a text. The results of performance measurement for the text content normalization algorithms are shown. These algorithms were developed for the Toucan Eye project – an embedded device with an artificial intelligence system able to help people with impaired sight. It was shown how essential is the choice and optimization of the applied algorithms for the implementation process in order to increase the end-user’s comfort.
Rocznik
Strony
89--97
Opis fizyczny
Bibliogr. 9 poz., tab.
Twórcy
  • Akademia Marynarki Wojennej w Gdyni, Wydział Nawigacji i Uzbrojenia Okrętowego, ul. Śmidowicza 69, 81-103 Gdynia
  • Toucan Systems, Sp. z o.o., Al. Grunwaldzka 103, 80-244, Gdańsk
Bibliografia
  • [1] Delgado R., Araki M., Neto J., Spoken, Multilingual and Multimodal Dialogue Systems: Development and Assesment, Wiley, USA, 2005.
  • [2] Graliński J., Jassem K., Wagner A., Wypych M., Linguistic aspects of text normalization in polish text-to-speech system, System Science, vol. 32, no. 4, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław, 2006, pp. 7-15.
  • [3] Łopatka K., Czyżewski A., Syntetyzer mowy uwzględniający prozodię wypowiedzi, Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej, nr 28, 2010, s. 105-108.
  • [4] NKJP, http://nkjp.pl/, strona Narodowego Korpusu Języka Polskiego, dostęp - wrzesień 2017.
  • [5] Perkins J., Python 3 Text Processing with NLTK 3 Cookbook, Packt Publishing, Birmingham, UK, 2014.
  • [6] Sołdacki P., Zastosowanie metod płytkiej analizy tekstu do przetwarzania dokumentów w języku polskim, rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Warszawa, 2006.
  • [7] PJWSTK, http://syntezamowy.pjwstk.edu.pl/synteza.html, strona Polsko-Japońskiej Szkoły Technik Komputerowych o syntezie mowy polskiej, dostęp - wrzesień 2017.
  • [8] SAMPA, http://www.phon.ucl.ac.uk/home/sampa/, strona alfabetu fonetycznego SAMPA, dostęp - wrzesień 2017.
  • [9] Tadeusiewicz R., Sygnał mowy, Wydawnictwa Komunikacji i Łączności, Warszawa, 1988.
Uwagi
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).
Badania dotyczą projektu „System sztucznej inteligencji wspomagający osoby z dysfunkcją wzroku - Toucan Eye” realizowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014-2020 działanie 1.1/poddziałanie 1.1.1 i finansowanego przez Narodowe Centrum Badań i Rozwoju.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-749cd01a-634a-4d9f-98b8-463923b1ec43
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.