Zastosowanie algorytmów normalizacji tekstu na potrzeby syntezy mowy w urządzeniach przenośnych

Zacniewski, A.; Kleinszmidt, M.

doi:10.5604/01.3001.0012.0957

Artykuł - szczegóły

Tytuł artykułu

Zastosowanie algorytmów normalizacji tekstu na potrzeby syntezy mowy w urządzeniach przenośnych

Autorzy

Zacniewski A. , Kleinszmidt M.

Treść / Zawartość

Pełne teksty:

ARTUR ZACNIEWSKI, MARCIN KLEINSZMIDT.pdf

Pobierz

Identyfikatory

DOI

10.5604/01.3001.0012.0957

Warianty tytułu

Analysis of speech synthesis algorithms for the purposes of deployment in embedded device

Języki publikacji

Abstrakty

W artykule pokazano kolejne etapy występujące w syntezie mowy, a także sposoby postępowania z poszczególnymi fragmentami tekstu, który ma zostać przetworzony na mowę. Przedstawiono wyniki badań wydajności algorytmów normalizacji treści realizowanych na potrzeby projektu Toucan Eye - urządzenia przenośnego z systemem sztucznej inteligencji, mającego wspomóc osoby z dysfunkcją wzroku. Pokazano, jak istotne są dobranie i optymalizacja zastosowanych algorytmów ze strony implementacyjnej, po to by zwiększyć komfort użytkownika końcowego.

The article presents consecutive stages of speech synthesis and also the ways of dealing with particular fragments of a text. The results of performance measurement for the text content normalization algorithms are shown. These algorithms were developed for the Toucan Eye project – an embedded device with an artificial intelligence system able to help people with impaired sight. It was shown how essential is the choice and optimization of the applied algorithms for the implementation process in order to increase the end-user’s comfort.

Słowa kluczowe

synteza mowy wspomaganie osób z dysfunkcją wzroku Toucan Eye

speech synthesis assisting persons with impaired sight Toucan Eye

Wydawca

Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego

Czasopismo

Biuletyn Wojskowej Akademii Technicznej

Rocznik

2018

Tom

Vol. 67, nr 2

Strony

89--97

Opis fizyczny

Bibliogr. 9 poz., tab.

Twórcy

autor

Zacniewski A.

a.zacniewski@amw.gdynia.pl

Akademia Marynarki Wojennej w Gdyni, Wydział Nawigacji i Uzbrojenia Okrętowego, ul. Śmidowicza 69, 81-103 Gdynia

autor

Kleinszmidt M.

m.kleinszmidt@toucan-systems.pl89

Toucan Systems, Sp. z o.o., Al. Grunwaldzka 103, 80-244, Gdańsk

Bibliografia

[1] Delgado R., Araki M., Neto J., Spoken, Multilingual and Multimodal Dialogue Systems: Development and Assesment, Wiley, USA, 2005.
[2] Graliński J., Jassem K., Wagner A., Wypych M., Linguistic aspects of text normalization in polish text-to-speech system, System Science, vol. 32, no. 4, Oficyna Wydawnicza Politechniki Wrocławskiej, Wrocław, 2006, pp. 7-15.
[3] Łopatka K., Czyżewski A., Syntetyzer mowy uwzględniający prozodię wypowiedzi, Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej, nr 28, 2010, s. 105-108.
[4] NKJP, http://nkjp.pl/, strona Narodowego Korpusu Języka Polskiego, dostęp - wrzesień 2017.
[5] Perkins J., Python 3 Text Processing with NLTK 3 Cookbook, Packt Publishing, Birmingham, UK, 2014.
[6] Sołdacki P., Zastosowanie metod płytkiej analizy tekstu do przetwarzania dokumentów w języku polskim, rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Warszawa, 2006.
[7] PJWSTK, http://syntezamowy.pjwstk.edu.pl/synteza.html, strona Polsko-Japońskiej Szkoły Technik Komputerowych o syntezie mowy polskiej, dostęp - wrzesień 2017.
[8] SAMPA, http://www.phon.ucl.ac.uk/home/sampa/, strona alfabetu fonetycznego SAMPA, dostęp - wrzesień 2017.
[9] Tadeusiewicz R., Sygnał mowy, Wydawnictwa Komunikacji i Łączności, Warszawa, 1988.

Uwagi

Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).

Badania dotyczą projektu „System sztucznej inteligencji wspomagający osoby z dysfunkcją wzroku - Toucan Eye” realizowanego w ramach Programu Operacyjnego Inteligentny Rozwój 2014-2020 działanie 1.1/poddziałanie 1.1.1 i finansowanego przez Narodowe Centrum Badań i Rozwoju.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-749cd01a-634a-4d9f-98b8-463923b1ec43