Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Speech synthesis system based on an embedded platform
Konferencja
Krajowa Konferencja Elektroniki (12 ; 10-13.06.2013 ; Darłówko Wschodnie ; Polska)
Języki publikacji
Abstrakty
W pracy opisano system do syntezy mowy zbudowany z wykorzystaniem 32-bitowego mikrokontrolera z rdzeniem ARM Cortex-M4. System umożliwia syntezę mowy na podstawie tekstu wprowadzonego przez użytkownika. Jako podstawę algorytmiczną mechanizmu syntezy mowy wykorzystano syntezator formantowy eSpeak (projekt o otwartym źródle) dla komputerów PC. Został on przeniesiony na wybraną platformę docelową, z uwzględnieniem istniejących ograniczeń oraz wymagań warstwy sprzętowej. Opracowano narzędzia realizujące konwersję plików danych programu eSpeak do postaci tablic wartości oraz struktur danych kompilowanych wraz z kodem programu. Napisano również procedury do niezależnej diagnostyki oraz weryfikacji działania każdego z elementów opracowanego systemu syntezy mowy.
This paper describes speech synthesis system working on an embedded platform. The physical layer of the application was based on an efficient, 32-bit, ARM Cortex-M4 microcontroller. Since building of a complete Text-to-Speech system from scratch is a complex issue, elements of an open-source project called eSpeak (which uses formant synthesis, which does not require storage of large data structures) were ported onto the proposed target platform (with consideration of all of its limitations and requirements). The built system supports many languages and is capable of producing artificial speech directly from any text entered by the user.
Wydawca
Rocznik
Tom
Strony
75--78
Opis fizyczny
Bibliogr. 7 poz., rys.
Twórcy
autor
- Politechnika Łódzka, Instytut Elektroniki
autor
- Politechnika Łódzka, Instytut Elektroniki
Bibliografia
- [1] T. Dutoit, “An Introduction to Text-to-Speech Synthesis”, Springer, 2001.
- [2] D. H. Klatt, “Review of text-to-speech conversion for English”, J. Acoust. Soc. Am., vol. 82 (3), pp. 737-793, 1987.
- [3] R. E. Donovan, “Trainable Speech Synthesis”, Praca doktorska, Univ. of Cambridge, 1996.
- [4] P. Taylor, “Text-to-Speech Synthesis”, Cambridge University Press, Cambridge, 2009.
- [5] Witryna projektu eSpeak Text-to-Speech: http://espeak.source-forge.net/, (dostęp 08/03/2013).
- [6] M. Wypych, „Układ rozpoznający struktury intonacyjne w sygnale mowy”, Praca doktorska, IPPT PAN, Warszawa 2011.
- [7] J. Sawicki, „Użyteczność sygnału mowy w technice biometrycznej", Grudzień 2003.
Uwagi
Pracę dofinansowano ze środków projektu rozwojowego finansowanego przez NCBiR NR02-0083-10 realizowanego w Instytucie Elektroniki PŁ w latach 2010-2013.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-bf645bb6-dd0a-477a-b9cd-edcb06582c2a