System syntezy mowy polskiej z zastosowaniem platformy wbudowanej

Owczarek, M.; Poryzała, P.

Artykuł - szczegóły

Tytuł artykułu

System syntezy mowy polskiej z zastosowaniem platformy wbudowanej

Autorzy

Owczarek M. , Poryzała P.

Identyfikatory

Warianty tytułu

Speech synthesis system based on an embedded platform

Konferencja

Krajowa Konferencja Elektroniki (12 ; 10-13.06.2013 ; Darłówko Wschodnie ; Polska)

Języki publikacji

Abstrakty

W pracy opisano system do syntezy mowy zbudowany z wykorzystaniem 32-bitowego mikrokontrolera z rdzeniem ARM Cortex-M4. System umożliwia syntezę mowy na podstawie tekstu wprowadzonego przez użytkownika. Jako podstawę algorytmiczną mechanizmu syntezy mowy wykorzystano syntezator formantowy eSpeak (projekt o otwartym źródle) dla komputerów PC. Został on przeniesiony na wybraną platformę docelową, z uwzględnieniem istniejących ograniczeń oraz wymagań warstwy sprzętowej. Opracowano narzędzia realizujące konwersję plików danych programu eSpeak do postaci tablic wartości oraz struktur danych kompilowanych wraz z kodem programu. Napisano również procedury do niezależnej diagnostyki oraz weryfikacji działania każdego z elementów opracowanego systemu syntezy mowy.

This paper describes speech synthesis system working on an embedded platform. The physical layer of the application was based on an efficient, 32-bit, ARM Cortex-M4 microcontroller. Since building of a complete Text-to-Speech system from scratch is a complex issue, elements of an open-source project called eSpeak (which uses formant synthesis, which does not require storage of large data structures) were ported onto the proposed target platform (with consideration of all of its limitations and requirements). The built system supports many languages and is capable of producing artificial speech directly from any text entered by the user.

Słowa kluczowe

synteza mowy synteza formantowa system wbudowany ARM Cortex M4

speech synthesis formant synthesis embedded system ARM Cortex-M4

Wydawca

Wydawnictwo SIGMA-NOT

Czasopismo

Elektronika : konstrukcje, technologie, zastosowania

Rocznik

2013

Tom

Vol. 54, nr 9

Strony

75--78

Opis fizyczny

Bibliogr. 7 poz., rys.

Twórcy

autor

Owczarek M.

Politechnika Łódzka, Instytut Elektroniki

autor

Poryzała P.

Politechnika Łódzka, Instytut Elektroniki

Bibliografia

[1] T. Dutoit, “An Introduction to Text-to-Speech Synthesis”, Springer, 2001.
[2] D. H. Klatt, “Review of text-to-speech conversion for English”, J. Acoust. Soc. Am., vol. 82 (3), pp. 737-793, 1987.
[3] R. E. Donovan, “Trainable Speech Synthesis”, Praca doktorska, Univ. of Cambridge, 1996.
[4] P. Taylor, “Text-to-Speech Synthesis”, Cambridge University Press, Cambridge, 2009.
[5] Witryna projektu eSpeak Text-to-Speech: http://espeak.source-forge.net/, (dostęp 08/03/2013).
[6] M. Wypych, „Układ rozpoznający struktury intonacyjne w sygnale mowy”, Praca doktorska, IPPT PAN, Warszawa 2011.
[7] J. Sawicki, „Użyteczność sygnału mowy w technice biometrycznej", Grudzień 2003.

Uwagi

Pracę dofinansowano ze środków projektu rozwojowego finansowanego przez NCBiR NR02-0083-10 realizowanego w Instytucie Elektroniki PŁ w latach 2010-2013.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-bf645bb6-dd0a-477a-b9cd-edcb06582c2a