PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

System syntezy mowy polskiej do zastosowań w urządzeniach mobilnych

Identyfikatory
Warianty tytułu
EN
A system for polish speech synthesis designated for mobile devices
Języki publikacji
PL
Abstrakty
PL
W artykule omówiono wykonany system syntezy mowy polskiej. System umożliwia syntezę bezpośrednio z tekstu ortograficznego. W celu dokonania transkrypcji fonetycznej opracowano jednoznakowy alfabet fonetyczny (1 znak - 1 fonem). Synteza jest realizowana metodą korpusowej selekcji jednostek fonetycznych. Jako jednostki fonetyczne wykorzystano difony. Niektóre difony mają kilka instancji różniących się kontekstem występowania. Każde słowo może być więc zsyntezowanie na wiele sposobów. Sekwencja difonów dobierana jest za pomocą algorytmu Viterbiego w celu uzyskania najbardziej optymalnego zestawu jednostek fonetycznych, zapewniając w ten sposób większą naturalność generowanej mowy.
EN
The article describes a system for speech synthesis designated for polish language. The system converts text to speech by using simple transcription rules. Every phoneme corresponds to one transcription letter. The system applies the corpus-based method, which uses diaphones at its core. Some diaphones have several instances with different context of occurrence. Therefore, every word can be synthesized in many ways. The applied cost function estimates the quality of a given diaphone connection. The adjacent diaphones are compared in terms of spectral properties. The optimal sequence of diaphones is then singled out by applying the Werbi algorithm. This guarantees the minimal cost value, which reflects the best possible quality of the synthesized speech.
Rocznik
Strony
78--80
Opis fizyczny
Bibliogr. 4 poz., il., wykr.
Twórcy
autor
  • Politechnika Łódzka, Wydział Elektrotechniki, Elektroniki, Informatyki i Automatyki
Bibliografia
  • [1] Szklany K.: Przygotowanie bazy difonów języka polskiego dla realizacji syntezy mowy w systemie MBROLA. 50. Otwarte Seminarium Akustyki 2003.
  • [2] Toshio Hirait, Seiichi Tenpakut, Kiyohiro Shikano: Speech unit selection based on target values driven by speech data in concatenative speech synthesis. Proceedings of 2002 IEEE, Workshop on Speech Synthesis, s. 43.
  • [3] Hunt A., Black A.: Unit selection in a concatenative speech synthesis system using a large speech database. Acoustics, Speech, and Signal Processing, 1996. ICASSP-96.
  • [4] Forney D.: The Viterbi Algorithm. Proceedings of The IEEE, vol. 61, no. 3, 03/1973.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BWAD-0021-0021
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.