PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

W stronę mowy syntetycznej o naturalnym brzmieniu

Autorzy
Identyfikatory
Warianty tytułu
EN
Towards naturally sounding synthetic speech
Języki publikacji
PL
Abstrakty
PL
Przedstawiono dwa sposoby poprawy jakości syntezy mowy dla języka polskiego. Zaproponowano metodę rozpoznawania części mowy dla języka polskiego z wykorzystaniem sieci neuronowych. Przedstawiono wyniki weryfikacji działania zaproponowanych metod.
EN
Two methods of improving quality of Polish synthetic speech are presented in the paper. The first one is an enhanced method of controlling duration of phonemes; the second one is use of artificial neural network to model intonation of synthetic phrase. A method of part-of-speech tagging for the Polish language using neural networks is proposed. The results of verification of the proposed methods are presented.
Rocznik
Tom
Strony
13--16
Opis fizyczny
rys., tab., wykr., Bibliogr. 15 poz.
Twórcy
autor
Bibliografia
  • [1] Bień J., Woliński M.: Numeryczne kody gramatyczne we Wzbogaconym korpusie słownika frekwencyjnego polszczyzny współczesnej. CD wyd. Uniwersytet Warszawski, 2001
  • [2] Buhmann J., Vereecken H., Fackrell J., Martens J. P., Van Coile B.: Data driven intonation modelling of 6 languages. ISCLP 2000, Pekin, 2000
  • [3] Fackrell J., Vereecken H., Martens J. -P., Van Coile B.: Multilingual prosody modeling using cascades of regression trees and neural networks, EUROSPEECH'99, Budapeszt, 1999
  • [4] Janicki A.: Automatic construction of acoustic inventory for the concatenative speech synthesis for Polish. ICSLP 2000, Pekin, 2000
  • [5] Janicki A.: Application of Neural Networks for POS Tagging and Intonation Control in Speech Synthesis for Polish. International Conference on Soft Computing and Intelligent Systems SCIS 2004, Jokohama, 2004
  • [6] Janicki A.: Reconstruction of Polish Diacritics in a Text-to-Speech System. Interspeech 2005 – Eurospeech, Lizbona, 2005
  • [7] Janicki A., Kula S.: Badanie wpływu modelowania intonacji na jakość mowy syntetyzowanej z tekstu. Krajowe Sympozjum Telekomunikacji, Bydgoszcz, 2004.
  • [8] Jilka M., Möhler G., Dogil G.: Rules for the Generation of ToBI-based American English Intonation. Speech Communication 28, 1999
  • [9] Kula S., Dymarski P., Janicki A., Jobin C., Boula de Mareüil P.: Prosody control in diphone-based speech synthesis system for Polish. Prosody 2000, Kraków, 2000
  • [10] Oliver D.: Modelling Pitch Accent Types for Polish Speech Synthesis. Interspeech 2005 – Eurospeech, Lizbona, 2000
  • [11] Riley M.: Tree-based modeling of segmental durations. W: G. Bailly, C. Benoit and T. R. Sawallis (eds.), Talking Machines: Theories Models and Designs, Elsevier, Amsterdam, 1992
  • [12] Van Santen J. P.: Contextual Effects on Vowel Duration. Speech Communication 11, 1992
  • [13] Van Santen J. P.: Prosodic Modeling in Text-to-Speech Synthesis. Proc. Eurospeech '97, 1997
  • [14] Schmid H.: Part-of-speech tagging with neural networks. International Conference on Computational Linguistics, (Coling'94), Kyoto, Japan, 1994
  • [15] Wypych M.: An Automatic Intonation Recognizer for the Polish Language Based on Machine Learning and Expert Knowledge. Interspeech 2005 – Eurospeech, Lizbona, 2005
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOC-0015-0003
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.