Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Improving signal quality of speech codecs using percpetual coding
Języki publikacji
Abstrakty
W komunikacie opisano algorytm kodowania sygnału mowy, którego celem jest uzyskanie wyższej oceny jakości zakodowanego sygnału niż w przypadku algorytmów stosowanych do tej pory. W tym celu wyodrębniane są stany transjentowe oraz fragmenty dźwięczne i bezdźwięczne sygnału. Fragmenty te są następnie kodowane w odmienny sposób: składowe bezdźwięczne są kodowane tradycyjną metoda parametryczną, natomiast do składowych dźwięcznych wykorzystano algorytm kodowania perceptualnego. Jakość sygnału mowy kodowanego zgodnie z proponowaną metodą porównano z jakością możliwą do uzyskania w przypadku powszechnie stosowanych obecnie kodeków mowy.
Speech coding algorithm which aiming at better subjective signal quality that is provided by currently used speech codecs, was described in the paper. A higher signal quality may be achieved by discerning transient states, voiced and unvoiced components of a speech signal and encoding tl1 signal using different approach for each component type. Unvoiced signal components are encode using standard parametric coding algorithm, while for voiced parts of the signal, a perceptual coding algorithm is applied. Subjective quality of the signal encoded using the proposed algorithm was compared to signal quality achieved by standard speech codecs.
Słowa kluczowe
Rocznik
Tom
Strony
399--406
Opis fizyczny
Bibliogr. 6 poz., 5 rys.
Twórcy
autor
autor
autor
- Katedra Systemów Multimedialnych, Politechnika Gdańska
Bibliografia
- [1] Yang M.: Low Bitrate Speech Coding, IEEE Potentials, vol. 23, no. 4, pp. 32-36, 2004.
- [2] Chu W.C.: Speech Coding Algorithms. Foundation and Evolution of Standardized Coders. John Wiley & Sons, Hoboken 2003.
- [3] Goldberg R., Riek L.: A Practical Handbook of Speech Coders. CRC Press, Boca Raton 2000.
- [4] Babu V. S., Malot A. K., V. M. Vijayachandran Y.M., Yinay M. K., Transient Detection for Transform Domain Coders, AES 116th Convention, Berlin, May 2004.
- [5] Specyfikacja Ogg Vorbis, http://xiph.org/vorbis/
- [6] ITU-T, Perceptual evaluation of speech ąuality (PESQ), an objective method for end-to-end speech quality assessment of narrow-band telephone networks and speech codecs, Feb. 2001. P.862.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG5-0013-0046