Warianty tytułu
Spaczona dyskretna transformata fouriera w perceptualnym przetwarzaniu mowy i audio
X Sympozjum Nowości w Technice Audio i Wideo, Wrocław, 16-18 września 2004
Języki publikacji
This paper presents an unconventional approach to perceptual sound processing, utilizing the Warped Discrete Fourier Transform. Unlike ordinary Discrete Fourier Transform, its novel mutation allows nonuniform sampling of the z-transform over the unit circle. Moreover, the warping can be adjusted to approximate nonlinear frequency resolution of human ear. Thus some aspects of the psy-choacoustic analysis and processing can be improved, what was verified in three practical applications. Firstly, the advanced speech enhancement system operating in the perceptually warped spectrum domain was configured. And recently the same idea was employed in speech and audio compression.
Artykuł prezentuje niekonwencjonalne podejście do perceptualnego przetwarzania dźwięku oparte na Spaczonej Dyskretnej Transformacie Fouriera. W odróżnieniu od zwykłej Dyskretnej Transformaty Fouriera, jej nowa mutacja pozwala na nierównomierne próbkowanie transformaty z na okręgu jednostkowym. Co więcej, spaczenie może być dopasowane tak, by aproksymowało ono nieliniową rozdzielczość częstotliwościową ucha ludzkiego. Dzięki temu pewne aspekty analizy psychoakustycznej i przetwarzania mogą zostać poprawione, co zostało zweryfikowane w trzech praktycznych zastosowaniach. Najpierw zbudowano zaawansowany system uzdatniania mowy operujący w dziedzinie spaczonego widma. Ostatnio ideę wykorzystano także w kompresji mowy i audio.
Opis fizyczny
bibliogr. 11 poz., rys.
- Białystok Technical University
- Białystok Technical University
- Białystok Technical University
- Belorussian State University of Informatics and Radioelectronics
- [1] JOHNSTON J.D., Transform coding of audio signals using perceptual noise criteria, IEEE J. on Selected Areas in Comm., February 1988, vol. 6, no. 2, 314-323.
- [2] PARFIENIUK M., PETROVSKY A., Warped DFT as the basis for psychoacoustic model. Proc. IEEE ICASSP'2004, Montreal, Canada, 17-21 May 2004, vol. I, 185-188.
- [3] PARFIENIUK M., PETROVSKY A., Practical Aspects of the Computation of the Inverse Warped DFT, Proc. DSPA-2004, Moscow, Russia, 31 March - 2 April 2004, vol. 1, 190-194.
- [4] PETROVSKY A., PARFIENIUK M., BOROWICZ A., Warped DFT based perceptual noise reduction system. Proc. AES 116'\ Berlin, Germany, 8-11 May 2004, Conv. Paper #6035.
- [5] MAKUR A., MITRA S.K., Warped Discrete-Fourier Transform: Theory and Applications, IEEE Trans. Circuits Systems I, September 2001, vol. 48, no. 9, 1086-1093.
- [6] SMITH III J.O., ABEL J.S., Bark and ERB Bilinear Transforms, IEEE Trans. Speech, Audio Processing, November 1999, vol. 7, no. 6, 697-708.
- [7] GUSTAFSSON S., JAX P., VARY P., A novel psychoacoustically motivated audio enhancement algorithm preserving background noise characteristic, IEEE ICASSP'98, Seattle, USA, 12-15 May 1998, vol. I, 397-400.
- [8] EPHRAIM Y., MALAH D., Speech enhancement using a minimum mean-square log-spectral amplitude estimator, IEEE Trans. Acoustics, Speech, Signal Processing, April 1985, vol. ASSP-33, no 2, 443-445.
- [9] COHEN I., BERDUGO B., Noise Estimation by Minima Controlled Recursive Averaging for Robust Speech Enhancement, IEEE Signal Processing Letters, January 2002, vol. 9, no. 1,12-15.
- [10] WANG S., SEKEY A., GERSHO A., An Objective Measure for Predicting Subjective Quality of Speech Coders, IEEE J. Selected Areas in Comm., May 1992, vol. 10, no. 5, 819-829.
- [11] YANG W., BENBOUCHTA M., YANTORNO R., Performance of a modified bark spectral distortion measure as an objective speech quality measure. Proc. IEEE ICASSP'98, Seattle, USA, 12-15 May 1998, vol. 1,541-544.
Typ dokumentu
Identyfikator YADDA