Warianty tytułu
Wprowadzanie w czasie rzeczywistym znaku wodnego do sygnału jednej strony rozmowy telefonicznej w celu segmentacji mówców
Języki publikacji
Abstrakty
The paper presents a digital signal processor (DSP) based system for segmentation of speakers of a telephone conversation. The TMS320C6713 DSP by Texas Instruments in real-time watermarks one interlocutor voice and therefore precise segmentation of both conversation sides is made on a PC without any speaker recognition techniques. The authors also solved the problem of data blocks synchronization and beats caused by differences in the digital-to-analog and the analog-to-digital sampling clock frequencies.
Artykuł prezentuje, zrealizowany na procesorze sygnałowym, system do segmentacji mówców rozmowy telefonicznej. Użyto procesora TMS320C6713 firmy Texas Instruments, który podczas rozmowy oznacza znakiem wodnym jednego z rozmówców. Umożliwia to późniejszą separację mówców bez użycia algorytmów ich rozpoznawania. Autorzy dodatkowo rozwiązali problemy związane z synchronizacją bloków danych i dudnieniami wywołanymi różnicą częstotliwości zegarów taktujących przetworniki analogowo-cyfrowe i cyfrowo-analogowe.
Czasopismo
Rocznik
Tom
Strony
36-41
Opis fizyczny
Bibliogr. 13 poz., schem., wykr.
Twórcy
autor
autor
autor
autor
autor
autor
autor
- Poznań University of Technology, Chair of Control and System Engineering, Division of Signal Processing and Electronic Systems, Adam.Dabrowski@put.poznan.pl
Bibliografia
- [1] DGT, NetCRR digital call recorder. Catalogue card. Available at: www.dgt.com.pl
- [2] Dąbrowski A., Weychan R, Meyer A., Chmielewska A., Segmentacja mówców w rozmowach telefonicznych na podstawie znaku wodnego, Elektronika (LII), nr 5/2011, (2011), 98-102
- [3] Ouamour S., Sayoud H., Guerti M., Speaker Segmentation Using Parallel Fusion between three Classifiers, 3rd International Conference on Signals, Circuits and Systems (2009),1-4
- [4] Yong Ma, Chang-chun Bao, Jia Liu, Speaker segmentation and clustering based on the improved spectral clustering, 2011 IEEE International Workshop on Machine Learning for Signal Processing, (2011), 1-5
- [5] Kadri H., Lachiri Z., Ellouze N.: Robustness improvement of Speaker Segmentation techniques based on the Bayesian Information Criterion, 2nd Information and Communication Technologies, (2006), 1300-1301
- [6] Grasic M. and others: The Influence of Speech/Non-speech Segmentation on On-line and Off-line Speaker Segmentation Accuracy, 16th International Conference on Systems, Signals and Image Processing, (2009), 1-4
- [7] Chan W.N. and others: Use of vocal source features in speaker segmentation, 2006 IEEE Conference on Acoustics, Speech and Signal Processing, (2006), Vol. 1, 657-660
- [8] Ziółko B., Manandhar S., Wilson R.C., Phoneme segmentation of speech, 18th International Conference on Pattern Recognition, (2006), Vol. 4, 282-285
- [9] TMS320C6713 DSK technical documentation (2003) http://c6000.spectrumdigital.com/dsk6713/V2/docs/dsk6713_TechRef.pdf
- [10] Description of the environment Matlab/Simulink (2012): http://www.mathworks.com/
- [11] Stark H. G., Wavelets and Signal Processing, Springer, Germany, (2005)
- [12] Białasewicz J.T.: Falki i aproksymacje (Wavelets and approximations), WNT, Warszawa (2000)
- [13] Symlets12 coefficients (2012): http://wavelets.pybytes.com/wavelet/sym12/
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOK-0039-0007