Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Application of statistical modelling to speaker verification
Konferencja
Multikonferencja Krajowego Środowiska Tele- i Radiokomunikacyjnego (7-9.09.2022 ; Warszawa, Polska)
Języki publikacji
Abstrakty
Przedstawiono zastosowanie modelowania statystycznego, opartego na mieszaninach rozkładów Gaussa w głosowym systemie biometrycznym. Przedstawiono przykładową realizację systemu weryfikacji mówcy z wykorzystaniem otwartego oprogramowania. Uzyskane wyniki umożliwiają zastosowanie takiego systemu weryfikacji tożsamości jako dodatkowego zabezpieczenia zwiększającego poziom bezpieczeństwa systemu teleinformatycznego.
The paper presents the application of statistical modelling based on Gaussian mixture models to a voice biometric system. The implementation of a speaker verification system based on open-source software is presented. Obtained results enable the application of such an identity verification system as an additional security layer which increases the security level of a teleinformation system.
Wydawca
Rocznik
Tom
Strony
139--142
Opis fizyczny
Bibliogr. 14 poz., rys.
Twórcy
Bibliografia
- 1. Dehak N., P.J. Kenny, R. Dehak, P. Dumouchel, P. Ouellet, 2011, “Frontend factor analysis for speaker verification”. IEEE Transactions on Audio, Speech and Language Processing, 19(4).
- 2. Dustor A., P. Kłosowski, 2013, “Biometric Voice Identification Based on Fuzzy Kernel Classifier”, Communication in Computer and Information Science 370: 456-465. Springer Verlag.
- 3. Dustor A., P. Kłosowski, J. Izydorczyk, 2014. „Speaker Recognition System with Good Generalization Properties”. International Conference on Multimedia Computing and Systems (ICMCS), 206-210.
- 4. Dustor A., 2020.”Speaker verification with TIMIT corpus – some remarks on classical methods”. Proceedings of The 24th International Conference on Signal Processing Algorithms, Architectures, Arrangements and Application (SPA).
- 5. Jiang Y., F.H.F. Leung, 2021. “Vektor-Based Feature Representations for Speech Signals: from Super Vector to Latent Vector”. IEEE Transaction on Multimedia 23: 2641-2655.
- 6. Kabir M.M., M.F. Mridha, J. Shin, I. Jahan, A.Q. Ohi, 2021. “A Survey of Speaker Recognition
- 7. Larcher A., K.A.Lee, S.Meignier, 2016., “An extensible speaker identification SIDEKIT in Python". International Conference on Audio Speechand Signal Processing ICASSP.
- 8. Martin A., G.Doddington, T.Kamm, M.Ordowski, M.Przybocki.1997. “The DET curvein assesment of detection task performance”, Proceedings of the EUROSPEECH: 189 5-1898.
- 9. Ohi Q., M.F.Mridha, M.A.Hamid i M.Monowa, 2021. “Deep Speaker Recognition: Process, Progress, and Challenges”. IEEE Access 9: 89619-89643.
- 10. Rabiner L.R., B.H.Juang, 1993. Fundamentals of speech recognition.
- 11. Reynolds O.A., T.F.Quatieri, 2000. „Speaker Verification Using Adapted Gaussian Mixture Models”. Digital Signal Processing 10: 19-41.
- 12. Snyder O., O.Garcia-Romero, G.Sell, D.Povey, S.Khudanpur, 2018. Xvectors: Robust dnn embeddings for speaker recognition”. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP): 5329-5333.
- 13. Vapnik V., 1999. The nature of statistical leaming theory. Springer.
- 14. Zhou T., Y.Zhao, J.Wu. 2021. “ResNeXt and Res2Net Structures for Speaker Verification”, IEEE Spoken LanguageTechnology Workshop (SLT):301-307.
Uwagi
Opracowanie rekordu ze środków MEiN, umowa nr SONP/SP/546092/2022 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2022-2023).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ef2ffe1a-f70a-407c-90ab-51c0cd4365a3