Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Voice command recognition in Polish using deep neural networks
Języki publikacji
Abstrakty
Artykuł dotyczy opracowania narzędzia umożliwiającego automatyczne rozpoznawanie komend głosowych z wykorzystaniem głębokich sieci neuronowych. W projekcie wykorzystane zostały odmiany sieci rekurencyjnych - LSTM (ang. Long-Short Term Memory) [2] oraz GRU (ang. Gated Recurrent Unit) [3]. Do implementacji sieci w postaci programu użyty został język programowania python, z zestawem niezbędnych pakietów programistycznych, w tym pakietów platformy TensorFlow 2. Dane uczące zostały podzielone na trzy podzbiory: zbiór danych uczących, danych walidacyjnych oraz danych egzaminacyjnych. Przyjęto, że metodą uczenia sieci będzie metodą uczenia z nadzorowanego.
The article concerns the development of a tool for automatic recognition of voice commands using deep neural networks. The project employed variations of recurrent networks-LSTM (Long-Short Term Memory) [2] and GRU (Gated Recurrent Unit) [3]. The neural networks were implemented using the Python programming language, along with a set of necessary software packages, including those from the TensorFlow 2 platform. The training data was divided into three subsets: the training set, validation set, and test set. The network was trained using supervised learning methods.
Wydawca
Rocznik
Tom
Strony
22--25
Opis fizyczny
Bibliogr. 11 poz., wykr.
Twórcy
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki
autor
- Wojskowa Akademia Techniczna, Wydział Elektroniki
Bibliografia
- [1] Fox E. - Voice Commands in Tesla’s 2019.40.50.1 New Software Update (List). Tesmania https://www.tesmanian.com/blogs/tesmanian-blog/voice-commands-in-teslas-new-software-update-list
- [2] Sepp Hochreiter, Jurgen Schmidhuber - Long Short - term Memory. ResearchGate https://www.researchgate.net/publication/13853244_Long_Short-term_Memory
- [3] Simeon Kostadinov - Understanding GRU Networks. Toward Data Science https://towardsdatascience.com/understanding-gru-networks-2ef37df6c9be
- [4] Akshay L. Chandra - mcCulloch-Pitts Neuron - Mankind’s First Mahematical Model of A Biological Neuron. Towards Data Science https://towardsdatascience.com/mcculloch-pitts-model-5fdf65ac5dd1
- [5] Kaushik Das - How Recurrent Neural Network (RNN) works. Dataaspirant https://dataaspirant.com/how-recurrent-neural-network-rnnworks/
- [6] Ryszard Tadeusiewicz, Maciej Szaleniec - Leksykon sieci neuronowych - wydanie I Wrocław 2015.r.
- [7] Sepp Hochreiter, Jurgen Schmidhuber - Long Short - term Memory. ResearchGate https://www.researchgate.net/publication/13853244_Long_Short-term_Memory
- [8] Stanisław Osowski - Głębokie sieci neuronowe i ich zastosowanie w eksploracji danych. Wydawnictwo SIGMA-NOT https://sigma-not.pl/publikacja-113632-g%C5%82%C4%99bokie-sieci-neuronowe-i-ich-zastosowania-w-eksploracji-danych-przeglad-telekomunikacyjny-2018-5.html
- [9] Yuanhangsu, C. C. Jay Kuo - On Extended Long Short-term Memory and Dependent Bidirectional Reccurent Neural Network. ResearchGate https://www.researchgate.net/publication/323570767_On_ Extended_Long_Short-Term_Memory_and_dependent_Bidirectional_ Recurrent _Neural_Network
- [10] Anatol Leszek - Czym jest format WAV?. Apowersoft https://www.apowersoft.pl/czym-jest-format-wav.html
- [11] Tom Backstorm - Cepstrum and MFCC. A! Aalto University Wiki https://wiki.aalto.fi/display/ITSP/Cepstrum+and+MFCC.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-607fe4e3-7041-4eef-8055-f359f8aa4c47
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.