PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Rozpoznawanie komend głosowych w j. polskim z wykorzystaniem głębokich sieci neuronowych

Identyfikatory
Warianty tytułu
EN
Voice command recognition in Polish using deep neural networks
Języki publikacji
PL
Abstrakty
PL
Artykuł dotyczy opracowania narzędzia umożliwiającego automatyczne rozpoznawanie komend głosowych z wykorzystaniem głębokich sieci neuronowych. W projekcie wykorzystane zostały odmiany sieci rekurencyjnych - LSTM (ang. Long-Short Term Memory) [2] oraz GRU (ang. Gated Recurrent Unit) [3]. Do implementacji sieci w postaci programu użyty został język programowania python, z zestawem niezbędnych pakietów programistycznych, w tym pakietów platformy TensorFlow 2. Dane uczące zostały podzielone na trzy podzbiory: zbiór danych uczących, danych walidacyjnych oraz danych egzaminacyjnych. Przyjęto, że metodą uczenia sieci będzie metodą uczenia z nadzorowanego.
EN
The article concerns the development of a tool for automatic recognition of voice commands using deep neural networks. The project employed variations of recurrent networks-LSTM (Long-Short Term Memory) [2] and GRU (Gated Recurrent Unit) [3]. The neural networks were implemented using the Python programming language, along with a set of necessary software packages, including those from the TensorFlow 2 platform. The training data was divided into three subsets: the training set, validation set, and test set. The network was trained using supervised learning methods.
Rocznik
Strony
22--25
Opis fizyczny
Bibliogr. 11 poz., wykr.
Twórcy
autor
  • Wojskowa Akademia Techniczna, Wydział Elektroniki
  • Wojskowa Akademia Techniczna, Wydział Elektroniki
Bibliografia
  • [1] Fox E. - Voice Commands in Tesla’s 2019.40.50.1 New Software Update (List). Tesmania https://www.tesmanian.com/blogs/tesmanian-blog/voice-commands-in-teslas-new-software-update-list
  • [2] Sepp Hochreiter, Jurgen Schmidhuber - Long Short - term Memory. ResearchGate https://www.researchgate.net/publication/13853244_Long_Short-term_Memory
  • [3] Simeon Kostadinov - Understanding GRU Networks. Toward Data Science https://towardsdatascience.com/understanding-gru-networks-2ef37df6c9be
  • [4] Akshay L. Chandra - mcCulloch-Pitts Neuron - Mankind’s First Mahematical Model of A Biological Neuron. Towards Data Science https://towardsdatascience.com/mcculloch-pitts-model-5fdf65ac5dd1
  • [5] Kaushik Das - How Recurrent Neural Network (RNN) works. Dataaspirant https://dataaspirant.com/how-recurrent-neural-network-rnnworks/
  • [6] Ryszard Tadeusiewicz, Maciej Szaleniec - Leksykon sieci neuronowych - wydanie I Wrocław 2015.r.
  • [7] Sepp Hochreiter, Jurgen Schmidhuber - Long Short - term Memory. ResearchGate https://www.researchgate.net/publication/13853244_Long_Short-term_Memory
  • [8] Stanisław Osowski - Głębokie sieci neuronowe i ich zastosowanie w eksploracji danych. Wydawnictwo SIGMA-NOT https://sigma-not.pl/publikacja-113632-g%C5%82%C4%99bokie-sieci-neuronowe-i-ich-zastosowania-w-eksploracji-danych-przeglad-telekomunikacyjny-2018-5.html
  • [9] Yuanhangsu, C. C. Jay Kuo - On Extended Long Short-term Memory and Dependent Bidirectional Reccurent Neural Network. ResearchGate https://www.researchgate.net/publication/323570767_On_ Extended_Long_Short-Term_Memory_and_dependent_Bidirectional_ Recurrent _Neural_Network
  • [10] Anatol Leszek - Czym jest format WAV?. Apowersoft https://www.apowersoft.pl/czym-jest-format-wav.html
  • [11] Tom Backstorm - Cepstrum and MFCC. A! Aalto University Wiki https://wiki.aalto.fi/display/ITSP/Cepstrum+and+MFCC.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-607fe4e3-7041-4eef-8055-f359f8aa4c47
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.