Tytuł artykułu
Treść / Zawartość
Pełne teksty:
Identyfikatory
Warianty tytułu
Comparative analysis of CNN models for handwritten digit recognition
Języki publikacji
Abstrakty
W artykule podejmowana jest tematyka konwolucyjnych sieci neuronowych wykorzystywanych do klasyfikacji cyfr pisma odręcznego. Celem badań jest ocena dokładności, wydajności oraz czasu treningu i klasyfikacji trzech sieci OCR (VGG-16, VGG-19 i AlexNet) oraz porównanie ich między sobą wybierając przy tym ten najbardziej optymalny. Do badań wykorzystano popularny zestaw danych MNISTskładający się z 70 000 obrazów. Dla każdego modelu przepro-wadzono wstępne badanie w celu określenia optymalnej liczby danych wejściowych oraz liczbę epok treningowych. Wyniki badańwskazują, że pomimo dłuższego czasu treningu i klasyfikacji, model AlexNet osiągnął najwyższe wynikiw zakresie precyzji, czułości oraz F1-score, co wskazuje na jego zdolność do skutecznej klasyfikacji obrazów.
The paper discusses the subject of convolutional neural networks used for handwritten digit classification. The purpose of the research is to evaluate the accuracy, performance, training, and classification time of three OCR networks (VGG-16, VGG-19 and AlexNet) and compare them with each other while selecting the most optimal one. The popular MNIST dataset of 70,000 images was used for the study. For each model, a preliminary study was conducted to determine the optimal parameters in the form of the number of input data and number of training epochs. The result of the work indicates that, despite the longer training and classification time, the AlexNet model achieved the highest precision, recall, and F1-score, indicating its ability to effectively classify images.
Czasopismo
Rocznik
Tom
Strony
179--185
Opis fizyczny
Bibliogr. 10 poz., rys., tab.
Twórcy
- Lublin University of Technology (Poland)
- Lublin University of Technology (Poland)
Bibliografia
- 1. A. Przegalińska, L. Ciechanowski, Wykorzystanie algorytmów sztucznej inteligencji w instytucjach kultury, Ministerstwo Kultury i Dziedzictwa Narodowego, Ekspertyza Ministerialna, Warszawa, 2019-2020.
- 2. P. Norvig, S. Russel, Artificial Intelligence: a modern approach, Fourth Edition, Pearson, University of California at Berkeley, 2021.
- 3. K. Simonyan, A. Zisserman, Very Deep convolutional networks for large-scale image recognition, In International Conference on Learning Representations (ICLR) 6 (2016) 1-11.
- 4. Krizhevsky, I. S Sutskever, G. E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks, Communications of the ACM 6 (2017) 84-90.
- 5. Lecture MIT 6.S191 (2023): Convolutional Neural Networks, Massachusetts Institute of Technology https://www.youtube.com/watch?v=NmLK_WQBxB4 [01.03.2024]
- 6. Y. LeCun, L. Bottou, Y. Bengio, P. Haffner, Gradient-based learning applied to document recognition in Proceedings of the IEEE 11 (1998) 2278-2324.
- 7. Baldominos, Y. Saez, P. Isasi, A Survey of handwritten character recognition with MNIST and EMNIST, Applied Sciences 9 (2019) 15-31.
- 8. G. S. Handelman, et al. Peering into the black box of artificial intelligence: evaluation metrics of machine learning methods, American Journal of Roentgenology 1 (2019) 38-43.
- 9. J. Lever, M. Krzywinski, N. Altman, Classification evaluation, Nature Methods 13 (2016) 603-604.
- 10. S. Mascarenhas, M. Agarwal, A comparison between VGG16, VGG19 and ResNet50, architecture frameworks for Image Classification In International conference on disruptive technologies for multi-disciplinary research and applications (Centon) IEEE 1 (2021) 96-99
Uwagi
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki (2025).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-94ef7666-b581-425d-aa9b-03c756aada87
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.