Analiza sceny przy użyciu głębokich sieci neuronowych typu YOLO

Mikołajczyk, Mateusz; Kwasigroch, Arkadiusz; Grochowski, Michał

doi:10.32016/1.68.07

Artykuł - szczegóły

Tytuł artykułu

Analiza sceny przy użyciu głębokich sieci neuronowych typu YOLO

Autorzy

Mikołajczyk Mateusz , Kwasigroch Arkadiusz , Grochowski Michał

Treść / Zawartość

Pełne teksty:

Pobierz

Identyfikatory

DOI

10.32016/1.68.07

Warianty tytułu

Scene analysis using YOLO neural network

Konferencja

Zastosowanie komputerów w nauce i technice 2019 (XXIX ; 2019 ; Gdańsk ; Polska)

Języki publikacji

Abstrakty

W artykule opisany został problem analizy sceny na obrazach oraz sekwencjach video. Zadanie analizy sceny polega na detekcji, lokalizacji i klasyfikacji obiektów znajdujących się na obrazach. Zaimplementowany system wykorzystuje głęboką sieć neuronową, której struktura oparta została na architekturze YOLO (You Only Look Once). Niskie zapotrzebowania obliczeniowe wybranej architektury pozwala na wykonywanie detekcji w czasie rzeczywistym z zadowalającą dokładnością. W pracy przeprowadzono również badania nad doborem odpowiedniego optymalizatora wykorzystywanego w procesie uczenia. Jako przykładową aplikację wybrano analizę ruchu ulicznego w której skład wchodzi wykrywanie i lokalizacja obiektów takich jak m.in. samochody, motocykle czy sygnalizacja świetlna. Systemy tego typu mogą być wykorzystywane w wszelkiego typu systemach analizy wizyjnej otoczenia np. w pojazdach autonomicznych, systemach automatycznej analizy video z kamer przemysłowych, systemach dozoru czy analizy zdjęć satelitarnych.

The paper describes the problem of scene analysis in images and video sequences. The task of scene analysis is to detect, locate and classify objects in images. As an example of an application, traffic analysis was chosen, which includes the detection and location of objects such as cars, motorcycles or traffic lights. The implemented system uses a deep neural network, whose structure is based on the YOLO (You Only Look Once) architecture. Low computing requirements of the chosen architecture allows performing real-time detection with satisfactory accuracy. The work also included a study on the selection of an appropriate optimizer used in the learning process. The program correctly detects objects with a large surface area, allowing the system to be used in traffic analysis. The work also showed that using the ADAM algorithm allowed significantly shorten the training time of the neural network. Systems of this type can be used in many types of video analysis systems such as autonomous vehicles, automatic video analysis systems with CCTV cameras, surveillance systems or satellite image analysis.

Słowa kluczowe

sztuczne sieci neuronowe detekcja obiektów przetwarzanie obrazu uczenie głębokie

artificial neural networks object detection image processing deep learning

Wydawca

Wydział Elektrotechniki i Automatyki Politechniki Gdańskiej

Czasopismo

Zeszyty Naukowe Wydziału Elektrotechniki i Automatyki Politechniki Gdańskiej

Rocznik

2019

Tom

Nr 68

Strony

37--40

Opis fizyczny

Bibliogr. 12 poz., tab., rys.

Twórcy

autor

Mikołajczyk Mateusz

m.u.mikolajczyk@gmail.com

Politechnika Gdańska, Wydział Elektrotechniki i Automatyki

autor

Kwasigroch Arkadiusz

arkadiusz.kwasigroch@pg.edu.pl

Politechnika Gdańska, Wydział Elektrotechniki i Automatyki

autor

Grochowski Michał

michal.grochowski@pg.edu.pl

Politechnika Gdańska, Wydział Elektrotechniki i Automatyki

Bibliografia

1. P. Sermanet, D. Eigen, X. Zhang, M. Mathieu, R. Fergus, i Y. LeCun, „OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks”, ArXiv13126229 Cs, 2013.
2. R. Girshick, J. Donahue, T. Darrell, i J. Malik, „Rich feature hierarchies for accurate object detection and semantic segmentation”, ArXiv13112524 Cs, 2013.
3. R. Girshick, „Fast R-CNN”, ArXiv150408083 Cs, kwi. 2015.
4. S. Ren, K. He, R. Girshick, i J. Sun, „Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”, ArXiv150601497 Cs, 2015.
5. [„YOLO: Real-Time Object Detection”. Dostępne na: https://pjreddie.com/darknet/yolov2/. [Udostępniono: 12.2018].
6. J. Redmon i A. Farhadi, „YOLO9000: Better, Faster, Stronger”, ArXiv161208242 Cs. 2016.
7. W. Liu i in., „SSD: Single Shot MultiBox Detector”, ArXiv151202325 Cs, t. 9905, s. 21–37, 2016.
8. T.-Y. Lin i in., „Microsoft COCO: Common Objects in Context”, ArXiv14050312 Cs, 2014.
9. S. Ruder, „An overview of gradient descent optimization algorithms”, ArXiv160904747 Cs, 2016.
10. Loshchilov i F. Hutter, „SGDR: Stochastic Gradient Descent with Warm Restarts”, ArXiv160803983 Cs Math, 2016.
11. D. P. Kingma i J. Ba, „Adam: A Method for Stochastic Optimization”, ArXiv14126980 Cs, grudz. 20
12. J. Huang i in., „Speed/accuracy trade-offs for modern convolutional object detectors”, w Proceedings of the IEEE conference on computer vision and pattern recognition, 2017

Uwagi

Opracowanie rekordu ze środków MNiSW, umowa Nr 461252 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2020).

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-ecdac476-836d-460c-be1d-b17d45524359