PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Analiza sceny przy użyciu głębokich sieci neuronowych typu YOLO

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Scene analysis using YOLO neural network
Konferencja
Zastosowanie komputerów w nauce i technice 2019 (XXIX ; 2019 ; Gdańsk ; Polska)
Języki publikacji
PL
Abstrakty
PL
W artykule opisany został problem analizy sceny na obrazach oraz sekwencjach video. Zadanie analizy sceny polega na detekcji, lokalizacji i klasyfikacji obiektów znajdujących się na obrazach. Zaimplementowany system wykorzystuje głęboką sieć neuronową, której struktura oparta została na architekturze YOLO (You Only Look Once). Niskie zapotrzebowania obliczeniowe wybranej architektury pozwala na wykonywanie detekcji w czasie rzeczywistym z zadowalającą dokładnością. W pracy przeprowadzono również badania nad doborem odpowiedniego optymalizatora wykorzystywanego w procesie uczenia. Jako przykładową aplikację wybrano analizę ruchu ulicznego w której skład wchodzi wykrywanie i lokalizacja obiektów takich jak m.in. samochody, motocykle czy sygnalizacja świetlna. Systemy tego typu mogą być wykorzystywane w wszelkiego typu systemach analizy wizyjnej otoczenia np. w pojazdach autonomicznych, systemach automatycznej analizy video z kamer przemysłowych, systemach dozoru czy analizy zdjęć satelitarnych.
EN
The paper describes the problem of scene analysis in images and video sequences. The task of scene analysis is to detect, locate and classify objects in images. As an example of an application, traffic analysis was chosen, which includes the detection and location of objects such as cars, motorcycles or traffic lights. The implemented system uses a deep neural network, whose structure is based on the YOLO (You Only Look Once) architecture. Low computing requirements of the chosen architecture allows performing real-time detection with satisfactory accuracy. The work also included a study on the selection of an appropriate optimizer used in the learning process. The program correctly detects objects with a large surface area, allowing the system to be used in traffic analysis. The work also showed that using the ADAM algorithm allowed significantly shorten the training time of the neural network. Systems of this type can be used in many types of video analysis systems such as autonomous vehicles, automatic video analysis systems with CCTV cameras, surveillance systems or satellite image analysis.
Twórcy
  • Politechnika Gdańska, Wydział Elektrotechniki i Automatyki
  • Politechnika Gdańska, Wydział Elektrotechniki i Automatyki
  • Politechnika Gdańska, Wydział Elektrotechniki i Automatyki
Bibliografia
  • 1. P. Sermanet, D. Eigen, X. Zhang, M. Mathieu, R. Fergus, i Y. LeCun, „OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks”, ArXiv13126229 Cs, 2013.
  • 2. R. Girshick, J. Donahue, T. Darrell, i J. Malik, „Rich feature hierarchies for accurate object detection and semantic segmentation”, ArXiv13112524 Cs, 2013.
  • 3. R. Girshick, „Fast R-CNN”, ArXiv150408083 Cs, kwi. 2015.
  • 4. S. Ren, K. He, R. Girshick, i J. Sun, „Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks”, ArXiv150601497 Cs, 2015.
  • 5. [„YOLO: Real-Time Object Detection”. Dostępne na: https://pjreddie.com/darknet/yolov2/. [Udostępniono: 12.2018].
  • 6. J. Redmon i A. Farhadi, „YOLO9000: Better, Faster, Stronger”, ArXiv161208242 Cs. 2016.
  • 7. W. Liu i in., „SSD: Single Shot MultiBox Detector”, ArXiv151202325 Cs, t. 9905, s. 21–37, 2016.
  • 8. T.-Y. Lin i in., „Microsoft COCO: Common Objects in Context”, ArXiv14050312 Cs, 2014.
  • 9. S. Ruder, „An overview of gradient descent optimization algorithms”, ArXiv160904747 Cs, 2016.
  • 10. Loshchilov i F. Hutter, „SGDR: Stochastic Gradient Descent with Warm Restarts”, ArXiv160803983 Cs Math, 2016.
  • 11. D. P. Kingma i J. Ba, „Adam: A Method for Stochastic Optimization”, ArXiv14126980 Cs, grudz. 20
  • 12. J. Huang i in., „Speed/accuracy trade-offs for modern convolutional object detectors”, w Proceedings of the IEEE conference on computer vision and pattern recognition, 2017
Uwagi
Opracowanie rekordu ze środków MNiSW, umowa Nr 461252 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2020).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ecdac476-836d-460c-be1d-b17d45524359
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.