Badanie wydajności zrównoleglonego algorytmu odejmowania tła na platformach GPU
Implementation of the background subtraction algorithm on parallel GPUs is presented. The algorithm processes video streams and extracts foreground pixels. The work focuses on optimizing parallel algorithm implementation by taking into account specific features of the GPU architecture, such as memory access, data transfers and work group organization. The algorithm is implemented in OpenCL and CUDA. Various optimizations of the algorithm are presented and tested using devices with varying processing power, including desktop PC graphic cards, ultrabooks and the Tegra mobile processor. The aim of the work is to determine if the optimized algorithm, run on currently available GPUs, is able to perform on-line processing of high resolution video streams.
W artykule przedstawiono implementację algorytmu odejmowania tła na procesorach równoległych GPU. Algorytm przetwarza strumienie obrazu z kamer i wyodrębnia piksele nie należące do tła. Praca skupia się na optymalizacji równoległego przetwarzania obrazu z uwzględnieniem architektury procesorów GPU. Algorytm został zaimplementowany w systemach OpenCL i CUDA. Przedstawiono różne techniki optymalizacji i wyniki testów wykonanych na procesorach GPU w urządzeniach o różnej mocy obliczeniowej. Celem pracy jest określenie czy zoptymalizowany algorytm uruchomiony na dostępnych obecnie urządzeniach GPU jest w stanie przetwarzać strumienie obrazu w trybie online.
Bibliogr. 19 poz., il., tab., wykr.
- Gdansk University of Technology, Multimedia Systems Department
This work has been funded by the Artemis JU as part of the COPCAMS project under GA number 332913.
