PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Optimization of Track-Before-Detect Systems with Decimation for GPGPU

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Optymalizacja systemów śledzenia przed detekcją z decymacją dla GPGPU
Języki publikacji
EN
Abstrakty
EN
Tracking systems based on Track-Before-Detect (TBD) scheme support tracking of low-SNR objects even if object signal is hidden in a noise. In this paper proposed method [1] is tested using Spatio-Temporal TBD algorithm with an additional code profiling using Nvidia CUDA computational platform. Different implementations are possible and the best solution for downsampled approach is based on the separate, register based state-space (without Shared Memory) and texture cache for input measurements.
PL
Algorytmy śledzenia przed detekcją umożliwiają śledzenie obiektów w warunkach niskiej wartości SNR (Signal-to-Noise Ratio) jednak są one bardzo złożone obliczeniowo. Wykorzystując GPGPU (programowalny procesor graficzny) możliwa jest implementacja czasu rzeczywistego. Dla zaproponowanego w [1] rozwiązania optymalizacji implementacji algorytmu z decymacją sygnału wyjściowego możliwe jest kilkukrotne skrócenie czasu obliczeń. W artykule przedstawiono i porównano dalsze możliwe rozwiązania optymalizacji z wykorzystaniem platformy programowej Nvidia CUDA dla rekurencyjnego algorytmu Spatio-Temporal Track-Before-Detect. Przestrzeń stanów może być decymowana w celu lepszego wykorzystania szybkiej pamięci współdzielonej dostępnej w GPGPU, podczas gdy dane wejściowe oraz wyjściowe przechowywane są w wolnej pamięci globalnej. Wykorzystując testy numeryczne z wykorzystaniem opracowanego oprogramowania do profilowania kodu źródłowego stwierdzono, że najbardziej wydajnym rozwiązaniem spośród analizowanych jest implementacja z oddzielnymi kernelami przetwarzania dla poszczególnych wektorów ruchu, wykorzystania rejestrów do przechowywania danych przestrzeni stanów w miejsce pamięci współdzielonej oraz pamięci texture cache do buforowania danych wejściowych. W przypadku niewykorzystywania metody decymacji optymalnym jest wykorzystanie oddzielnych kerneli, rejestrów dla przestrzeni stanów i bezpośredniego dostępu do pamięci globalnej dla danych wejściowych.
Wydawca
Rocznik
Strony
1523--1525
Opis fizyczny
bibliogr. 7 poz., rys., wykr., wzor
Twórcy
autor
  • West - Pomeranian University of Technology in Szczecin, Department of Signal Processing and Multimedia Engineering, 26 Kwietnia 10, 71-126 Szczecin, przemyslaw.mazurek@zut.edu.pl
Bibliografia
  • [1] Mazurek P.: Optimization of Bayesian Track-Before-Detect Algorithms for GPGPUs Implementations, Electrical Review R. 86 7/2010, 187-189, 2010.
  • [2] Blackman S., Poupoli R.: Modern Tracking Systems. Artech House, 1999.
  • [3] Bar-Shalom Y.: Multitarget-Multisensor Tracking: Applications and Advances. Vol. II, 1998.
  • [4] Stone L. D., Barlow C. A., Corwin T. L.: Bayesian Multiple Target Tracking. Artech House 1999.
  • [5] Mazurek P.: Implementation of Spatio-Temporal Track-Before-Detect Algorithm using GPU. Pomiary Automatyka Kontrola, vol. 55 nr 8, 657-659, 2009.
  • [6] NVIDIA CUDA - Compute Unified Device Architecture. Reference Manual v2.0, Nvidia 2008.
  • [7] NVIDIA CUDA - Compute Unified Device Architecture. Programming Guide v2.0, Nvidia 2008.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSW4-0088-0036
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.