Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Memory requirement analysis for the basic computation unit in the hardware implementation of the „semiglobal” stereo matching algorithm
Języki publikacji
Abstrakty
Stereowizja jest od wielu lat jedną z intensywnie badanych dziedzin wizji komputerowej, ze względu na to że umożliwia stworzenie trójwymiarowego modelu sceny obserwowanej przy pomocy dwóch zwykłych kamer wideo. Jednakże większość algorytmów opisanych w literaturze działa wolno i nie jest łatwa w dostosowaniu do implementacji w czasie rzeczywistym w układach cyfrowych. Wśród metod uważanych za możliwe do implementacji w czasie rzeczywistym są algorytmy z grupy optymalizacji typu „semiglobal”, jednakże ich wadą jest duża złożoność pamięciowa. Artykuł ten wyjaśnia dlaczego jest to problemem w układach FPGA, zwłaszcza tych nisko-budżetowych, a także przedstawia propozycje możliwych rozwiązań. W szczególności zaprezentowany jest sposób wymiany ilości potrzebnej pamięci na zasoby obliczeniowe poprzez podział obrazu na bloki, z oszacowaniem o ile wzrośnie rozmiar układu w strukturze FPGA przy zastosowaniu zaproponowanych metod.
Stereovision is one of the most intensively studied areas of the computer vision. One of the reasons is that it enables the creation of a 3D model of a scene acquired with just two common optical cameras. There are many stereo algorithms described in the literature, but most of them are not suitable for real time hardware implementations. One of the groups of algorithms generally considered to be implementable in hardware are “semiglobal” algorithms. However, high memory requirements are one of their drawbacks. In this article, we try to explain why it is a problem in the case of low cost FPGAs and present a solution that tries to remedy it. In particular, it is shown that it is possible to significantly lower the memory requirements by dividing an image into blocks, but at the cost of the increased module size.
Słowa kluczowe
Wydawca
Rocznik
Tom
Strony
38--42
Opis fizyczny
Bibliogr. 10 poz., rys., tab.
Twórcy
autor
- Politechnika Warszawska, Instytut Radioelektroniki
autor
- Politechnika Warszawska, Instytut Radioelektroniki
Bibliografia
- [1] R. Szeliski, Computer Vision: Algorithms and Applications, Berlin/Heidelberg: Springer, 2011.
- [2] D. Scharstein, R. Szeliski i R. Zabih, „A taxonomy and evaluation of dense two-frame stereo correspondence algorithms,” IEEE Workshop on Stereo and Multi-Baseline Vision, 2001.
- [3] R. Zabih i J. Woodfill, „Non-parametric local transforms for computing visual correspondence,” European Conference on Computer Vision, 1994.
- [4] S. Jin i i. in., „Fpga design and implementation of a real-time stereo vision system,” IEEE Transactions Circuits and Systems for Video Technology, tom 20, nr 1, pp. 15–26, 2010.
- [5] J. Sun, N.-N. Zheng i H.-Y. Shum, „Stereo matching using belief propagation,” IEEE Transactions Pattern Analysis and Machine Intelligence, tom 25, nr 7, pp. 787–800, 2003.
- [6] V. Kolmogorov i R. Zabih, „Multi-camera scene reconstruction via graph-cuts,” Computer Vision – ECCV 2002, Berlin/Heidelberg, Springer, 2002, pp. 8–40.
- [7] H. Hirschmuller, „Accurate and efficient stereo processing by semiglobal matching and mutual information,” Conference on Computer Vision and Pattern Recognition, 2005.
- [8] S. Gehrig, F. Eberli i T. Meyer, „A real-time low-power stereo vision engine using semi-global matching,” Computer Vision Systems, Berlin/Heidelberg, Springer, 2009, pp. 134–143.
- [9] C. Banz i i. in., „Real-time stereo vision system using semi-global matching disparity estimation: Architecture and fpga-implementation,” International Conference on Embedded Computer Systems (SAMOS), 2010.
- [10] D. Scharstein i R. Szeliski, „High-accuracy stereo depth maps using structured light,” Conference on Computer vision and pattern recognition, 2003.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-383d8775-fe16-4a0b-8108-0bf0b5fd431b