Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Object detection using probabilistic graphical models
Języki publikacji
Abstrakty
Detekcja obiektów na obrazach RGB jest ważnym zagadnieniem w kontekście postrzegania otoczenia przez autonomiczne roboty. W niniejszej pracy zaproponowano i przetestowano nowe podejście do tego problemu. Podejście to łączy wykorzystanie hierarchii części jako kompaktowej reprezentacji modelu obiektu oraz probabilistycznych modeli grafowych jako metody wnioskowania o obecności obiektów. Hierarchia składa się części, które zostały podzielone na warstwy. Każda część jest kompozycją kilku części z niższej warstwy, wyuczoną na podstawie przykładowych obrazów. Części są współdzielone pomiędzy kategoriami obiektów, co znacznie komplikuje proces wnioskowania, lecz daje wiele korzyści. Zaproponowany system może w przyszłości służyć do wspomagania nawigacji robotów mobilnych, a także z nimi współpracować. Skuteczność zaprezentowanego rozwiązania przetestowano na ogólnie dostępnym zbiorze ETHZ Shape Classes .
Object detection on RGB images is an important problem in a context of an environment perception by mobile robots. In this work I proposed and tested a novel approach to this problem. The approach combines an usage of a parts hierarchy as a compact object model representation with an utilization of probabilistic graphical models to infer about objects existence. The hierarchy is build from parts that are organised as layers. Every part is a composition of several lower layer parts, learned on a basis of sample images presenting objects. Parts are shared among object categories, which significantly complicates inference process, but brings multiple benefits. The proposed system may aid navigation systems of mobile robots in the future and cooperate with them. An efficiency of the solution was tested on a publicly available ETHZ Shape Classes dataset.
Rocznik
Tom
Strony
313--324
Opis fizyczny
Bibliogr. 19 poz., rys.
Twórcy
autor
- Politechnika Poznańska, Instytut Automatyki i Inżynierii Informatycznej, ul. Piotrowo 3A, 61-965 Poznań
Bibliografia
- [1] Herbert Bay, Tinne Tuytelaars, Luc Van Gool. SURF: Speeded Up Robust Features. In: European Conference on Computer Vision. Proceedings, 2006, s. 404-417.
- [2] Gabriella Csurka et al. Visual Categorization with Bagsof Keypoints. In: ECCV International Workshop on Statistical Learning in Computer Vision. Proceedings, 2004, s. 1-22.
- [3] Boris Epshtein, Shimon Ullman. Feature Hierarchies for Object Classification. In: IEEE International Conference on Computer Vision. Proceedings, Washington, DC, USA, IEEE Computer Society, 2005, ICCV'05, s. 220-227.
- [4] Boris Epshtein, Shimon Ullman. Semantic Hierarchies for Recognizing Objects and Parts. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Minneapolis, MN, June 17-22, 2007, s. 1-8.
- [5] Hans G. Feichtinger, Thomas Strohmer. Gabor Analysis and Algorithms. Birkhäuser 1998.
- [6] Vittorio Ferrari, Frederic Jurie, Cordelia Schmid. Accurate Object Detection with Deformable Shape Models Learnt from Images. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Minneapolis, MN, June 17-22, 2007, s. 1-8.
- [7] Sanja Fidler, Marko Boben, Ales Leonardis. Evaluating multi-class learning strategies in a generative hierarchical framework for object detection. Advances in Neural Information Processing System 22, 2009, s. 531-539.
- [8] Sanja Fidler, Ales Leonardis. Towards Scalable Representations of Object Categories: Learning a Hierarchy of Parts. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Minneapolis, MN-USA, June 17-22, 2007, s. 1-8.
- [9] Mario Fritz, Bernt Schiele. Decomposition, discovery and detection of visual categories using topic models. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Anchorage, AK, June 23-28, 2008, s. 1-8.
- [10] Alexander T. Ihler, John W. Fisher III, Alan S. Willsky. Loopy Belief Propagation: Convergence and Effect of Message Errors. J. Mach. Learn. Res., December, 2005, Vol. 6, s. 905-93 .
- [11] Daphne Koller. Probabilistic Graphical Models, https://www.coursera.org/course/pgm, 2013. [Online; dostęp z dnia 24.11.2015].
- [12] David G. Lowe. Object recognition from local scale-invariant features. In: IEEE International Conference on Computer Vision. Proceedings, Kerkyra, Sep 20-27, 1999, s. 1150-1157.
- [13] R. F. Salas-Moreno et al. SLAM ++: Simultaneous Localisation and Mapping at the Level of Objects. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Portland, OR, June 23-28, 2013, s. 1352-1359.
- [14] Jamie Shotton et al. TextonBoost: Joint Appearance, Shape and Context Modeling for Mulit-Class Object Recognition and Segmentation. In: European Conference on Computer Vision. Proceedings, January, 2006.
- [15] Charles Sutton, Andrew McCallum. An Introduction to Conditional Random Fields. Foundations and Trends in Machine Learning, 2011, Vol. 4, No. 4, s. 267-373.
- [16] M. J. Wainwright, T. S. Jaakkola, A. S. Willsky. Tree-based Reparameterization Framework for Analysis of Sum-product and Related Algorithms. IEEE Transactions on Information Theory, September, 2006, Vol. 49, No. 5, s. 1120-1146.
- [17] Martin J. Wainwright, Michael I. Jordan. Graphical Models, Exponential Families, and Variational Inference. Foundations and Trends® in Machine Learning, 2008, Vol. 1, No. 1-2, s. 1-305.
- [18] Yuting Zhang et al. Improving Object Detection with Deep Convolutional Networks via Bayesian Optimization and Structured Prediction. In: IEEE Conference on Computer Vision and Pattern Recognition. Proceedings, Boston, MA, June 7-12, 2015, s. 249-258.
- [19] ETH Zurich. ETHZ Shape classes, http://www.vision.ee.ethz.ch/datasets/ index.en.html, 2006. [Online; dostęp z dnia 27.06.2015].
Uwagi
PL
Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-bcb4aa6b-eb6e-491c-b5ea-2b2b615db350