Tytuł artykułu
Identyfikatory
Warianty tytułu
Salience of RGB-D features in object recognition
Języki publikacji
Abstrakty
Niniejszy artykuł dotyczy kluczowego zagadnienia w dziedzinie rozpoznawania obiektów - znaczenia cech. Powołując się na naturalne mechanizmy powstawania perceptów w korze wzrokowej zwierząt, autorzy kwestionują zasadność stosowania tych samych cech do klasyfikacji wszystkich obiektów, co obecnie ma miejsce w większości systemów wizyjnych. W artykule przedstawiono wyniki badań dokonanych na chmurach punktów o wysokiej dokładności, ktore zmierzają do głębszego zrozumienia użyteczności różnych cech RGB-D w rozpoznawaniu różnych klas obiektów. Wyciągnięte wnioski mogą sprzyjać powstaniu algorytmów wizyjnych bardziej elastycznych od obecnie istniejących. W pracy omówiono także narzędzia użyteczne przy dobieraniu cech w zadaniach klasyfikacji konkretnych obiektów.
This article concerns a crucial topic in object recognition - the importance of feature. Inspired by the natural perception mechanisms of the animal visual cortex, the author quesion the prevalent tendency in computer vision of using the same feature for classification of all objects. The presented experimental results and conclusions aim to achieve a better understanding of the usefulness of various RGB-D feature for classification of different object classes. Furthermore, for classification of specific objects and show the need to invent more elastic computer vision algoritms.
Rocznik
Tom
Strony
235--244
Opis fizyczny
Bibliogr. 16 poz., rys., tab., wykr.
Twórcy
autor
- Instytut Automatyki i Robotyki, Politechnika Warszawska, ul. św. Andrzeja Boboli 8, 02-525 Warszawa
autor
- Instytut Automatyki i Robotyki, Politechnika Warszawska, ul. św. Andrzeja Boboli 8, 02-525 Warszawa
Bibliografia
- [1] L. Bo, X. Ren, D. Fox. Kernel descriptors for visual recognition. In: NIPS. Proceedings Red. John D. Lafferty et al. Curran Associates, Inc., 20l0, s. 244-252.
- [2] A. G. Buch et al. Pose estimation using local structure-specific shape and appearance context. In: IEEE Int. Conf. on Robotics and Automation (ICRA). Proceedings, Karlsruhe, Germany, 2013.
- [3] C. Cortes, V. Vapnik. Support-vector networks. Mach. Learn., Wrzesień, 1995, wolumen 20, numer 3, s. 273-297.
- [4] G. Cybenko. Approximation by superpositions of a sigmoidal function. Mathematics of Control, Signals, and Systems, 1989, wolumen 2, s. 303-314.
- [5] S. Fidler, A. Leonardis. Towards scalable representations of object categories: Learning a hierarchy of parts. In: CVPR. Proceedings. IEEE Computer Society, 2007.
- [6] M. A. Goodale, A. D. Milner. Separate visual pathways for perception and action. Trends in Neurosciences, 1992, wolumen 15, numer 1, s. 20-25.
- [7] B. Harasymowicz-Boggio, B. Siemiatkowska. Object classification with metric and semantic inference. In: Mobile Robots (ECMR), 2013 European Conference on. Proceedings, Wrzesień, 2013, s. 186-191.
- [8] D. H. Hubel. Eye, Brain, and Vision (Scientific American Library, No 22). Wydanie drugie, W. H. Freeman Maj, 1995.
- [9] G. K. Humphrey et al. A neurological dissociation between shape from shading and shape from edges. Behav Brain Res, 1996, wolumen 76, numer 1-2, s. 117-25.
- [10] S. Izadi et al. Kinectfusion: real-time 3D reconstruction and interaction using a moving depth camera. In: Proceedings of the 24th annual ACM symposium on User interface software and technology. Proceedings, New York, NY, USA, ACM, 2011, UIST'11, s. 559-568.
- [11] J. Mutch, D. G. Lowe. Object class recognition and localization using sparse features with limited receptive fields. Int. J. Comput. Vision, Październik, 2008, wolumen 80, numer 1, s. 45-57.
- [12] E. T. Rolls, W. Caan. Visual neurons responsive to faces in the monkey temporal cortex. Experimental Brain Research, 1982, wolumen 47, s. 329-342.
- [13] R. B. Rusu, N. Blodow, M. Beetz. Fast point feature histograms (fpfh) for 3D registration. In: ICRA. Proceedings. IEEE, 2009, s. 3212-3217.
- [14] R. Schnabel, R. Wahl, R. Klein. Efficient ransac for point-cloud shape detection. Computer Graphics Forum, Czerwiec, 2007, wolumen 26, numer 2, s. 214-226.
- [15] A. M. Treisman, N. G. Kanwisher. Perceiving visually presented objects: recognition, awareness, and modularity. Curr Opin Neurobiol, 1998, wolumen 8, numer 2.
- [16] Z. Zhang. Iterative point matching for registration of free-form curves and surfaces. Int. J. Comput. Vision, Październik, 1994, wolumen 13, numer 2, s. 119-152.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-c25a626d-6239-487e-9c81-b0f52d69d0a6