Warianty tytułu
Neuro-fuzyy analysis of document images by the KERNEL system
Języki publikacji
Abstrakty
Analiza dokumentów jest jedną z istotnych dziedzin związanych z rozpoznawaniem obrazów: w ostatnim czasie wiele badań poświęcono metodom automatycznej klasyfikacji obszarów w dokumentach. W tej publikacji przedstawiamy konkretną metodę na wydobywanie numerycznych cech z dokumentu podzielonego na obszary, oraz wykorzystanie ich do automatycznej klasyfikacji przy użyciu systemu KERNEL, przeznaczonego do klasyfikacji danych w oparciu o techniki neurorozmyte. Proces pozyskiwania wiedzy przez system KERNEL, pozwolił w skuteczny sposób odróżniać obszary dokumentu zawierające tekst od obszarów graficznych. Wiedza ta, przedstawiona w postaci reguł logiki rozmytej, pozwala na dokładną klasyfikację i jest jednocześnie czytelna dla człowieka.
Document image analysis represents one of the most relevant topics in the field of image processing: many research efforts have been devoted to devising automatic strategies for document region c1assification. In this paper, we present a peculiar strategy to extract numerical features from segmented image regions, and their employment for c1assification purposes by means of the KERNEL system, a particular neuro-fuzzy framework suitable for application in predictive tasks. The knowledge discovery process performed by KERNEL proved to be effective in solving the problem of distinguishing between textual and graphical components of a document image. The information embedded into sample data is organised in form of a fuzzy role base, which results to be accurate and comprehensible for human users.
Słowa kluczowe
Rocznik
Tom
Strony
607-614
Opis fizyczny
Bibliogr. 11 poz., 5 rys., 1 tab.
Twórcy
autor
- Dipartamento di Informatica, Universtia degli Studi di Bari, Italy
autor
- Wydział Matematyki i Informatyki, Uniwersytet Warmińsko Mazurski
autor
- Dipartamento di Informatica, Universtia degli Studi di Bari, Italy
- Dipartamento di Informatica, Universtia degli Studi di Bari, Italy
Bibliografia
- [1] Pratt W. K.: Digital Image Processing, PIKS Inside, 3rd Edition, 2001.
- [2] Deng S., Lati S., Regentova E.: Document segmentation using polynomial spline wavelets, Pattern Recognition 34, p.2533-2545, 2001.
- [3] Okun O., Pietikainen M., Sauvola J.: Document skew estimation without angle range restriction, Int. J. Document Analysis and Recognition, 1999.
- [4] Chen D., Bourlard H., Thiran J.: Text Identification in Complex Background Using SVM, Proc. of the Int. Conf. on Computer Vision and Pattern Recognition, 2001.
- [5] Xiao Y., Yan H.: Text region extraction in a document image based on the Delaunay tessellation, Pattern Recognition 36, p.799-809, 2003.
- [6] Gonzalez R., Woods R.: Digital Image Processing (2nd Edition), Prentice Hall, 2002, ISBN: 0201180758
- [7] Hinds S. C., Fisher J. L., D'Amato D. P.: A document skew detection method using run-length encoding and Hough transform. Proc. of the 10th Int. Conference on Pattern Recognition (ICPR), (1990) 464--468.
- [8] Srihari S. N., Govindaraju V.: Analysis of textual images using the Hough transform. Machine Vision Applications, 2 (1989) 141--153.
- [9] Castellano G. , Castiello C., Fanelli A. M.: KERNEL: A Matlab toolbox for Knowledge Extraction and Refinement by Neural Learning. Lecture Notes in Computer Science, 2329(1), Springer Verlag Berlin Heidelberg, (2002) 970--979.
- [10] Castellano G. , Castiello C., Fanelli A. M.: KERNEL: A system for Knowledge Extraction and Refinement by Neural Learning. Proc. of KES 2002, IOS Press (2002) 443--447.
- [11] Sauvola J. and Kauniskangas H. (1999) MediaTeam Document Database II, a CD-ROM collection of document images, University of Oulu, Finland (http://www.mediateam.oulu.fi/ downloads/MTDB/)
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG5-0011-0081