PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Methodology for the evaluation of the algorithms for text segmentation based on errors type

Autorzy
Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
PL
Metodologia oceny algorytmów segmentacji tekstu w oparciu o błędy typu
Języki publikacji
EN
Abstrakty
EN
Text segmentation represents the key element in the optical character recognition process. Hence, testing procedure for text segmentation algorithms has significance importance. All previous works deal mainly with text database as a template. They are used for testing as well as for the evaluation of the text segmentation algorithm. However, because of inconsistencies in this process, some methodology for the experiments is required. In this manuscript, methodology for the evaluation of the algorithm for text segmentation based on errors type is proposed. It is established on the various multiline text samples linked with text segmentation. Final result is obtained by comparative analysis of cross linked data. At the end, its suitability for different type of scripts represents its main advantage.
PL
Segmentacja tekstu stanowi kluczowy element procesu optycznego rozpoznawania znaków. Wszystkie dotychczasowe prace dotyczą głównie bazy danych tekstu jako szablonu. Są one używane do testowania, jak i dla oceny algorytmu segmentacji tekstu. Jednak w taki, algorytmie występują nieścisłości. W pracy przedstawiono , metodologię oceny algorytmu segmentacji tekstu w oparciu o typ błędów. Badania przeprowadzono na różnych próbkach tekstu wielowierszowego. Końcowy wynik uzyskuje się poprzez analizę porównawczą danych.
Rocznik
Strony
259--263
Opis fizyczny
Bibliogr. 17 poz., rys., tab.
Twórcy
autor
  • University of Belgrade, Technical Faculty Bor, ul. Vojske Jugoslavije 12, 19210 Bor, Serbia, dbrodic@tf.bor.ac.rs
Bibliografia
  • [1] Du X., Pan W., Bui T.D., Text line segmentation in handwritten documents using Mumford–Shah model, Pattern Recognition, 42(2009), No.12, 3136-3145.
  • [2] Likforman Sulem L., Zahour A., Taconet B., Text line segmentation of historical documents: a survey, International Journal on Document Analysis and Recognition, 9(2007), No.2, 123-138.
  • [3] Amin A., Wu S., Robust skew detection in mixed text/graphics documents, Proceedings of International Conference on Document Analysis and Recognition - ICDAR’05, Seoul, Korea, 2005, pp.247-251.
  • [4] Bukhari S.S., Shafait F., Breuel T.M., Script-Independent handwritten textlines segmentation using active contours, Proceedings of International Conference on Document Analysis and Recognition - ICDAR’09, Barcelona, Spain, 2009, pp.446- 450.
  • [5] Yi L., Yefeng Z., Doermann D., Jaeger S., Script-Independent text line segmentation in freestyle handwritten documents, IEEE Transactions on Pattern Analysis and Machine Intelligence, 30(2008), No.8, 1313-1329.
  • [6] Basu S., Chaudhuri C., Kundu M., et. al., Text line extraction from multi-skewed handwritten document, Pattern Recognition, 40(2007), No.6, 1825-1839.
  • [7] Razak Z., Zulkiflee K., et al., Off-Line handwriting text line segmentation: a review, International Journal of Computer Science and Network Security, 8(2008), 12-20.
  • [8] Brodić D., Milivojević D.R., Milivojević Z., Basic test framework for the evaluation of text line segmentation and text parameter extraction, Sensors 10(2010), No.5, 5263-5279.
  • [9] Khashman A., Sekeroglu B., Document image binarisation using a supervised neural network, International Journal of Neural Systems 18(2008), No.5, 405-418.
  • [10] Brodić D., Basic experiments set for the evaluation of the text line segmentation, Przeglad Elektrotechniczny (Electrical Review), 86(2010), No.11, 353-357.
  • [11] Brodić D., Milivojević Z., Milivojević D.R., Improvement of the Text Line Segmentation by Rotating Anisotropic Gaussian Kernel, Elektronika ir Elektrotechnika (Electronics and Electrical Engineering) (submitted - under review).
  • [12] Zramdini A., Inglod R., Optical font recognition from projection profiles, Electronic Publishing, 6(1993), No.3, 249-260.
  • [13] Brodić D., Advantages of the extended water flow algorithm for handwritten text line segmentation, Proceedings of the 4th International Conference Pattern Recognition and Machine Intelligence - PReMI ’11, Kuznetsov S.O. et al. (Eds.), LNCS 6744, Moscow, Russia, 2011, pp.418-423.
  • [14] Sanchez A., Suarez P.D., Mello C.A.B., et al., Text line segmentation in images of handwritten historical documents, Proceedings of First International Workshops on Image Processing Theory, Tools and Applications, Sousse, Tunisia, 2008, pp.1–6.
  • [15] Shi Z., Govindaraju V., Line separation for complex document images using fuzzy runlength, Proceedings of the International Workshop on Document Image Analysis for Libraries, Palo Alto, U.S.A., 2004.
  • [16] Brodić D., Optimization of the anisotropic Gaussian kernel for text segmentation and parameter extraction., Proceedings of Theoretical Computer Science - TCS’2010, Calude C.S. & Sassone V. (Eds.), IFIP AICT 323, Brisbane, Australia, 2010, pp.140-152.
  • [17] Brodić D., Milivojević Z., Optimization of the Gaussian kernel extended by binary morphology for text line segmentation, Radioengineering, 19(2010), No.4, 718-724.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOB-0049-0058
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.