Preprocessing Photos of Receipts for Recognition

Korobacz, W.; Tabędzki, M.

doi:10.24427/acsr-2018-vol14-0006

Artykuł - szczegóły

Tytuł artykułu

Preprocessing Photos of Receipts for Recognition

Autorzy

Korobacz W. , Tabędzki M.

Treść / Zawartość

Pełne teksty:

preprocessing_korobacz_advances_14_2018.pdf

Pobierz

Identyfikatory

DOI

10.24427/acsr-2018-vol14-0006

Warianty tytułu

Przetwarzanie wstępne zdjęć paragonów do celów rozpoznawania

Języki publikacji

Abstrakty

The subject of this work is methods of image pre-processing, applied to receipts photos. The purpose is to improve their quality, allowing to increase the efficiency of the conventional text recognition software (OCR). The authors had mainly difficult cases in mind – photos taken freehand in unfavorable lighting conditions. The work describes the analyzed methods of filtering, binarization, searching for the edge of the image, image straightening, marking the area of interest, thinning. The preliminary results with OCR software on a small data set were also presented. Thanks to pre-processing, character recognition efficiency has been improved by 25%. The final part presents conclusions and plans for future work.

Tematem tej pracy są metody przetwarzania wstępnego obrazów, zastosowane do zdjęć przedstawiających paragony. Celem jest poprawa ich jakości, pozwalająca zwiększyć skuteczność działania oprogramowania do rozpoznawania tekstu. Autorzy mieli na uwadze głównie trudne przypadki – zdjęć robionych „z ręki”, przy słabym oświetleniu. Praca opisuje przeanalizowane metody filtrowania, binaryzacji, wyszukiwania krawędzi, prostowania obrazu, oznaczania obszaru zainteresowania, ścieniania. Przedstawiono również wstępne wyniki testów z oprogramowaniem OCR na niewielkiej bazie obrazów. Przetwarzanie wstępne pozwoliło na poprawę identyfikacji znaków o 25%. W końcowej części przedstawiono wnioski oraz plany przyszłej pracy.

Słowa kluczowe

digital image processing optical character recognition OCR

cyfrowe przetwarzanie obrazów rozpoznawanie znaków OCR

Wydawca

Oficyna Wydawnicza Politechniki Białostockiej

Czasopismo

Advances in Computer Science Research

Rocznik

2018

Tom

Nr 14

Strony

87--103

Opis fizyczny

Bibliogr. 18 poz., rys., tab.

Twórcy

autor

Korobacz W.

Faculty of Computer Science, Bialystok University of Technology, Białystok, Poland

autor

Tabędzki M.

Faculty of Computer Science, Bialystok University of Technology, Białystok, Poland

Bibliografia

[1] Wojciech Bieniecki, Szymon Grabowski, and Wojciech Rozenberg. Image preprocessing for improving ocr accuracy. In 2007 International Conference on Perspective Technologies and Methods in MEMS Design, pages 75–80, May 2007.
[2] Matteo Brisinello, Ratko Grbic, Matija Pul, and Tihomir Andelic. Improving optical character recognition performance for low quality images. In 2017 International Symposium ELMAR, pages 167–171, Sep. 2017.
[3] John Canny. A computational approach to edge detection. IEEE Trans. Pattern Anal. Mach. Intell., 8(6):679–698, June 1986.
[4] Rafael C. Gonzalez and Richard E. Woods. Digital Image Processing (3rd Edition). Prentice-Hall, Inc., 2006.
[5] Wojciech Korobacz. Przetwarzanie wstępne zdjęć paragonów do celów rozpoznawania: praca magisterska. Master's thesis, Wydział Informatyki PB, 2017. (In Polish).
[6] Witold Malina and Maciej Smiatacz. Cyfrowe przetwarzanie obrazów. Akademicka Oficyna Wydawnicza EXIT, 2008. (In Polish).
[7] Nobuyuki Otsu. A Threshold Selection Method from Gray-level Histograms. IEEE Transactions on Systems, Man and Cybernetics, 9(1):62–66, 1979.
[8] William K. Pratt. Digital Image Processing. Addison-Wesley Publishing Company, 1991.
[9] John C. Russ and F. Brent Neal. The Image Processing Handbook. CRC Press, Inc., 2016.
[10] Khalid Saeed, Marek Tabedzki, Mariusz Rybnik, and Marcin Adamski. K3M: A universal algorithm for image skeletonization and a review of thinning techniques. Applied Mathematics and Computer Science, 20(2):317–335, 2010.
[11] Jaakko Sauvola and Matti Pietikäinen. Adaptive document image binarization. Pattern Recognition, 33(2):225–236, 2000.
[12] Linda G. Shapiro and George C Stockman. Computer Vision. Prentice Hall, 2001.
[13] Pooja Sharma and Shanu Sharma. Image processing based degraded camera captured document enhancement for improved ocr accuracy. In 2016 6th International Conference – Cloud System and Big Data Engineering (Confluence), pages 441–444, Jan 2016.
[14] Mande Shen and Hansheng Lei. Improving ocr performance with background image elimination. In 2015 12th International Conference on Fuzzy Systems and Knowledge Discovery (FSKD), pages 1566–1570, Aug 2015.
[15] Marek Tabedzki, Mariusz Rybnik, and Khalid Saeed. New results for viewbased feature extraction method for handwritten words recognition without segmentation. In 1st International Conference on Image Processing & Communications, Poland, pages 193–200, 2009.
[16] Marek Tabedzki, Khalid Saeed, and Adam Szczepanski. A modified K3M thinning algorithm. Applied Mathematics and Computer Science, 26(2):439–450, 2016.
[17] Øivind Due Trier and Anil K. Jain. Goal-directed evaluation of binarization methods. IEEE Transactions on Pattern Analysis and Machine Intelligence, 17(12):1191–1201, Dec 1995.
[18] Christopher Wiraatmaja, Kartika Gunadi, and Iwan Njoto Sandjaja. The application of deep convolutional denoising autoencoder for optical character recognition preprocessing. In 2017 International Conference on Soft Computing, Intelligent System and Information Technology (ICSIIT), pages 72–77, Sep. 2017.

Uwagi

Artykuł zrealizowano w ramach pracy badawczej S/WI/2/2018.

Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2019).

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-36fa8eb4-f202-4c2c-b5b3-c8af0cebf3d8