Wyniki wyszukiwania - BazTech

1

Recognition of handwritten Latin characters with diacritics using CNN

Lukasik Edyta, Charytanowicz Małgorzata, Milosz Marek, Tokovarov Michail, Kaczorowska Monika, Czerwinski Dariusz, Zientarski Tomasz

Bulletin of the Polish Academy of Sciences. Technical Sciences

|

2021

|

Vol. 69, nr 1

art. no. e136210

EN

Convolutional Neural Networks (CNN) have achieved huge popularity in solving problems in image analysis and in text recognition. In this work, we assess the effectiveness of CNN-based architectures where a network is trained in recognizing handwritten characters based on Latin script. European languages such as Dutch, French, German, etc., use different variants of the Latin script, so in the conducted research, the Latin alphabet was extended by certain characters with diacritics used in Polish language. To evaluate the recognition results under the same conditions, a handwritten Latin dataset was also developed. The proposed CNN architecture produced an accuracy of 96% for the extended character set. This is comparable to state-of-the-art results found in the domain of identifying handwritten characters. The presented approach extends the usage of CNN-based recognition to different variants of the Latin characters and shows it can be successfully used for a set of languages based on that script. It seems to be an effective technique for a set of languages written using the Latin script.

2

Efektywność sztucznych sieci neuronowych w rozpoznawaniu znaków pisma odręcznego

Miłosz Marek, Gazda Janusz

Journal of Computer Sciences Institute

|

2018

|

Vol. 7

210--214

PL

Sztuczne sieci neuronowe są jednym z narzędzi współczesnych systemów odtwarzania z obrazów tekstów, w tym pisanych odręcznie. W artykule przedstawiono rezultaty eksperymentu obliczeniowego mającego na celu analizę jakości rozpoznawania cyfr pisanych odręcznie przez dwie sztuczne sieci neuronowe (SSN) o różnej architekturze i parametrach. Jako podstawowe kryterium jakości rozpoznawania znaków użyto wskaźnika poprawności. Poza tym analizie poddano liczbę neuronów i ich warstw oraz czas uczenia SSN. Do stworzenia SSN, oprogramowania algorytmów ich uczenia i testowania wykorzystano język Python i bibliotekę TensorFlow. Obydwie SSN uczono i testowano przy pomocy tych samych dużych zbiorów obrazów znaków pisanych odręcznie.

EN

Artificial neural networks are one of the tools of modern text recognising systems from images, including handwritten ones. The article presents the results of a computational experiment aimed at analyzing the quality of recognition of handwritten digits by two artificial neural networks (ANNs) with different architecture and parameters. The correctness indicator was used as the basic criterion for the quality of character recognition. In addition, the number of neurons and their layers and the ANNs learning time were analyzed. The Python language and the TensorFlow library were used to create the ANNs, and software for their learning and testing. Both ANNs were learned and tested using the same big sets of images of handwritten characters.

3

Preprocessing Photos of Receipts for Recognition

Korobacz W., Tabędzki M.

Advances in Computer Science Research

|

2018

|

Nr 14

87--103

EN

The subject of this work is methods of image pre-processing, applied to receipts photos. The purpose is to improve their quality, allowing to increase the efficiency of the conventional text recognition software (OCR). The authors had mainly difficult cases in mind – photos taken freehand in unfavorable lighting conditions. The work describes the analyzed methods of filtering, binarization, searching for the edge of the image, image straightening, marking the area of interest, thinning. The preliminary results with OCR software on a small data set were also presented. Thanks to pre-processing, character recognition efficiency has been improved by 25%. The final part presents conclusions and plans for future work.

PL

Tematem tej pracy są metody przetwarzania wstępnego obrazów, zastosowane do zdjęć przedstawiających paragony. Celem jest poprawa ich jakości, pozwalająca zwiększyć skuteczność działania oprogramowania do rozpoznawania tekstu. Autorzy mieli na uwadze głównie trudne przypadki – zdjęć robionych „z ręki”, przy słabym oświetleniu. Praca opisuje przeanalizowane metody filtrowania, binaryzacji, wyszukiwania krawędzi, prostowania obrazu, oznaczania obszaru zainteresowania, ścieniania. Przedstawiono również wstępne wyniki testów z oprogramowaniem OCR na niewielkiej bazie obrazów. Przetwarzanie wstępne pozwoliło na poprawę identyfikacji znaków o 25%. W końcowej części przedstawiono wnioski oraz plany przyszłej pracy.

4

Time effectiveness optimization of cross correlation methods for ocr systems with the use of graphics processing units

Wieloch K., Stokfiszewski K.

Journal of Applied Computer Science

|

2015

|

Vol. 23, nr 2

79--100

EN

In this paper authors propose a time optimization of fast normalized cross corrlation methods for image processing and optical character recognition with the use of parallel computing techniques realized on graphics processing units (GPU). It is shown that suitable modification of the wellknown formulas and their parallel implementation on graphics processing units may substantially accelerate computing time without any change of the quality of results. The performed research include comparative analysis of time efficiency of the developed methods with respect to their standard sequential implementations.

5

Optical character recognition using artifical inelligence technologies

Musiał A., Szczepaniak P.

Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska

|

2014

|

nr 2

41--44

EN

The article represents results of the research of an Optical Character Recognition system. Proposed OCR system is able to convert a raster image into the text string, which represents the text shown on the input image. The main innovation is the fact that the system was created without following any strict rules. It was more an innovative research rather than simple programming using ready guidelines.

PL

Celem projektu opisywanego w artykule było przygotowanie działającego systemu do optycznego rozpoznawania znaków, tj. zdolnego przekształcić rastrowy obraz wejściowy w łańcuch znaków odpowiadający zapisanemu tekstowi na obrazie. Nowością jest m.in. fakt wykonania tego systemu bez podążania za z góry znaną architekturą aplikacji, a przygotowanie go w sposób bardziej doświadczalny, czyli wykorzystując podejście nowatorskie.

6

Radon-Zernike moments method applied in postal application

Miciak M., Wiatr R., Andrysiak T., Maszewski M.

Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy

|

2013

|

z. 17

17--26

EN

In this paper a new method of a handwritten characters recognition is introduced. The proposed algorithm is applied to classification of post mails on the basis of postal code information. In connection with this work the research was conducted with numeric characters used in real post code of mail pieces. Moreover, the article contains image processing, for instance, filtration of Radon transformation of the character. The main objective of this article is to use the Radon transform parameter space to obtain a set of moment features on basis of which postal code will be recognized.

PL

W artykule przedstawiono nowe rozwiązanie zadania rozpoznawania znaków pisanych ręcznie dla zastosowań pocztowych. Zaproponowano algorytm klasyfikacji przesyłek pocztowych działający na podstawie informacji zawartej w zapisie kodu pocztowego. Główny nacisk położono na wykorzystanie transformaty Radona i momentów Zernike do uzyskania zbioru cech, na podstawie, których rozpoznawano kod pocztowy. Otrzymane wyniki eksperymentów pozwoliły wykazać skuteczno ść proponowanej metody.

7

Metody przetwarzania obrazu przesyłek pocztowych

Miciak M., Wiatr R.

TTS Technika Transportu Szynowego

|

2013

|

R. 20, nr 10

1279--1288, CD

PL

W referacie przedstawiono metody przetwarzania obrazów i rozpoznawania znaków w szczególności dla celów pocztowych. W procesie opracowania przesyłek pocztowych w urzędach rozdzielczych szczególną rolę ogrywa odczytanie strony adresowej przesyłki w zwłaszcza opisanej pismem odręcznym. Ze względu na czas trwania procesu przetwarzani obrazu przesyłki, ograniczono się do odczytania pocztowego numeru adresowego (PNA). Dokonano analizy stosowanych rozwiązań w zakresie metod obszarowych i konturowych. Zwrócono szczególną uwagę na metody wykorzystujące sztuczne sieci neuronowe, ukryte modele Markowa, momenty geometryczne, przekształcenie Fouriera. Określono przydatność poszczególnych metod dla specyficznych wymagań przetwarzania obrazu w systemach pocztowych.

EN

The paper presents a method of image processing and character recognition, in particular for postal applications. In the process of the development of postal offices distribution plays a special role to read the address data in particular described handwriting. Because of the time limitation of the image processing package, the article focused on zip code reading. Particular attention has been paid to the methods based on artificial neural networks, hidden Markov models, the moments of geometric Fourier transform. Determined suitability of particular methods for the specific requirements of image processing postal systems.

8

Efficient Kernel Discriminative Geometry Preserving Projection for Document Classification

Wang Z., Sun X., Qian X.

Przegląd Elektrotechniczny

|

2012

|

R. 88, nr 5b

56-59

EN

A new dimensionality reduction algorithm called kernel discriminative geometry preserving projection (KDGPP) is proposed to cope with document classification. By considering both intraclass geometry and interclass discrimination, KDGPP can not only nonlinearly project documents into lower-dimensional feature space via manifold adaptive kernel function but also reduce the computational complexity with Nyström method. Experimental results demonstrate that KDGPP outperforms other related algorithms in terms of effectiveness and efficiency.

PL

Zaproponowano nowy algorytm do klasyfikacji dokumentów nazwany KDGPP – kernel discriminative geometry preserving projection. Algorytm redukuje złożoność obliczeń numerycznych.

9

Invariant Gabor-Zernike descriptor for postal applications

Andrysiak T., Miciak M., Boniecki R.

Zeszyty Naukowe. Telekomunikacja i Elektronika / Uniwersytet Technologiczno-Przyrodniczy w Bydgoszczy

|

2011

|

z. 15

5-17

EN

In this paper a new solution of handwritten digits recognition system for postal applications is presented. Moreover, in this paper, a new method of handwritten characters recognition is introduced. The proposed algorithm is applied to classification of post mails on the basis of zip code information. In connection with this work the research was conducted with numeric characters used in real post code of mail pieces. Moreover, the article contains basic image processing for instance filtration binarization and normalization of the character. The main objective of this article is to use the Gabor filtration and Zernike moments to obtain a set of invariant features, on basis of which postal code will be recognized. The reported experiments' results prove the effectiveness of the proposed method. Furthermore, sources of errors as well as possible improvement of classification results will be discussed.

PL

W artykule przedstawiono nowe rozwiązanie zadania rozpoznawania znaków pisanych ręcznie dla zastosowań pocztowych. Zaproponowano algorytm klasyfikacji przesyłek pocztowych działający na podstawie informacji zawartej w zapisie kodu pocztowego. Ponadto w artykule opisano podstawowe operacje przetwarzania wstępnego tj. filtracje, binaryzacje oraz normalizacje obrazu znaku. Głównym nacisk położono na wykorzystanie filtracji Gabora i momentów Zernike do uzyskania zbioru cech na podstawie których rozpoznawano kod pocztowy. Otrzymane wyniki eksperymentów pozwoliły wykazać skuteczność proponowanej metody. Dodatkowo w pracy przedstawiono źródła potencjalnych błędów w procesie rozpoznawania, jak również zaproponowano możliwości poprawy wyników klasyfikacji.

10

Ghost Character Recognition Theory and Arabic Script Based Languages Character Recognition

Razzak M., Mirza A. A.

Przegląd Elektrotechniczny

|

2011

|

R. 87, nr 11

234-238

EN

Arabic script is used by more than 1/4th population of the world in the form of different languages like Arabic, Persian, Urdu, Sindhi, Pashto etc but each language have its own words meaning and set of alphabets. The set of Urdu alphabets is a superset of the alphabets sets for all other Arabic script based languages. Arabic script based languages character recognition is one of the most difficult task due to complexities involved in this script not exist in any other script. This paper present a novel technique Ghost Character Recognition Theory that will helps to develop a Multilanguage character recognition system for Arabic script based languages based on Ghost Character Theory. The main benefit of proposed approach is that it will works for all Arabic script based languages by doing little effort for ghost character (basic skeleton) and developing dictionary for every language. Handling all Arabic script based languages has several issues like recognition rate is low as compared to system for specific languages and specific writing style i.e. Nastaliq or Naskh, but in general, this small difference of recognition rate is not a big issue for multilingual system and at the end we will get multilingual character recognition system.

PL

Języki arabskie są bardzo trudne do zaadaptowania w systemie automatycznego rozpoznawania znaków. W artykule opisano algorytm Ghost character umożliwiający realizację OCR większości języków arabskich.

11

Application of Gustafson-Kessel clustering algorithm in the pattern recognition for GIS

Wang H., Huang C., Yao L., Qian Y., Jiang X.

Przegląd Elektrotechniczny

|

2011

|

R. 87, nr 1

215-219

EN

This paper simulates four typical defects in GIS for PD detection, and uses the pulse, amplitude, phase and number of PD to form the three-dimensional PQN matrix. Based on the PQN, three two-dimensional distributions of Hqmax~Phi, Hqmean~Phi and Hn~Phi can be achieved. Then the new G-K clustering method is introduced to separate the four different defects according to the parameters of Sk, Ku, Pe, Q and CC. At last the comparison with different clustering methods is achieved based on the evaluation criterions which are PC, CE, PI and SI.

PL

W artykule zasymulowano cztery typowe defekty w łącznikach gazowych wynikające z wyładowań niezupełnych oraz wykorzystano amplitudę, fazę i liczbę impulsów do sformowania trzywymiarowej macierzy PQN. Następnie wykorzystano nową metodę klastrową do rozdzielenia różnych defektów na podstawie parametrów Sk, Ku, Pe,Q i CC. Następnie przeprowadzono porównanie różnych metod.

12

Zastosowanie sztucznych sieci neuronowych w rozpoznawaniu znaków

Momot A.

Studia Informatica

|

2004

|

Vol. 25, nr 1

69-90

PL

W artykule przedstawiono krótkie wprowadzenie w dziedzinę rozpoznawania znaków i omówiono najbardziej podstawowe pojęcia związane ze sztucznymi sieciami neuronowymi. Artykuł zawiera przykłady zastosowań sieci neuronowych w procesie rozpoznawania znaków, ze szczególnym uwzględnieniem etapów ekstrakcji cech i klasyfikacji.

EN

The article presents the short introduction to the domain of character recognition and describes the basie conceptions connected with artificial neural networks. The paper contains exaniples of applications of neural networks to a process of character recognition with special regard to stages of feature extraction and classification.

13

A new approach to OCR

Czajewski W.

Kwartalnik Elektroniki i Telekomunikacji

|

1998

|

Vol. 44, nr 2

143-153

EN

The paper presents an attempt to apply the Rough Sets Theory to Optical Character Recognition with purpose of accelerating the recognition process and decreasing the database of the characters which is usually very big. Simultaneously, it leads to lower performance and price requirements for automatic identification systems. In this approach specific characters features are referred to as an information systems. The Rough Sets Theory allows extracting the most important information from the system, neglecting the other - irrelevant. This process is fully automatic and does not require any human decision in the area of usefulness of certain characters' features. A discernibility matrix, which is built in this way, constitutes a reduced database for classification algorithms. A brief description of Classical Optical Character Recognition Theory and Rough Sets Theory as well as some selected research and experimental results are also presented. As it turns out to be, even 95% of information on the recognized characters may be neglected if certain criteria are met.

PL

W artykule zaprezentowano próbę zastosowania teorii zbiorów przybliżonych do rozpoznawania znaków. Ma to na celu przyspieszenie procesu rozpoznawania oraz zmniejszenie (zwykle bardzo dużej) bazy danych o poszeczegolnych znakach. Tym samym prowadzi to do obniżenia wymagań wydajnościowych, a zarazem ceny, stawianych systemom automatycznej identyfikacji znaków. W tym podejściu charakterystyczne cechy znaków (wyznaczone tradycyjnymi metodami) traktowane są jako system informacyjny. Teoria zbiorów przybliżonych pozwala na wyodrębnienie z niego najwazniejszych informacji (z punktu widzenia rozpoznawania), a odrzucenie pozostałych - nieistotnych. Proces ten jest w pełni automatyczny i nie wymaga od człowieka podejmowania żadnych decyzji, co do przydatności określonych cech znaków. Utworzona w ten sposób macierz rozróżnialności stanowi zredukowaną bazę danych dla algorytmów klasyfikujących. W artykule zamieszczono także krótki opis teorii rozpoznawania znakow i teorii zbiorów przybliżonych oraz wybrane wyniki przeprowadzonych badań i eksperymentów. Jak się okazuje, przy spełnieniu pewnych warunków, nawet 95% informacji o rozpoznawanych znakach może być pominięte bez uszczerbku dla jakosci klasyfikacji.

14

Rozpoznawanie znaków za pomocą drzew decyzyjnych

Szkodzik A., Materka A.

Elektronika : prace naukowe

|

1998

|

nr 3

99-110

PL

W pracy przedstawiono wyniki zastosowania drzew decyzyjnych do rozpoznawaniu znaków. Na etapie tworzenia drzew zastosowano metodę wyznaczania optymalnych cech, dzięki której uzyskano bardzo dobre wyniki klasyfikacji zbiorów testowych. Zaproponowany algorytm uczenia drzew nie powoduje powiększenia ich rozmiarów. Udowodniono, że proces uczenia daje lepsze wyniki niż powiększanie zbiorów wykorzystanych przy konstruowaniu drzew. Za pomocą klasyfikatora równoległego zbudowanego w oparciu o kilkadziesiąt drzew decyzyjnych uzyskano rezultat ponad 95% prawidłowych klasyfikacji zbioru testowego.

EN

Results of applying decision trees to printed and handwritten character recognition are presented in the paper. An automatic feature generation method was employed during the construction of the trees, which improved the recognition rate for the testing set. This learning process significantly reduces the drawback of the tree classifiers that is their rapid error accumulation with depth, while it does not influences the size of trees. It was shown that learning gives better results than increasing the sets used to construction of the trees. The recognition rate above 95% was obtained by means of a parallel classifier built of multiple decision trees despite no advanced preprocessing of input characters (like skeletonization or slant reduction) was performed.