Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Analysis of certain shape descriptors ability to evaluation of similarity to a letter
Języki publikacji
Abstrakty
Ekstrakcja i rozpoznanie tekstu z obrazów zarejestrowanych w naturalnym otoczeniu człowieka oraz zamiana tekstu na postać mówioną stanowić może nieocenioną pomoc dla osób niewidomych. Jednak proste zestawienie ze sobą kamery, systemu OCR (Optical Character Recognition) oraz syntezatora mowy w większości przypadków zawodzi. Problem stanowi niedostosowanie obecnie stosowanych systemów OCR do rozpoznawania obrazów znaków i napisów zarejestrowanych za pomocą kamery wideo lub aparatu fotograficznego w przypadkowych warunkach. Aby proces rozpoznawania tekstu uczynić skutecznym należy zlokalizować w obrazie tekst, wyodrębnić go, oraz usunąć zniekształcenia geometryczne powstałe w momencie rejestracji. Warunkiem przeprowadzenia takiej wstępnej obróbki jest zlokalizowanie elementów obrazu podobnych do liter i cyfr na podstawie zestawu wybranych cech.
Localizing text with segmentation requires a several steps. One of them is usually a shape recognition. This stage is required to prefilter, usually very large, sets of segments. This article describes results achieved with different shape descriptors.
Rocznik
Tom
Strony
539--546
Opis fizyczny
Bibliogr. 6 poz., rys.
Twórcy
autor
- Katedra Systemów Automatyki, Politechuika Gdańska
Bibliografia
- [1] N. Ezaki, M. Bulacu and L. Schomaker: Text detection from natural scene images: towards a system for visually impaired persons, Proc. 17th IEEE International Conference on Pattern Recognition, ICPR'04, 2004, pp. 683-686.
- [2] S. Ferreira, C. Thilou and B. Gosselin: From picture to speech: an innovative application or embedded environment, Proc. of the 14th ProRISC Workshop on Circuits, Systems and Signal Processing, ProRISC'03, 2003.
- [3] M. Pazio, M. Niedźwiecki, R. Kowalik, J. Lebiedź: Text detection for the blind, artykuł zgłoszony na EUSIPCO 2007.
- [4] S. Chun, H. Kim, J Kim, S. Oh: Fast Text Caption Localization on Video Using Visual Rhythm, Proc. 5th International Conference on Recent Advances in Visual Information Systems VISUAL 2002, LNCS 2314, pp. 259-268, 2002.
- [5] M. Mattar, A. R. Hanson, E. G. Learned-Miller: Sign Classification using Local and Meta-Features, Proc. of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'05 ) Vol. 03 p. 26
- [6] Y. Zhu, T. Tan, Y. Wang: Font Recognition Based on Global Texture Analysis, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol.23, No. W, Oct. 2001.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG5-0030-0011