Identyfikatory
Warianty tytułu
Preprocessing and segmentation of bad quality machine typed paper documents
Języki publikacji
Abstrakty
Automatyczne rozpoznawanie maszynopisów jest celem międzynarodowego projektu Memoriał. Artykuł ten podejmuje temat wstępnego przetwarzania i segmentacji skanowanych dokumentów archiwalnych w celu wyznaczenia rzeczywistych położeń regionów zawierających tekst. Trafne wyznaczenie tych regionów jest czynnikiem warunkującym skuteczność dalszych etapów rozpoznawania zawartości dokumentu.
The goal of the international project Memorial is automatic retrieval from machine typed paper documents. In this paper the problem of pre-processing and segmentation of scanned archival documents is considered. The goal of these processes is to exactly determine text regions in the document for further OCR processing.
Słowa kluczowe
Rocznik
Tom
Strony
993--1002
Opis fizyczny
Bibliogr. 6 poz., 5 rys.
Bibliografia
- [1] Wiszniewski B.: The Virtual Memorial Project. http://docmaster.eti.pg.gda.pl.
- [2] J. Lebiedź, A. Podgórski, M. Szwoch: Pomiar jakości procesu automatycznego rozpoznawania maszynopisów, Zeszyty Naukowe WETI PG nr 2 (Mat. Konf. TI 2003), Gdańsk 2003.
- [3] J. Lebiedź, A. Podgórski, M. Szwoch: Quality Evaluation of Computer Aided Information Retrieval from Machine Typed Paper Documents, Third Confrence on Recogntion Systems KOSYR'2003 (proceedings) Technical Uniwersity of Wrocław, Wrocław 2003.
- [4] Malina W., Ablameyko S. Pawlak W.: Podstawy cyfrowego przetwarzania obrazów, monografia, Warszawa, Akad. Ofic. Wyd. EXIT 2002.
- [5] Szwoch M: Rozpoznawanie drukowanej notacji muzycznej z wykorzystaniem bezkontekstowych gramatyk atrybutowych, praca doktorska, WETI PG, Gdańsk 2002.
- [6] Sahoo P.K. et al: A Survey of Thresholding Techniques, CYGIP 41, 1988.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPG5-0012-0019