PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Utilizing artificial intelligence for text segmentation from images

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Wykorzystanie sztucznej inteligencji do segmentacji tekstu z obrazów
Języki publikacji
EN
Abstrakty
EN
he paper presents a deep learning-based approach for text segmentation from images, utilizing a combination of a Fully Convolutional Network (FCN) and a Recurrent Neural Network (RNN). The algorithm achieves high accuracy in identifying and separating text regions from nontext regions, performing well with diverse text styles, fonts, backgrounds, and various languages. It outperforms state-of-the-art methods and proves to be a robust and versatile solution applicable to OCR and document analysis tasks.
PL
Artykuł przedstawia podejście oparte na głębokim uczeniu się do segmentacji tekstu na obrazach, wykorzystując połączenie Sieci W pełni splotowej (FCN) i Sieci Neuronowej Rekurencyjnej (RNN). Algorytm osiąga wysoką dokładność w identyfikacji i separacji obszarów tekstu od obszarów bez tekstu, sprawdzając się dobrze z różnymi stylami tekstu, czcionkami, tłami i różnymi językami. Przewyższa metody najnowszej generacji i okazuje się być solidnym i wszechstronnym rozwiązaniem zastosowalnym w zadaniach OCR i analizie dokumentów.
Rocznik
Strony
255--258
Opis fizyczny
Bibliogr. 9 poz., rys.
Twórcy
  • School of Informatics and Computing, Singidunum University, Danijelova 32, 11000, Belgrade, Serbia
  • School of Informatics and Computing, Singidunum University, Danijelova 32, 11000, Belgrade, Serbia
  • Faculty of Technical Sciences, University of Pristina in Kosovska Mitrovica, Knjaza Miloša 7, 38220 Kosovska Mitrovica, Serbia
  • Faculty of Economics and Engineering Management, Department of software engineering, Cvećarska 2, 21102 Novi Sad, Serbia
  • Faculty of Technical Sciences, University of Pristina in Kosovska Mitrovica, Knjaza Miloša 7, 38220 Kosovska Mitrovica, Serbia
  • Faculty of Economics, University of Pristina in Kosovska Mitrovica, Kolašinska 156, 38220 Kosovska Mitrovica, Serbia
Bibliografia
  • [1] Liu Y., Wang Y., Shi H., A Convolutional Recurrent Neural-Network-Based Machine Learning for Scene Text Recognition Application, Symmetry, 15 (2023), No. 4, 849:1-17
  • [1] Droby A., Kurar Barakat B., Alaasam R., Madi B., Rabaev I., El-Sana J., Text Line Extraction in Historical Documents Using Mask R-CNN, Signals, 3 (2022), No. 3, 535-549
  • [2] Otsu N., A threshold selection method from gray-level histograms, IEEE Transactions on Systems, Man, and Cybernetics, 9 (1979), No. 1, 62-66
  • [3] Ivković R., New model of partial filtering in implementation of algorithms for edge detection and digital image segmentation, University of Pristina (Kosovska Mitrovica), Faculty of Technical Sciences, Serbia, 2019, 39-61
  • [4] Lombardi F., Marinai S., Deep Learning for Historical Document Analysis and Recognition-A Survey, Journal of Imaging. 6 (2020), No.10,110:1-30
  • [5] Zuo H., Fan H., Blasch E, Ling H., Combining Convolutional and Recurrent Neural Networks for Human Skin Detection, IEEE Signal Processing Letters, 34 (2017), No. 3, 289-293
  • [6] Vinotheni C., Lakshmana Pandian S., End-To-End Deep-Learning-Based Tamil Handwritten Document Recognition and Classification Model, IEEE Access, 11 (2023), No. 1, 43195 – 43204
  • [7] Jia W., Ma C., Sun L., Huo Q., Detecting Text Baselines in Historical Documents with Baseline Primitives, IEEE Access, 9 (2021), No. 1, 93672 – 93683
  • [8] Droby A., Kurar Barakat B., Saabni R., Alaasam R., Madi B., El-Sana J., Understanding Unsupervised Deep Learning for Text Line Segmentation, Applied Sciences, 12 (2022), No. 19, 9528:1-24
Uwagi
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki i promocja sportu (2025).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-afc10dcf-1019-469b-ae7e-feb80b5443a2
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.