PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Automatyczna kontekstowa korekta tekstów z wykorzystaniem grafu LHG

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
Automatic contextual text correction using the linguistic habits graph LHG
Języki publikacji
PL
Abstrakty
PL
Automatyczna korekta tekstów stanowi ważny problem z punktu widzenia dzisiejszych procesorów i edytorów tekstów. W tym artykule został przedstawiony innowacyjny algorytm służący do automatyzacji kontekstowej korekty tekstów z wykorzystaniem Grafu Przyzwyczajeń Lingwistycznych (LHG), który również opisano w tym artykule. W tym celu zbudowano specjalistycznego pająka internetowego przeszukującego strony internetowe celem skonstruowania Grafu Przyzwyczajeń Lingwistycznych (LHG) na podstawie analizy korpusów tekstów uzyskanych z polskojęzycznych stron internetowych. Otrzymane wyniki korekty tekstu z wykorzystaniem tego algorytmu, bazującego na grafie LHG, zostały porównane z komercyjnymi programami do korekty tekstu takimi jak Microsoft Word 2007, Open Office Writer 3.0 oraz z wyszukiwarką Google. Otrzymane wyniki korekty tekstów okazały się być znacznie lepsze niż w wyżej wymienionych komercyjnych narzędziach.
EN
Automatic text correction is an essential problem of today text processors and editors. This paper introduces a novel algorithm for automation of contextual text correction using a Linguistic Habit Graph (LHG) also introduced in this paper. A specialist internet crawler has been constructed for searching through web sites in order to build a Linguistic Habit Graph after text corpuses gathered in Polish web sites. The achieved correction results on a basis of this algorithm using this LHG were compared with commercial programs which also enable to make text correction: Microsoft Word 2007, Open Office Writer 3.0 and search engine Google. The achieved results of text correction were much better than correction made by these commercial tools.
Wydawca
Czasopismo
Rocznik
Tom
Strony
37--55
Opis fizyczny
Bibliogr. 9 poz., rys., tab.
Twórcy
autor
  • Katedra Automatyki, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Akademia Górniczo-Hutnicza w Krakowie
autor
  • Katedra Automatyki, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Akademia Górniczo-Hutnicza w Krakowie
Bibliografia
  • [1] Mykowiecka A.: Inzynieria lingwistyczna. Komputerowe przetwarzanie tekstów w jezyku naturalnym. Wydawnictwo Polsko-Japonskiej Wyzszej Szkoły Technik Komputerowych, 2007
  • [2] Miró J., Rosselló F.: Czy w Unii Europejskiej mówiono po polsku?. Magazyn Delta, 05, 2004
  • [3] Gawrysiak P.: Modelowanie jezyka. Politechnika Warszawska, 2006 54 Marcin Gadamer, Adrian Horzyk
  • [4] Statistical Inference: n-gram Models over Sparse Data: http://mi007.wikispaces.com/file/view/rozdzial6.pdf, 2009
  • [5] Debowski Ł.: Prawo Zipfa – próby objasnien. Instytut Podstaw Informatyki PAN, 2005
  • [6] Microsoft Office Word 2007 2009: Opis programu Word. http://office.microsoft.com/pl-pl/word/HA101650321045.aspx
  • [7] OpenOffice.org Writer 2009: Opis programu. http://pl.openoffice.org/
  • [8] Marciniak M.: MS Office kontra OpenOffice. PC Word 2000
  • [9] KGLK Krakowska Grupa Lingwistyki Komputerowej: Słownik Frekwencyjny Jezyka Polskiego, 2009
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-AGH1-0023-0086
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.