This paper introduces a novel linguistic habit graph LHG for automation of contextual text correction. The result of our current researches is a constructed mechanism for searching and aggregating tens of millions word-triples from websites that create a simple context statement for a given language that makes us able to predict word sequences and proceed corrections better than currently used solutions. Moreover, the LHG graph during colleting word-triples grow is limited and slows down so LHG graphs can be continuously supplemented by reading next texts to improve the correction results.
Automatyczna korekta tekstów stanowi ważny problem z punktu widzenia dzisiejszych procesorów i edytorów tekstów. W tym artykule został przedstawiony innowacyjny algorytm służący do automatyzacji kontekstowej korekty tekstów z wykorzystaniem Grafu Przyzwyczajeń Lingwistycznych (LHG), który również opisano w tym artykule. W tym celu zbudowano specjalistycznego pająka internetowego przeszukującego strony internetowe celem skonstruowania Grafu Przyzwyczajeń Lingwistycznych (LHG) na podstawie analizy korpusów tekstów uzyskanych z polskojęzycznych stron internetowych. Otrzymane wyniki korekty tekstu z wykorzystaniem tego algorytmu, bazującego na grafie LHG, zostały porównane z komercyjnymi programami do korekty tekstu takimi jak Microsoft Word 2007, Open Office Writer 3.0 oraz z wyszukiwarką Google. Otrzymane wyniki korekty tekstów okazały się być znacznie lepsze niż w wyżej wymienionych komercyjnych narzędziach.
EN
Automatic text correction is an essential problem of today text processors and editors. This paper introduces a novel algorithm for automation of contextual text correction using a Linguistic Habit Graph (LHG) also introduced in this paper. A specialist internet crawler has been constructed for searching through web sites in order to build a Linguistic Habit Graph after text corpuses gathered in Polish web sites. The achieved correction results on a basis of this algorithm using this LHG were compared with commercial programs which also enable to make text correction: Microsoft Word 2007, Open Office Writer 3.0 and search engine Google. The achieved results of text correction were much better than correction made by these commercial tools.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.