Artykuł dotyczy analizy informacji opisujących strony internetowe. Celem analizy jest wsparcie procesu ich klasyfikacji. Brane są pod uwagę cechy o zróżnicowanym charakterze, w tym między innymi cechy: strukturalne, wizualne, tekstowe, łączy internetowych. Przy budowie klasyfikatorów wykorzystano algorytm AdaBoost. W artykule przedstawiono implementację omawianego rozwiązania oraz wyniki przeprowadzonych eksperymentów.
EN
The article concerns the analysis of information describing the web pages. The aim of the analysis is to support the process of their classification. Various characteristics are taken into account including inter alia, structural, visual, text, web and links features. During the construction of classifiers the AdaBoost algorithm was applied. The paper presents the implementation of this solution and the results of experiments.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.