Artykuł dotyczy problematyki automatycznej kategoryzacji dokumentów tekstowych. W pierwszej części artykułu przedstawiono najczęściej stosowane w tej dziedzinie algorytmy. Opisane zostały algorytmy Naive Bayes, Rocchio, KNN oraz SVM. Omówiono również metody łączenia klasyfikatorów, w tym takie metody, jak bagging i boosting, a takie algorytm AdaBoost. Druga część dotyczy sposobów tworzenia reprezentacji dokumentów. W artykule zaprezentowano pokrótce problemy związane z wyborem atrybutów służących do klasyfikacji dokumentów i metody tworzenia reprezentacji wektorowych.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.