This paper demonstrates that the text categorization (TC) is a good automatic method for organizing data. Some features of the TC problem are described and explained that linear Support Vector Machines (SVM) is an appropriate technique for this task. Theoretical considerations are illustrated through examples in which the text categorization problem has been solved with SVM.
PL
Artykuł omawia problem kategoryzacji tekstu jako dobrego rozwiązania do automatycznej organizacji danych. Przedstawia cechy problemu TC oraz wyjaśnia, iż liniowa metoda wektorów podtrzymujących (SVM) doskonale sprawdza się w tego typu zadaniach. Teoretyczne rozważania ilustrowane są przykładami automatycznej organizacji dokumentów przy wykorzystaniu sieci typu SVM.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
In this paper we derive the bounds for Validation (known also as Hold-Out Estimate and Train-and-Test Method). We present the best possible bound in the case of 0-1 valued loss function. We also provide the tables where the least sample size is calculated that is necessary for obtaining the bound for a given estimation rate and reliability of estimation. For an arbitrary bounded loss function we present the optimal bound approximation with any given accuracy.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.