Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 4

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  klasyfikacja dokumentów
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
EN
Despite the rapid growth of other types of social media, Internet discussion forums remain a highly popular communication channel and a useful source of text data for analyzing user interests and sentiments. Being suited to richer, deeper, and longer discussions than microblogging services, they particularly well reflect topics of long-term, persisting involvement and areas of specialized knowledge or experience. Discovering and characterizing such topics and areas by text mining algorithms is therefore an interesting and useful research direction. This work presents a case study in which selected classification algorithms are applied to posts from a Polish discussion forum devoted to psychoactive substances received from home-grown plants, such as hashish or marijuana. The utility of two different vector text representations is examined: the simple bag of words representation and the more refined embedded global vectors one. While the former is found to work well for the multinomial naive Bayes algorithm, the latter turns out more useful for other classification algorithms: logistic regression, SVMs, and random forests. The obtained results suggest that post-classification can be applied for measuring publication intensity of particular topics and, in the case of forums related to psychoactive substances, for monitoring the risk of drug-related crime.
EN
A new dimensionality reduction algorithm called kernel discriminative geometry preserving projection (KDGPP) is proposed to cope with document classification. By considering both intraclass geometry and interclass discrimination, KDGPP can not only nonlinearly project documents into lower-dimensional feature space via manifold adaptive kernel function but also reduce the computational complexity with Nyström method. Experimental results demonstrate that KDGPP outperforms other related algorithms in terms of effectiveness and efficiency.
PL
Zaproponowano nowy algorytm do klasyfikacji dokumentów nazwany KDGPP – kernel discriminative geometry preserving projection. Algorytm redukuje złożoność obliczeń numerycznych.
PL
Niniejszy artykuł poświęcony jest metodom organizacji dokumentów uzyskanych w wyniku wyszukiwania i ich zastosowania w aplikacjach. Opisana metoda polega na automatycznej kategoryzacji dokumentów,a przykład zastsowania tej metodyw systemach zawierających w swoim repozytorium dokumenty pochodzi z dziedziny medycyny - psychiatrii.
EN
In this article arę described methods and their implementation to the systems for organize documents from search results. Below is described approach that automatically categorize documents. This approach was implemented to systems which contain and arę repository for scientific documents from domain medicine -psychiatry.
PL
Artykuł dotyczy problematyki automatycznej kategoryzacji dokumentów tekstowych. W pierwszej części artykułu przedstawiono najczęściej stosowane w tej dziedzinie algorytmy. Opisane zostały algorytmy Naive Bayes, Rocchio, KNN oraz SVM. Omówiono również metody łączenia klasyfikatorów, w tym takie metody, jak bagging i boosting, a takie algorytm AdaBoost. Druga część dotyczy sposobów tworzenia reprezentacji dokumentów. W artykule zaprezentowano pokrótce problemy związane z wyborem atrybutów służących do klasyfikacji dokumentów i metody tworzenia reprezentacji wektorowych.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.