Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Text Mining Analysis of Polish Job Offers for IT Specialists
Języki publikacji
Abstrakty
Rozważania przedstawione w niniejszej pracy koncentrują się na zagadnieniu wspomagania człowieka w procesie pozyskiwania informacji z zasobów tekstowych. Praca zawiera przede wszystkim rozważania dotyczące metod przydatnych do pozyskiwania informacji z polskojęzycznych dokumentów tekstowych. Przedstawiono metody bazujące na dwóch odmiennych podejściach do zagadnienia reprezentacji informacji dostępnych w dokumentach, a mianowicie na reprezentacji w postaci listy słów oraz reprezentacji ontologicznej. Za podstawę do sformułowania wniosków dotyczących ocen stosowanych metod analizy przyjęto zaprezentowane w pracy wyniki badań dotyczące zautomatyzowanej analizy polskojęzycznych ofert pracy dla specjalistów z zakresu informatyki. (fragment tekstu)
The problem of document clustering is the main topic of the paper. Two approaches to text clustering are studied. The first one is based on the bag-of-words representation. And the second uses a user-defined ontology. The results show that ontology-based approach is more complex than methods based on the bag-of-words representation but it is far superior to them. (original abstract)
Rocznik
Tom
Strony
249-255
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Krakowie
Bibliografia
- Lin D. (1998), An Information-theoretic Definition of Similarity, Department of Computer Science University of Manitoba, Winnipeg, Manitoba, Canada R3T 2N2, http://www.cs.ualberta.ca/~lind ek/papers/sim.pdf.
- Lula P. (2005), Klasyfikacja dokumentów tekstowych sporządzonych w języku polskim, Taksonomia 12, red. KL Jajuga, M. Walesiak, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1076, AE, Wrocław.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000168589980