Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Identification of Wikipedia categories associations based on articles similarities
Języki publikacji
Abstrakty
W artykule opisano podejście do identyfikacji powiązań między kategoriami w repozytorium danych tekstowych, bazując na Wikipedii. Przeprowadzając analizę podobieństwa między artykułami, określono miary pozwalające zidentyfikować powiązania między kategoriami, które nie były wcześniej uwzględnione, i nadawać im wagi określające stopień istotności. Przeprowadzono automatyczną ocenę uzyskanych rezultatów w odniesieniu do już istniejącej struktury kategorii.
In the article we present an approach to identification of relations between categories organizing the repository of documents. We describe the metrics of category relevance based on similarity measures between articles. The metrics have been used to discover relations between categories within Wikipedia repository. The evaluation of the proposed method indicate it allows to reconstruct already existing associations in category structure as well as introduce new significant relations.
Czasopismo
Rocznik
Tom
Strony
295--310
Opis fizyczny
Bibliogr. 12 poz.
Twórcy
autor
- Politechnika Gdańska, Wydział Elektroniki, Telekomunikacji i Informatyki, Katedra Architektury Systemów Komputerowych, ul. Narutowicza 11/12, 80-233 Gdańsk-Wrzeszcz, Polska
autor
- Politechnika Gdańska, Wydział Elektroniki, Telekomunikacji i Informatyki, Katedra Architektury Systemów Komputerowych, ul. Narutowicza 11/12, 80-233 Gdańsk-Wrzeszcz, Polska
autor
- Politechnika Gdańska, Wydział Elektroniki, Telekomunikacji i Informatyki, Katedra Architektury Systemów Komputerowych, ul. Narutowicza 11/12, 80-233 Gdańsk-Wrzeszcz, Polska
Bibliografia
- 1. Szymański J.: Mining relations between Wikipedia Categories. Proceedings of the 2th International conference of network of Digital Technologies, Springer, Prague 2010.
- 2. Holloway T., Bozicevic M., Borner K.: Analyzing and visualizing the semantic coverage of Wikipedia and its authors. Complexity, No. 12(3), 2007, s. 30÷40.
- 3. Szymański J.: Wikipedia Articles Representation with Matrix’u. Springer, LNCS (in print), 2013.
- 4. Szymański J., Duch W.: Dynamic Semantic Visual Information Management. Proceedings of the 9th International Conference on Information and Management Sciences, Urumchi, China, 2010, s. 107÷117.
- 5. Szymański J., Duch W.: Representation of hypertext documents based on terms, links and text compressibility. Neural Information Processing, Theory and Algorithms, Sydney 2010, s. 282÷290.
- 6. Milgram S.: The small world problem. Psychology today, 2(1), 1967, s. 60÷67.
- 7. Watts D.: Small worlds: the dynamics of networks between order and randomness. Princeton University Press, 2003.
- 8. Kleinberg J.: Authoritative sources in a hyperlinked environment. Journal of the ACM (JACM), 46(5), 1999, s. 604÷632.
- 9. Langville A., Meyer C.: Deeper inside pagerank. Internet Mathematics, 1(3), 2004, s. 335÷380.
- 10. Deptuła M., Szymański J., Krawczyk H.: Interaktywne wyszukiwanie informacji w dużych kolekcjach danych oparte o zysk informacyjny na podstawie danych z Wikipedii. (w druku), 2012.
- 11. Szymański J.: Interactive Information Retrieval Algorithm for Wikipedia Articles, Springer, LNCS, 2012, s. 200÷207.
- 12. Zygmunt A., Koźlak J., Krupczak Ł.: Analiza grup w serwisach społecznościowych. Studia Informatica, Vol. 32, No. 2A (96), Gliwice 2011, s. 365÷376.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-0d88e580-8bee-4f70-aa98-24d95e1f2628
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.