PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Semantic text indexing

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
Języki publikacji
EN
Abstrakty
EN
The following article presents a specific issue of semantic analysis of texts in natural language – text indexing and describes one field of its application (web browsing). The main part of this article describes a computer system assigning a set of semantic indexes (similar to keywords) to a particular text. The indexing algorithm employs a semantic dictionary to find specific words in a text that represent a text content. Furthermore, it compares two given sets of semantic indexes to determine similarities between texts (assigning a numerical value). The article describes the semantic dictionary – a tool essential to accomplish this task and its usefulness, the main concepts of the algorithm, and the test results.
Słowa kluczowe
Wydawca
Czasopismo
Rocznik
Strony
19--34
Opis fizyczny
Bibliogr. 17 poz., rys., tab.
Twórcy
autor
  • AGH University of Science and Technology, Krakow, Poland
Bibliografia
  • [1] Princeton University About WordNet.[online] URL: http://wordnet.princeton.edu/, 2010.
  • [2] WordNet. [online] URL: http://en.wikipedia.org/wiki/WordNet, 2013.[accessed: 2013-04-11 15:11].
  • [3] Agirre E., Rigau G.: Word sense disambiguation using conceptual density. In:Proceedings of the 16th International Conference on Computational Linguistics. Copenhagen, 1996.
  • [4] Allan J.: HARD Track Overview. In: TREC 2003, The Twelfth Text REtrieval Conference (TREC 2003) Proceedings. NIST, 2004.
  • [5] Berners-Lee T., Hendler J., Lassila O.: The Semantic Web. Scientific American, 2001.
  • [6] Buckley C., Robertson S.: Relevance Feedback Track Overview. In: TREC 2008. The Seventeenth Text REtrieval Conference (TREC 2008) Proceedings. NIST, 2009.
  • [7] Collins M., Singer Y.: Relational Learning of Pattern-matching Rules, 1999.
  • [8] Dorosz K., Korzycki M.: Latent semantic analysis evaluation of conceptual dependency driven focused crawling. In: The Indect project: Multimedia Communications, Services & Security Conference. 2012.
  • [9] Fellbaum C. E.: WordNet: An Electronic Lexical Database, 1988.
  • [10] Figiel A.: Tekst jako wzorzec informacyjny – automatyczna ocena tematycznego tekstów za pomocą Latent Semantic Analysis. In: W. Lubaszewski (Ed.), Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu, chap. 9, pp. 165–178, Uczelniane Wydawnictwa Naukowo-Dydaktyczne AGH, Kraków, 2009.
  • [11] Hardtke D., Wertheim M., Cramer M.: Demonstration of Improved Search Result Relevancy Using Real-Time Implicit Relevance Feedback, 2009.
  • [12] Kohler J., Philippi S., Specht M., Ruegg A.: Ontology based text indexingand querying for the semantic web. Knowledge-Based Systems, 19(8): 744–754, 2006.
  • [13] Lubaszewski W., Dorosz K., Korzycki M.: D4.4. System for Enhanced Search: A Tool for Pattern Based Information Retrieval. In: The Indect project: European Seventh Framework Programme FP7-218086-Collaborative Project, 2009.
  • [14] Maziarz M., Piasecki M., Szpakowicz S.: Approaching plWordNet 2.0. In: Proceedings of the 6th Global Wordnet Conference. 2012.
  • [15] Miller G. A.: WordNet: A Lexical Database for English. Communications of the ACM, 38(11): 39–41, 1995.
  • [16] Pohl A.: Rozstrzyganie wieloznaczności, maszynowa reprezentacja znaczenia wyrazu i ekstrakcja znaczeń. In: W. Lubaszewski (Ed.) Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu, 241–256. Kraków, 2009.
  • [17] Xing W., Ghorbani A.: Weighted PageRank Algorithm. In: Second Annual Conference on Communication Networks and Services Research, 2004. Proceedings, pp. 305–314. 2004.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-30cf8aab-6fc0-4073-b4d4-ca2675739014
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.