PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

A web partition algorithm based on support vector machine

Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
PL
Algorytm partycjonowania sieci basujący na maszynie VSM
Języki publikacji
EN
Abstrakty
EN
In order to solve the problem of network traffic partition of crawler nodes and website nodes, a support vector machine web partition algorithm has been proposed. The algorithm reduces the load of the information collection system on the network through feature extraction, feature selection and support vector machine optimisation, thereby enhancing the response rate and crawling rate of the crawlers.
PL
Zaproponowano algorytm VSM do rozwiązywania problem podziału sieci ruchu na partycje przez węzły typu crawler i website. Algorytm redukuje przeciążenie napływem informacji przez ekstrakcję cech, selekcję cech i optymalizację VSM.
Słowa kluczowe
Rocznik
Strony
31--33
Opis fizyczny
Bibliogr. 18 poz., wykr.
Twórcy
autor
autor
autor
autor
autor
  • School of Computer Science of Technology, Harbin Institute of Technology, Heillong Jiang Province, P.R.China, wzzhang@hit.edu.cn
Bibliografia
  • [1] Brin S, Page L. The Anatomy of a Large-scale Hypertextual Web Search Engine. Computer Networks and ISDN Systems. 1998,30(1--7):107-117
  • [2] Barroso L, Dean J, Hoelzle U. Web Search for a Planet: The Google Cluster Architecture. IEEE Micro. 2003.
  • [3] Cambazoglu B B, Karaca E, Kucukyilmaz T, et al. Architecture of a grid-enabled Web search engine. Information Processing and Management. 2007, 43(3): 609-623
  • [4] Baeza-Yates R, Castillo C, Junqueira F, et al. Challenges in Distributed Information Retrieval. In: International Conference on Data Engineering (ICDE).Istanbul, Turkey: IEEE CS Press, 2007.
  • [5] Heydon A, Najork M. Mercator: A Scalable, Extensible Web Crawler. World Wide Web. 1999, 2(4): 219-229.
  • [6] Boldi P, Codenotti B, Santini M, et al. Ubicrawler: A scalable fully distributed web crawler. In: The Eighth Australian World Wide Web Conference (AUSWEB02).2002.
  • [7] Chang F, Dean J, Ghemawat S, et al. Bigtable: A Distributed Storage System for Structured Data. In: OSDI'06: Seventh Symposium on Operating System Design and Implementation.2006.
  • [8] Karger D, Sherman A, Berkheimer A, et al. Web caching with consistent hashing. Computer Networks. 1999, 31(11-16): 1203-1213.
  • [9] Soderland S. Learning Information Extraction Rules for Semi- Structured and Free Text. Mach. Learn. 1999, 34(1-3): 233- 272.
  • [10] N. R. Sakthivel, V. Sugumaran, Binoy B. Nair Application of Support Vector Machine (SVM) and Proximal Support Vector Machine (PSVM) for fault classification of monoblock centrifugal pump. Dec. 2009:38- 61
  • [11] Erik Boiy, Marie-Francine Moens A machine learning approach to sentiment analysis in multilingual Web texts. Oct. 2009 Information Retrieval : 526 – 558
  • [12] T. M. Cover. Geometrical and statistical properties of systems of linear inequalities with applications to pattern recognition. IEEE Transactions on Electronic Computers, 1965, 14(3): 326- 334
  • [13] T S Eugene Ng H Z. Predicting Internet Network Distance with Coordinates-Based Approaches. New York: Proc of IEEE INFOCOM, 2002.
  • [14] Guyton J D, Schwartz M F. Locating nearby copies of replicated Internet servers. SIGCOMM Comput. Commun. Rev. 1995, 25(4): 288-298.
  • [15] T S Eugene Ng H Z. Towards Global Network Positioning. In: ACM SIGCOMM Internet Measurement Workshop.San Francisco, CA: 2001.
  • [16] Ratnasamy S, Francis P, Handley M, et al. A scalable contentaddressable network. SIGCOMM Comput. Commun. Rev. 2001, 31(4): 161-172.
  • [17] Paul Francis S J C J. IDMaps: A Global Internet Host Distance Estimation Service. IEEE/ACM Transactions on Networking. 2001, 9(5): 525-540.
  • [18] Yager R R. On ordered weighted averaging aggregation operators in multicriteria decisionmaking. IEEE Trans. Syst. Man Cybern. 1988, 18(1): 183-190.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPOB-0049-0007
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.