Tytuł artykułu
Wybrane pełne teksty z tego czasopisma
Warianty tytułu
Syntetyczna sieć WWW
Języki publikacji
We got used to the idea that Web is a collection of interlinked documents containing knowledge from almost all areas of human activity. Recent research points however that the very structure of WWW links may by its own be a rich source of diverse knowledge. Understanding of rules for Web structure and growth may have immense impact in diverse research areas, starting with theory of structure and dynamics of massive graphs, utilitarian search for effective search algorithms on WWW, to the psychological research on formation of social communities and detection of such communities on the Internet. Currently the mainstream research concentrates apparently on construction of simple models helping to explain various basic statistical phenomena observed on the Web. This paper briefly explains major models of the Web and recalls basic contradictions between properties of synthetic Web and the real Web. It also offers a way to resolve one such contradiction concerning the high correlation between PageRank and in-degrees in synthetic Web models, while such a correlation is not present in real Web.
Przyzwyczailiśmy się do traktowania sieci WWW jako zbioru dokumentów zawierających wiedzę prawie ze wszystkich dziedzin naszego życia . Ostatnie badania zdają się wskazywać, że równie głębokim źródłem wiedzy może być sama struktura sieci WWW. Zrozumienie struktury i ewolucji sieci dokumentów na WWW może mieć kolosalne znaczenie dla wielu dziedzin-począwszy od badań naqd strukturą i dynamiką wielkich grafów poprzez utilitarne badania nad efektywnością programów przeczesujących sieć WWW aż po psychologiczne badania nad powstawaniem grup społecznych czy też wykrywaniem takich grup. W chwili obecnej główny nurt badań nad strukturą i rozwojem WWW skupia się na konstruowaniu prostych modeli pozwalających wyjaśnić podstawowe statystyczne własności sieci WWW. W niniejszym artykule przedstawiono ważniejsze koncepcje modelu sieci WWW i wskazano na sprzeczności między miarami rzeczywistej sieci WWW a jej syntetycznymi modelami. Zaproponowano sposób obejścia jednej z takich sprzeczności, jaką jest wysoka korelacja między PageRankiem a stopniem wejściowym stron WWW w sieciach syntetycznych, oraz brakiem takiej korelacji w rzeczywistej sieci WWW.
- Instytut Podstaw Informatyki Polskiej Akademii Nauk, 01-237 Warszawa, ul. Ordona 21, klopotek@ipipan.waw.pl
Identyfikator YADDA