Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 3

Liczba wyników na stronie
first rewind previous Strona / 1 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  web graph
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 1 next fast forward last
1
Content available Web graph visualizer
EN
A piece of software for web graph visualization is presented. Web graph is a data structure, which stores for each URL address a list of all URLs in the HTML page. The graph is often presented as a square matrix, where 1 at location (i, j) denotes a link from document i to document j. The matrix can be displayed as a binary image. The visualization helps to analyze the structure of the graph, which facilitates creation of effective (compact) algorithms for its representation and processing. The program presented in this article enables rapid preview of the web graph structure. Furthermore, it allows zooming, searching and cropping most interesting parts of the structure and also previewing real URL addresses.
PL
W artykule zaprezentowano narzędzie do wizualizacji grafu webowego. Graf webowy jest to struktura prezentująca dla każdego adresu URL listę adresów odsyłaczy. Graf ten można zwizualizować jako kwadratową macierz, gdzie wartość 1 na współrzędnych (i, j) oznacza odsyłacz ze strony i do strony j. Macierz tę można wyświetlić jako monochromatyczny obraz. Wizualizacja grafu webowego pomaga poznać jego strukturę, co ułatwia konstrukcję efektywnych algorytmów reprezentacji (w tym kompresji) oraz przetwarzania web-grafu. Zaprezentowane oprogramowanie zapewnia szybki podgląd struktury grafu. Dodatkowo daje możliwość zmiany powiększenia, wyszukiwania i wycinania interesujących obszarów, a także podglądania adresów URL.
EN
Efficient representation of a string dictionary is a well-known problem with applications e.g. in Web searchers and spellchecking. Traditionally, the dictionary is relatively minor compared to the text from which the terms (words) are collected, but in several applications the number of dictionary items is huge, making a compressed format highly desirable. One of those cases are document addresses on the Internet, i.e., their URLs. Large collections of URLs are useful e.g. in analyses of (possibly large portions of) the Web graph. In this work we present an efficient compression algorithm for lexicogra-phically ordered collections of URLs, supporting extract queries.
PL
Efektywna reprezentacja słownika fraz tekstowych jest klasycznym problemem mającym zastosowania m.in. w wyszukiwarkach internetowych i kontroli pisowni. Zazwyczaj słownik jest stosunkowo mały w stosunku do tekstu, z którego zebrano kolekcję fraz (słów), jednak w niektórych zastosowaniach liczba fraz może być ogromna, co praktycznie zmusza do wykorzystania kompresji. Jednym z takich przykładów są kolekcje adresów dokumentów internetowych, tj. kolekcje URL. Duże kolekcje URL wykorzystywane są np. w analizie dużych wycinków tzw. grafu webowego. W niniejszej pracy proponujemy efektywny algorytm kompresji ułożonych leksykograficznie kolekcji URL, z obsługą zapytań typu extract.
EN
This document summarizes the results of an experiment made in the Polish-Japanese Institute of Information Technology, Warsaw, Poland during autumn 2005 and winter 2006. The goal of the project was to collect and analyze large portion of Polish Web documents in order to characterize the structure and other properties of the „.pl” domain. Up to the knowledge of the authors, it was the first publicly reported research experiment of this kind over the Polish Web. The following sections include information about downloaded Web pages, Web sites, and their characteristics. We also present various statistics concerning hosts and domains, as well as the link structure. Among the results of the experiment are the first data sets representing graphs of the Polish Web which will be publicly available for other researchers.
first rewind previous Strona / 1 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.