Budowa pająka internetowego

Kulik, Marcin

Ten serwis zostanie wyłączony 2025-02-11.

Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl

Artykuł - szczegóły

Czasopismo

Zeszyt Naukowy / Wyższa Szkoła Zarządzania i Bankowości w Krakowie

2005 | nr 2 | 34-42

Tytuł artykułu

Budowa pająka internetowego

Autorzy

Marcin Kulik

Warianty tytułu

Języki publikacji

Abstrakty

Wyszukiwarki internetowe są narzędziami, które za pomocą wbudowanych mechanizmów i algorytmów pozwalają na ogarnięcie przez człowieka ogromnego zbioru dokumentów, jakim jest Internet. Wyszukiwarki składają się z trzech elementów: pająka, indeksu oraz interfejsu wyszukującego, zazwyczaj strony WWW. Pająk to robot sieciowy wykorzystywany do zbierania informacji ze stron internetowych i baz danych w sieci. W uproszczony sposób można powiedzieć, że pająk gromadzi informacje znalezione w Internecie zapisując je w indeksie. Dane te wykorzystywane są następnie podczas samego procesu poszukiwania określonych fraz przez użytkownika. Celem niniejszej pracy było stworzenie przykładowego pająka, pobierającego z dokumentów HTML informacje na temat poprawności ich budowy oraz liczebności zawartych w nich elementów. W artykule został przedstawiony projekt oraz implementacja wspomnianego pająka. (abstrakt oryginalny)

Słowa kluczowe

Wyszukiwarki internetowe Język programowania HTML Internet

Internet search engine HTML Programming Language Internet

Czasopismo

Zeszyt Naukowy / Wyższa Szkoła Zarządzania i Bankowości w Krakowie

Rocznik

2005

Numer

nr 2

Strony

34-42

Opis fizyczny

Twórcy

autor

Marcin Kulik

Wyższa Szkoła Zarządzania i Bankowości w Krakowie

Bibliografia

AHistory of Search Engines, http://www.wiley.com/legacy/compbooks/ sonnenreich/history.html
Google's index nearly doubles, http://www.google.eom/googleblog/2004/l 1/googles-index-nearly-doubles.html
Java 2 Platform, http://java.sun.com
JTidy - HTML syntax checker and parser, http://jtidy.sourceforge.net
Kłopotek M. A., Inteligentne wyszukiwarki internetowe, Akademicka Oficyna Wydawnicza Exit, 2001
Szewczyk Andrzej., Google dla praktyków, Mikom, 2003
Trolltech Inc., http://www.trolltech.com/products/qťindex.html

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000167853458