Warianty tytułu
Języki publikacji
Abstrakty
Wyszukiwarki internetowe są narzędziami, które za pomocą wbudowanych mechanizmów i algorytmów pozwalają na ogarnięcie przez człowieka ogromnego zbioru dokumentów, jakim jest Internet. Wyszukiwarki składają się z trzech elementów: pająka, indeksu oraz interfejsu wyszukującego, zazwyczaj strony WWW. Pająk to robot sieciowy wykorzystywany do zbierania informacji ze stron internetowych i baz danych w sieci. W uproszczony sposób można powiedzieć, że pająk gromadzi informacje znalezione w Internecie zapisując je w indeksie. Dane te wykorzystywane są następnie podczas samego procesu poszukiwania określonych fraz przez użytkownika. Celem niniejszej pracy było stworzenie przykładowego pająka, pobierającego z dokumentów HTML informacje na temat poprawności ich budowy oraz liczebności zawartych w nich elementów. W artykule został przedstawiony projekt oraz implementacja wspomnianego pająka. (abstrakt oryginalny)
Rocznik
Numer
Strony
34-42
Opis fizyczny
Twórcy
autor
- Wyższa Szkoła Zarządzania i Bankowości w Krakowie
Bibliografia
- AHistory of Search Engines, http://www.wiley.com/legacy/compbooks/ sonnenreich/history.html
- Google's index nearly doubles, http://www.google.eom/googleblog/2004/l 1/googles-index-nearly-doubles.html
- Java 2 Platform, http://java.sun.com
- JTidy - HTML syntax checker and parser, http://jtidy.sourceforge.net
- Kłopotek M. A., Inteligentne wyszukiwarki internetowe, Akademicka Oficyna Wydawnicza Exit, 2001
- Szewczyk Andrzej., Google dla praktyków, Mikom, 2003
- Trolltech Inc., http://www.trolltech.com/products/qťindex.html
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000167853458