Inteligentna wyszukiwarka internetowa oparta na grupowaniu dokumentów

Kużelewska, U.; Rakowski, W.

Artykuł - szczegóły

Tytuł artykułu

Inteligentna wyszukiwarka internetowa oparta na grupowaniu dokumentów

Autorzy

Kużelewska U. , Rakowski W.

Treść / Zawartość

Pełne teksty:

Kużelewska, Rakowski_Inteligentna_wyszukiwarka.pdf

Pobierz

Identyfikatory

Warianty tytułu

An intelligent websearching based on document clustering

Języki publikacji

Abstrakty

Powstanie sieci WWW spowodowało w ostatnich latach wzrost dostępności specjalistycznych informacji dla każdego użytkownika komputera podłączonego do Internetu. Liczba dostępnych w Internecie informacji rośnie w ogromnym tempie. Wraz ze wzrostem liczby stron internetowych trudniejszym staje się odnalezienie poszukiwanej informacji. Odpowiedzią na ten problem było powstanie wyszukiwarek internetowych, które na zapytanie użytkownika opisujące poszukiwaną informacje zwracają listę dokumentów mniej lub bardziej odpowiadających zapytaniu. Wyszukiwarki internetowe nie są idealnym rozwiązaniem, ponieważ zwrócona lista dokumentów jest długa i często zawiera dokumenty nie związane z poszukiwaną informacją. Grupowanie dokumentów jest rozwiązaniem mającym na celu poprawę jakości prezentacji wyników wyszukiwania, gdyż umożliwia wyświetlenie ich w postaci tematycznie powiązanych grup. W artykule przedstawiono wyniki grupowania dokumentów z sieci WWW zwrócone przez jedną z popularnych wyszukiwarek. Wykorzystano następujące metody grupujące: EM i AHC.

Development of the World Wide Web over recent years led to increased availability of specialized information for each user with a computer connected to the Internet. The amount of information available there is increasing rapidly and finding desirable information is more difficult. The solution of the problem may be Internet search engines, however they have some disadvantages. They require from users to input a query describing searching information and they return a list of documents, which is very long and often contains websites not relevant to the query. To increase efficiency of the searching process one may identify groups of similar documents from a result list. One of the tools to do it are clustering algorithms. The article presents clustering of Web search results from one of the popular search engines grouped using the following methods: EM and AHC.

Słowa kluczowe

wyszukiwarki internetowe wyniki wyszukiwania grupowanie dokumentów

internet search engines search results document clustering

Wydawca

Instytut Naukowo-Wydawniczy "TTS" Sp. z o.o

Czasopismo

TTS Technika Transportu Szynowego

Rocznik

2012

Tom

R. 19, nr 9

Strony

1665--1672, CD

Opis fizyczny

Bibliogr. 12 poz.

Twórcy

autor

Kużelewska U.

Politechnika Białostocka

autor

Rakowski W.

absolwent Politechniki Białostockiej

Bibliografia

1. Campos, R., Dias, G., Nunes, C.: WISE: Hierarchical Soft Clustering of Web Page Search Results based on Web Content Mining Techniques, Konferencja IEEE/WIC/ACM International Conference on Web Intelligence, 2006
2. Jain, A.K., Dubes, R.C.: Algorithms for clustering data, Prentice Hall, 1988
3. Jain, A.K., Murty, M.N. i Flynn, P.J.: Data clustering: a review, ACM Computing Surveys 1999, nr 31(3)
4. Lauritzen, S.L.: The EM algorithm for graphical association models with missing data, Computational Statistics and Data Analysis 1995, nr 19
5. Lawrence, S., Giles, C. L.: Accessibility and Distribution of Information on the Web, Nature 1999, nr 400
6. Mahdavi, M., Abolhassani, H.: Harmony K-means algorithm for document clustering, Data Mining and Knowledge Discovery 2009, nr 18
7. Markow, Z., Larose, D.: Eksploracja zasobów internetowych, PWN, 2009
8. Rakowski, W.: Inteligentna wyszukiwarka internetowa wykorzystująca grupowanie w celu optymalizacji wyników wyszukiwania, praca magisterska, Politechnika Białostocka, 2011
9. Salton, G.: A Vector Space Model for Automatic Indexing, Communications of the ACM, 1975, nr 18(11)
10. Weiss, D.: O szukaniu igły w stogu siana, Seminarium Instytutu Lingwistyki, Polska Akademia Nauk, 2003
11. System Weka, http://www.cs.waikato.ac.nz/ml/weka/, (dostęp 26.09.2012)
12. Wyszukiwarka Bing, http://www.bing.com, (dostęp 10.10.2012)

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-1c2e3acf-902f-4501-8a70-871d14e092b1