Czasopismo
2012
|
R. 19, nr 9
|
1665--1672, CD
Tytuł artykułu
Autorzy
Treść / Zawartość
Pełne teksty:
Warianty tytułu
An intelligent websearching based on document clustering
Języki publikacji
Abstrakty
Powstanie sieci WWW spowodowało w ostatnich latach wzrost dostępności specjalistycznych informacji dla każdego użytkownika komputera podłączonego do Internetu. Liczba dostępnych w Internecie informacji rośnie w ogromnym tempie. Wraz ze wzrostem liczby stron internetowych trudniejszym staje się odnalezienie poszukiwanej informacji. Odpowiedzią na ten problem było powstanie wyszukiwarek internetowych, które na zapytanie użytkownika opisujące poszukiwaną informacje zwracają listę dokumentów mniej lub bardziej odpowiadających zapytaniu. Wyszukiwarki internetowe nie są idealnym rozwiązaniem, ponieważ zwrócona lista dokumentów jest długa i często zawiera dokumenty nie związane z poszukiwaną informacją. Grupowanie dokumentów jest rozwiązaniem mającym na celu poprawę jakości prezentacji wyników wyszukiwania, gdyż umożliwia wyświetlenie ich w postaci tematycznie powiązanych grup. W artykule przedstawiono wyniki grupowania dokumentów z sieci WWW zwrócone przez jedną z popularnych wyszukiwarek. Wykorzystano następujące metody grupujące: EM i AHC.
Development of the World Wide Web over recent years led to increased availability of specialized information for each user with a computer connected to the Internet. The amount of information available there is increasing rapidly and finding desirable information is more difficult. The solution of the problem may be Internet search engines, however they have some disadvantages. They require from users to input a query describing searching information and they return a list of documents, which is very long and often contains websites not relevant to the query. To increase efficiency of the searching process one may identify groups of similar documents from a result list. One of the tools to do it are clustering algorithms. The article presents clustering of Web search results from one of the popular search engines grouped using the following methods: EM and AHC.
Czasopismo
Rocznik
Tom
Strony
1665--1672, CD
Opis fizyczny
Bibliogr. 12 poz.
Twórcy
autor
- Politechnika Białostocka
autor
- absolwent Politechniki Białostockiej
Bibliografia
- 1. Campos, R., Dias, G., Nunes, C.: WISE: Hierarchical Soft Clustering of Web Page Search Results based on Web Content Mining Techniques, Konferencja IEEE/WIC/ACM International Conference on Web Intelligence, 2006
- 2. Jain, A.K., Dubes, R.C.: Algorithms for clustering data, Prentice Hall, 1988
- 3. Jain, A.K., Murty, M.N. i Flynn, P.J.: Data clustering: a review, ACM Computing Surveys 1999, nr 31(3)
- 4. Lauritzen, S.L.: The EM algorithm for graphical association models with missing data, Computational Statistics and Data Analysis 1995, nr 19
- 5. Lawrence, S., Giles, C. L.: Accessibility and Distribution of Information on the Web, Nature 1999, nr 400
- 6. Mahdavi, M., Abolhassani, H.: Harmony K-means algorithm for document clustering, Data Mining and Knowledge Discovery 2009, nr 18
- 7. Markow, Z., Larose, D.: Eksploracja zasobów internetowych, PWN, 2009
- 8. Rakowski, W.: Inteligentna wyszukiwarka internetowa wykorzystująca grupowanie w celu optymalizacji wyników wyszukiwania, praca magisterska, Politechnika Białostocka, 2011
- 9. Salton, G.: A Vector Space Model for Automatic Indexing, Communications of the ACM, 1975, nr 18(11)
- 10. Weiss, D.: O szukaniu igły w stogu siana, Seminarium Instytutu Lingwistyki, Polska Akademia Nauk, 2003
- 11. System Weka, http://www.cs.waikato.ac.nz/ml/weka/, (dostęp 26.09.2012)
- 12. Wyszukiwarka Bing, http://www.bing.com, (dostęp 10.10.2012)
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-1c2e3acf-902f-4501-8a70-871d14e092b1