Powstanie sieci WWW spowodowało w ostatnich latach wzrost dostępności specjalistycznych informacji dla każdego użytkownika komputera podłączonego do Internetu. Liczba dostępnych w Internecie informacji rośnie w ogromnym tempie. Wraz ze wzrostem liczby stron internetowych trudniejszym staje się odnalezienie poszukiwanej informacji. Odpowiedzią na ten problem było powstanie wyszukiwarek internetowych, które na zapytanie użytkownika opisujące poszukiwaną informacje zwracają listę dokumentów mniej lub bardziej odpowiadających zapytaniu. Wyszukiwarki internetowe nie są idealnym rozwiązaniem, ponieważ zwrócona lista dokumentów jest długa i często zawiera dokumenty nie związane z poszukiwaną informacją. Grupowanie dokumentów jest rozwiązaniem mającym na celu poprawę jakości prezentacji wyników wyszukiwania, gdyż umożliwia wyświetlenie ich w postaci tematycznie powiązanych grup. W artykule przedstawiono wyniki grupowania dokumentów z sieci WWW zwrócone przez jedną z popularnych wyszukiwarek. Wykorzystano następujące metody grupujące: EM i AHC.
EN
Development of the World Wide Web over recent years led to increased availability of specialized information for each user with a computer connected to the Internet. The amount of information available there is increasing rapidly and finding desirable information is more difficult. The solution of the problem may be Internet search engines, however they have some disadvantages. They require from users to input a query describing searching information and they return a list of documents, which is very long and often contains websites not relevant to the query. To increase efficiency of the searching process one may identify groups of similar documents from a result list. One of the tools to do it are clustering algorithms. The article presents clustering of Web search results from one of the popular search engines grouped using the following methods: EM and AHC.
Przepływ informacji, który jest w dzisiejszych czasach niezbędny do działania organizacji na rynku wspomagany powinien być technikami informatycznymi. Wiedza, która jest konieczna do pozyskania na rynku logistyki jest pochodną danych i informacji, którymi dysponuje przedsiębiorstwo logistyczne. Niezbędne jest szybkie zbieranie danych, gromadzenie ich oraz przetwarzanie i analiza nie tylko wewnątrz firmy ale również czerpanie wiedzy z zewnątrz. Pomocne w tym zakresie mogą okazać się metody bazujące na eksploracyjnej analizie danych tekstowych – text mining. Zaprezentowano możliwe przykłady wykorzystania i korzyści płynące z zastosowania metod text miningowych w logistyce. W artykule przedstawiono zagadnienie grupowania towarów/produktów, jako atrybutów, według których dokonuje się porównywania, oceny i grupowania kontrahentów. Dokonano zarówno przeglądu jak i przedstawiono propozycje metod i algorytmów grupowania w katalogu towarów.
EN
Necessary the flow of the information which is in contemporary times to the working of the organization should be helped computer technicians. The knowledge which is essential to gaining over on the field of the logistics is the derivative data and information which the logistic company disposes. He indispensable is fast data setting, collection their and processing and analysis not only inside the firm but also draws knowledge from outside. Helpful in this field can prove methods of the text mining. Introduced the possible examples of exploitation and advantages flowing from the use of methods text mining in the logistics. In the paper introduced the question of clustering goods/ products as the attributes according to which achieved comparing, estimation and clustering contractors. It was achieved both the inspection as and the introduced proposals of methods and the algorithms of clustering in the catalog of goods.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.