In the paper, we propose a method for mining real-estate listings using clustering algorithms intended for numerical data. The presented approach is based on information systems over ontological graphs. Such information systems have been proposed to deal with data in the form of concepts linked by different semantic relations. A special attention is focused on preprocessing steps transforming advertisements in the textual form into information systems defined over ontological graphs, as well as on encoding attribute values for clustering algorithms.
PL
W artykule zaproponowano metodę eksploracji serwisów ogłoszeń nieruchomości przy użyciu algorytmów klasteryzacji przeznaczonych dla danych numerycznych. Przedstawione podejście bazuje na systemach informacyjnych nad grafami ontologicznymi. Systemy informacyjne tego typu zaproponowane zostały w celu poradzenia sobie z danymi w postaci pojęć powiązanych ze sobą za pomocą różnych relacji semantycznych. Specjalna uwaga została zwrócona na etap wstępnego przetwarzania danych z ogłoszeń w postaci tekstowej do postaci systemów informacyjnych zdefiniowanych nad grafami ontologicznymi jak również na kodowanie wartości atrybutów dla algorytmów klasteryzacji.
2
Dostęp do pełnego tekstu na zewnętrznej witrynie WWW
The main goal of the paper is to show the idea of incorporating paradigmatic and syntagmatic relations into processing data stored in information tables using rough set methods. Input data, in a tabular form, are used in many machine learning and computational intelligence methods and algorithms, among others, those based on rough set theory. Additional knowledge about semantic relations (both paradigmatic and syntagmatic) can be considered as a useful context affecting data classification or clustering.
In the paper, the problem of extraction of complex decision rules in simple decision systems over ontological graphs is considered. The extracted rules are consistent with the dominance principle similar to that applied in the dominance-based rough set approach (DRSA). In our study, we propose to use a heuristic algorithm, utilizing the ant-based clustering approach, searching the semantic spaces of concepts presented by means of ontological graphs. Concepts included in the semantic spaces are values of attributes describing objects in simple decision systems.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.