One of the central problem in data mining is to filter large sets of discovered patterns. Our experience shows that this task should be done not for a single rule but by taking into considerations other similar rules. To fulfil this requirement the author proposes a new syntax-based distance measure dedicated for multilevel multidimensional rules as well as a rules’ neighbourhood with variable radius and a rule’s interestingness within the neighbourhood. Included example presents one of the possible usage of the proposed definitions in analysis of data from fault simulations.
PL
Badania pokazują, że wybór istotnych wzorców z dużych zbiorów reguł powinien być dokonywany nie na podstawie pojedynczej reguły, ale w powiązaniu z regułami podobnymi. Aby zrealizować to zadanie, autorka proponuje nową syntaktyczną miarę odległości miedzy wielopoziomowymi wielowymiarowymi regułami decyzyjnymi i definicje: sąsiedztwa reguły ze zmiennym promieniem oraz atrakcyjności reguły w sąsiedztwie. Artykuł zawiera tak˙ze przykład wykorzystania zaproponowanych definicji w analizie danych z symulatorów błędów.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.