Comparison of Spectral Clustering and Cluster Ensembles Stability
Stosując metody taksonomiczne w jakimkolwiek zagadnieniu klasyfikacji, ważną kwestią jest zapewnienie wysokiej poprawności wyników grupowania. Od niej bowiem zależeć będzie skuteczność wszelkich decyzji podjętych na ich podstawie. Stąd też w literaturze wciąż proponowane są nowe rozwiązania, które mają przynieść poprawę dokładności grupowania w stosunku do tradycyjnych metod (np. k-średnich, metod hierarchicznych). Przykładem mogą tu być metody polegające na zastosowaniu podejścia zagregowanego oraz algorytmy spektralne. Podejście zagregowane w taksonomii można sformułować następująco: mając wyniki wielokrotnie przeprowadzonego grupowania, należy znaleźć zagregowany podział ostateczny. Taksonomia spektralna natomiast polega na zastosowaniu wartości własnych pochodzących ze spektralnej dekompozycji macierzy podobieństwa, opisującej badane obiekty. Pożądaną cechą algorytmu taksonomicznego jest, by był on odporny na niewielkie zmiany w zbiorze danych czy też w wartościach parametrów tych metod (np. losowo wybierane zalążki skupień w metodzie k-średnich). Wyniki empiryczne pokazują, że podejście zagregowane jest stabilniejsze niż klasyczne metody taksonomiczne. Celem tego artykułu natomiast jest porównanie stabilności zagregowanych i spektralnych algorytmów taksonomicznych (fragment tekstu)
High accuracy of the results is very important task in any grouping problem (clustering). It determines effectiveness of the decisions based on them. Therefore in the literature there are proposed methods and solutions that main aim is to give more accurate results than traditional clustering algorithms (e.g. k-means or hierarchical methods). Examples of such solutions can be cluster ensembles or spectral clustering algorithms. A desirable quality of any clustering algorithm is also stability of the method with respect to small perturbations of data (e.g. data subsampling, small variations in the feature values) or the parameters of the algorithm (e.g. random initialization). Empirical results shown that cluster ensembles are more stable than traditional clustering algorithms. Here, we carry out an experimental study to compare stability of spectral clustering and cluster ensembles.(original abstract)
