Identyfikatory
Warianty tytułu
Alternatywny kryterium zatrzymania dla k-określonych twardych algorytmów klasteryzacji danych
Języki publikacji
Abstrakty
In this paper the analysis of k-specified (namely k-means) crisp data partitioning pre-clustering algorithm’s termination criterion performance is described. The results have been analyzed using the clustering validity indices. Termination criterion allows analyzing data with any number of clusters. Moreover, introduced criterion in contrast to the known validity indices enables to analyze data that make up one cluster.
W przedstawionym artykule została pokazana analiza wstępnej klasteryzacji danych w oparciu o partycjonowanie (algorytm k-średnich) w połączeniu z logiką dwuwartościową. Dodatkowo, zostało przedstawione kryterium zatrzymania klasteryzacji, które umożliwia analizowanie danych z dowolną liczbą klastrów. Otrzymane wyniki badań zostały przeanalizowane przy użyciu wewnętrznych indeksów walidacji. Wprowadzone kryterium w przeciwieństwie do znanych indeksów walidacji umożliwia analizę danych, które tworzą jeden klaster.
Rocznik
Tom
Strony
56--59
Opis fizyczny
Bibliogr. 16 poz., rys., tab.
Twórcy
autor
- Lodz University of Technology, Institute of Applied Computer Science
autor
- Lodz University of Technology, Institute of Applied Computer Science
autor
- Lodz University of Technology, Institute of Applied Computer Science
Bibliografia
- [1] Charrad M., Ghazzali N., Boiteau V., Niknafs A.: NbClust: An R Package for Determining the Relevant Number of Clusters in a Data Set. Journal of Statistic Software, 61(6), 2014, 1–36.
- [2] Davies D.L., Bouldin D.W.: A cluster separation measure. IEEE Transactions on Pattern Analysis and Machine Intelligence, PAMI-1, no. 2, 1979, 224–227.
- [3] Desgraupes B.: Clustering indices. University Paris Ouest, Lab Modal’X, 2013.
- [4] Dunn J.: Well separated clusters and optimal fuzzy partitions. Journal of Cybernetics 4, 1974, 95–104.
- [5] Fraley C., Raftery A.E.: How Many Clusters? Which Clustering Method? Answers Via Model-Based Cluster Analysis. The Computer Journal, 41(8), 1998, 578–588.
- [6] Gini, C.: Variabilitа e mutabilitа Reprinted in Memorie di metodologica statistica (Ed. Pizetti E, Salvemini, T). Rome: Libreria Eredi Virgilio Veschi, 1912, Bologna: Tipogr. Di P. Cuppini.
- [7] Halkidi M., Batistakis Y., Vazirgiannis M.: On clustering validation techniques. J. Intell. Inf. Syst., 17(2-3), 2001, 107–145.
- [8] Jung Y., Park H., Du D-Z., Drake B.L.: A Decision Criterion for the Optimal Number of Clusters in Hierarchical Clustering. Journal of Global Optimization, 25(1), 2003, 91–111
- [9] Ketchen Jr. Dj, Shook Cl.: The Application Of Cluster Analysis In Strategic Management Research: An Analysis And Critique, Strategic Management Journal, 17(6), 1996, 441–458.
- [10] McCallum A., Nigam K., Ungar L.H.: Efficient Clustering of High Dimensional Data Sets with Application to Reference Matching, Sixth ACM SIGKDD international conference on Knowledge discovery and data mining, 2000.
- [11] Mosorov V., Panskyi T., Biedron S.: Development of a stopping rule of clustering performance by using the connected acyclic graph. Eastern-European Journal of Enterprise Technologies, 5, 9(77), 2015, 24–30.
- [12] Mosorov V., Tomczak L.: Image Texture Defect Detection Method Using Fuzzy C-Means Clustering for Visual Inspection Systems. Arabian Journal for Science and Engineering, 39(4), 2014, 3013–3022.
- [13] RapidMiner GmbH: Cluster distance performance – RapidMiner documentation. http://docs.rapidminer.com/studio/operators/validation/performance/segmentation/cluster_distance_performance.html
- [14] Rousseeuw P.J.: Silhouettes: a graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics 20, 1987, 53–65.
- [15] Sheikholeslami C., Chatterjee S., Zhang A.: WaveCluster: A Multi-Resolution Clustering Approach for Very Large Spatial Database. The International Journal on Very Large Data Bases, 8(3-4), 2000, 289–304.
- [16] Theodoridis S., Koutroubas K.: Pattern Recognition 4th Edition, Academic Press, 2008.
Uwagi
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-f99c97c1-194a-4bfb-aa23-e54b97e5f8a6