PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

On the clustering of correlated random variables

Treść / Zawartość
Identyfikatory
Warianty tytułu
Języki publikacji
EN
Abstrakty
EN
In this work, the possibility of clustering correlated random variables was examined, both because of their mutual similarity and because of their similarity to the principal components. The k-means algorithm and spectral algorithms were used for clustering. For spectral methods, the similarity matrix was both the matrix of relation established on the level of correlation and the matrix of coefficients of determination. For four different sets of data, different ways of measuring the disimilarity of variables were analyzed, and the impact of the diversity of initial points on the efficiency of the k-means algorithm was analyzed.
Rocznik
Tom
Strony
45--114
Opis fizyczny
Bibliogr. 21 poz., rys., tab., wykr.
Twórcy
  • Warsaw School of Computer Science
  • Warsaw School of Computer Science
Bibliografia
  • [1] David J. Hand, Heikki Mannila, and Padhraic Smyth. Principles of data mining. MIT press Cambridge, MA, 2001.
  • [2] Zenon Gniazdowski. New interpretation of principal components analysis. Zeszyty Naukowe WWSI, 11(16):43–65, 2017.
  • [3] Daniel T. Larose. Discovering Know ledgein Data: An Introduction to Data Mining. John Wiley & Sons, 2005.
  • [4] Ulrike Von Luxburg. A tutorial on spectral clustering. Statistics and computing, 17(4):395-416, 2007.
  • [5] Zenon Gniazdowski. Związek pomiędzy składowymi głównymi otrzymanymi dla danej macierzy współczynników korelacji a relacją określoną na istotności tych współczynników. Seminar, Warsaw School of Computer Science, July 1, 2011.
  • [6] Hubert M. Blalock. Social Statistics. McGraw-Hill, 1960.
  • [7] Zenon Gniazdowski. Geometric interpretation of a correlation. Zeszyty Naukowe WWSI, 7(9):27-35, 2013.
  • [8] Emanuel Weremiejewicz. Badanie związku między relacją określoną na sile korelacji a wynikami metody składowych głównych. Master thesis, Warsaw School of Computer Science, 2014.
  • [9] Helena Rasiowa. Wstęp do matematyki współczesnej. PWN, Warszawa, 1973.
  • [10] Kenneth A. Ross and Charles R. B. Wright. Discrete mathematics. Prentice Hall, 1992.
  • [11] James F Peters and Piotr Wasilewski. Tolerance spaces: Origins, theoretical aspects and applications. Information Sciences, 195:211-225, 2012.
  • [12] Andrew Y Ng, Michael I Jordan, and Yair Weiss. On spectral clustering: Analysis and an algorithm. In Advances in neural information processing systems, pages 849-856, 2002.
  • [13] Witold Lipski. Kombinatoryka dla programistów. Wydawnictwa Naukowo-Techniczne, 2004.
  • [14] Michał Grabowski. Private communication, 2017.
  • [15] Ronald A. Fisher. The use of multiple measurements in taxonomic problems. Annals of eugenics, 7(2):179-188, 1936.
  • [16] Daniel T. Larose. Data mining methods & models. John Wiley & Sons, 2006.
  • [17] R. Kelley Pace and Ronald Barry. Sparse spatial autoregressions. Statistics & Probability Letters, 33(3):291-297, 1997.
  • [18] R. Kelley Pace and Ronald Barry. Data from: Sparse spatial autoregressions, 1999.
  • [19] Dawid Kaliszewski. Modelowanie glikemii w procesie insulinoterapii. Master thesis, Warsaw School of Computer Science, 2012.
  • [20] Jelmer W. Poelstra, Nagarjun Vijay, MPH oeppner, and Jochen BW Wolf. Transcriptomics o fcolour patterning and coloration shifts inc rows. Molecularecology,24(18):4617-4628, 2015.
  • [21] Jelmer W. Poelstra, Nagarjun Vijay, Marc P. Hppner, and Jochen B. W. Wolf. Data from: Transcriptomics of colour patterning and colouration shifts in crows, 2015.
Uwagi
Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2018).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-38858c11-0b30-4d09-8364-079b4a373299
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.