Warianty tytułu
Języki publikacji
Abstrakty
W artykule zaprezentowana zostanie funkcja cluster.Gen pakietu clusterSim służąca do losowego generowania zbiorów danych o znanej strukturze klas, pracująca w środowisku R, która ma następujące zalety: pozwala na generowanie danych metrycznych, porządkowych oraz symbolicznych przedziałowych dla danej liczby wymiarów; położenie i jednorodność skupień zdaje się za pomocą wektorów wartości przeciętnych i macierzy kowariancji; istnieje możliwość wygenerowania klas o różnej gęstości i kształcie; istnieje możliwość uwzględnienia zmiennych zakłócających strukturę klas oraz obserwacji odstających. (fragment tekstu)
Rocznik
Numer
Strony
391-399
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
- Atlas R.S., Overall J.E. [1994], Comparative Evaluation of Two Superior Stopping Rules for Hierarchical Cluster Analysis, "Psychometrika", nr 59.
- Dudoit S., Fridlyand J. [2002], A Prediction-based Resampling Method for Estimating the Number of Clusters in a Datasel, "Genome Biology", nr 3(7).
- Grabiński Т., Wydymus S., Zeliaś A. [1989], Metody taksonomii numerycznej w modelowaniu zjawisk społeczno-gospodarczych, PWN, Warszawa.
- Milligan G.W. [1985], An Algorithm for Generating Artificial Test Clusters, "Psychometrika", nr 1.
- Qiu W., Joe H. [2006], Generation of Random Clusters with Specified Degree of Separation, "Journal of Classification", vol. 23.
- R: A Language and Environment for Statistical Computing [2008], R Development Core Team, R Foundation for Statistical Computing, Vienna, URL, http://www.R-project.org.
- Soffritti G. [2003], Identifying Multiple Cluster Structures in a Data Matrix, "Communications in Statistics. Simulation and Computation", vol. 32, nr 4.
- Steinley D., Henson R. [2005], OCLUS: An Analytic Method for Generating Clusters with Known Overlap, "Journal of Classification", vol. 22.
- Tibshirani R., Walther G., Haslic T. [2001], Estimating the Number of Clusters in a Data Set Via the Gap Statistic, "Journal оґ the Royal Statistical Society", ser. В, vol. 63, part 2.
- Tibshirani R.. Walther G. [2005], Cluster Validation by Predicting Strength, "Journal of Computational and Graphical Statistics", vol. 14, nr 3.
- Walesiak M., Dudek A. [2008a], clusterSim package, URL http://www.R-project.org.
- Walesiak M., Dudek A., Identification of Noisy Variables for Nonmetric and Symbolic Data in Cluster Analysis [w:] Data Analysis, Machine Learning and Applications [2008b], red. C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker, Springer-Verlag, Berlin, Heidelberg.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171197021