PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2009 | nr 2 | 391-399
Tytuł artykułu

Losowe generowanie danych o znanej strukturze klas w pakiecie clusterSim

Autorzy
Warianty tytułu
Języki publikacji
PL
Abstrakty
W artykule zaprezentowana zostanie funkcja cluster.Gen pakietu clusterSim służąca do losowego generowania zbiorów danych o znanej strukturze klas, pracująca w środowisku R, która ma następujące zalety: pozwala na generowanie danych metrycznych, porządkowych oraz symbolicznych przedziałowych dla danej liczby wymiarów; położenie i jednorodność skupień zdaje się za pomocą wektorów wartości przeciętnych i macierzy kowariancji; istnieje możliwość wygenerowania klas o różnej gęstości i kształcie; istnieje możliwość uwzględnienia zmiennych zakłócających strukturę klas oraz obserwacji odstających. (fragment tekstu)
Rocznik
Numer
Strony
391-399
Opis fizyczny
Twórcy
  • Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
  • Atlas R.S., Overall J.E. [1994], Comparative Evaluation of Two Superior Stopping Rules for Hierarchical Cluster Analysis, "Psychometrika", nr 59.
  • Dudoit S., Fridlyand J. [2002], A Prediction-based Resampling Method for Estimating the Number of Clusters in a Datasel, "Genome Biology", nr 3(7).
  • Grabiński Т., Wydymus S., Zeliaś A. [1989], Metody taksonomii numerycznej w modelowaniu zjawisk społeczno-gospodarczych, PWN, Warszawa.
  • Milligan G.W. [1985], An Algorithm for Generating Artificial Test Clusters, "Psychometrika", nr 1.
  • Qiu W., Joe H. [2006], Generation of Random Clusters with Specified Degree of Separation, "Journal of Classification", vol. 23.
  • R: A Language and Environment for Statistical Computing [2008], R Development Core Team, R Foundation for Statistical Computing, Vienna, URL, http://www.R-project.org.
  • Soffritti G. [2003], Identifying Multiple Cluster Structures in a Data Matrix, "Communications in Statistics. Simulation and Computation", vol. 32, nr 4.
  • Steinley D., Henson R. [2005], OCLUS: An Analytic Method for Generating Clusters with Known Overlap, "Journal of Classification", vol. 22.
  • Tibshirani R., Walther G., Haslic T. [2001], Estimating the Number of Clusters in a Data Set Via the Gap Statistic, "Journal оґ the Royal Statistical Society", ser. В, vol. 63, part 2.
  • Tibshirani R.. Walther G. [2005], Cluster Validation by Predicting Strength, "Journal of Computational and Graphical Statistics", vol. 14, nr 3.
  • Walesiak M., Dudek A. [2008a], clusterSim package, URL http://www.R-project.org.
  • Walesiak M., Dudek A., Identification of Noisy Variables for Nonmetric and Symbolic Data in Cluster Analysis [w:] Data Analysis, Machine Learning and Applications [2008b], red. C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker, Springer-Verlag, Berlin, Heidelberg.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171197021
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.