Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl

PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2018 | 21 | nr 508 Klasyfikacja i analiza danych - teoria i zastosowania | 180-189
Tytuł artykułu

Wpływ redukcji liczby zmiennych na stabilność grupowania

Autorzy
Treść / Zawartość
Warianty tytułu
The Effect of Reduction of Variables to Groups Stability
Języki publikacji
PL
Abstrakty
W artykule zbadany został wpływ formalnych metod doboru zmiennych na stabilność grupowania. Kryterium stabilności bada, czy grupy, które zostały utworzone w wyniku grupowania zbioru obiektów, występują rzeczywiście (zatem struktura jest stabilna), czy też pojawiły się przypadkowo i uzyskana struktura nie odzwierciedla tej istniejącej w danych. Jako formalną metodę doboru zmiennych zastosowano analizę czynnikową, natomiast badanie stabilności grupowania przeprowadzono za pomocą metody w przybliżeniu nieobciążonego prawdopodobieństwa bootstrapowego na zbiorach danych społeczno-ekonomicznych utworzonych na podstawie danych zaczerpniętych z Głównego Urzędu Statystycznego. Uzyskane wyniki pokazują, że zastosowanie analizy czynnikowej do redukcji liczby zmiennych może wpływać zarówno na stabilność grupowania, jak i na uzyskiwaną strukturę grup.(abstrakt oryginalny)
EN
The paper examines the effect of formal methods of variables selection on groups stability. The stability criterion examines whether the groups that were formed as a result of using taxonomy methods actually exist in the data (the structure is stable) or they have come up by chance. As a formal method of selecting variables, factor analysis was used, while groups stability testing was performed using a method of approximately unbiased bootstrap probability on socio-economic data sets generated on the basis of data taken from Central Statistical Office. The results show that using factor analysis for reducing the number of variables can affect both the stability of grouping and the obtained groups structure.(original abstract)
Twórcy
  • Uniwersytet Ekonomiczny w Katowicach
Bibliografia
  • Efron B., 1979, Bootstrap methods: Another look at the jackknife, Annals of Statistics, vol. 7, s. 1-26.
  • Felsenstein J., 1985, Confidence limits on phylogenies: An approach using the bootstrap, Evolution, 39, s. 783-791.
  • Hennig C., 2007, Cluster-wise Assessment of Cluster Stability, Computational Statistics and Data Analysis, vol. 52, s. 258-271.
  • Hillis D., Bull J., 1993, An empirical test of bootstrapping as a method for assessing confidence in phylogenetic analysis, Systematic Biology, vol. 42, s. 182-192.
  • Kim J.O., Müller C.W., 1978a, Factor Analysis, Statistical Methods and Practical Issues, Sage, Beverly Hills.
  • Kim J.O., Müller C.W., 1978b, Introduction to Factor Analysis. What it is and How to do it, Sage, Beverly Hills.
  • Milligan G.W., 1994, Issues in applied classification: Selection of variables to cluster, Classification Society of North America Newsletters, November, Issue 37.
  • Milligan G.W., 1996, Clustering validation: results and implications for applied analyses, [w:] Arabie P., Hubert L.J., de Soete G. (red.), Clustering and Classification, World Scientific, Singapore.
  • Sanderson M.J., Wojciechowski M.F., 2000, Improved bootstrap confidence limits in large-scale phylogenies, with an example from Neo-Astragalus (Leguminosae), Systematic Biology, vol. 49, s. 671-685.
  • Shamir O., Tishby N., 2008, Cluster stability for finite samples, Advances in Neural Information Processing Systems, vol. 20, s. 1297-1304.
  • Shimodaira H., 2002, An approximately unbiased test of phylogenetic tree selection, Systematic Biology, vol. 51, s. 492-508.
  • Shimodaira H., 2004, Approximately unbiased tests of regions using multistep-multiscale bootstrap resampling, Annals of Statistics, vol. 32, s. 2616-2641.
  • Suzuki R., Shimodaira H., 2004, An application of multiscale bootstrap resampling to hierarchical clustering of microarray data: how accurate are these clusters?, Proceedings by the Fifteenth International Conference on Genome Informatics (GIW 2004).
  • Suzuki R., Shimodaira H., 2006, Pvclust: An R package for assessing the uncertainty in hierarchical clustering, Bioinformatics, vol. 22, no.12, s. 1540-1542.
  • Volkovich Z., Barzily Z., Toledano-Kitai D., Avros R., 2010, The Hotteling's metric as a cluster stability measure, Computer Modelling and New Technologies, vol. 14, no. 4, s. 65-72.
  • Walesiak M., Gatnar E. (red.), 2009, Statystyczna analiza danych z wykorzystaniem programu R, Wydawnictwo Naukowe PWN, Warszawa.
  • Yeung K.Y., Ruzzo W.L., 2001, An empirical study on principal component analysis for clustering gene expression data, Bioinformatics, vol. 17(9), s. 763-774.
  • Zakrzewska M., 1994, Analiza czynnikowa w budowaniu i sprawdzaniu modeli psychologicznych, Wydawnictwo UAM, Poznań.
  • Zharkikh A., Li W.H., 1992, Statistical properties of bootstrap estimation of phylogenetic variability from nucleotide sequences. I. Four taxa with a molecular clock, Molecular Biology and Evolution, vol. 9, s. 1119-1147.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171525055
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.