Tytuł artykułu
Autorzy
Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
Using topology preservation measures for high-dimensional data analysis in a reduced feature space
Języki publikacji
Abstrakty
Przedmiotem niniejszego artykułu jest wielowymiarowa analiza danych, która realizowana jest poprzez uzupełnienie standardowych procedur ekstrakcji cech odpowiednimi miarami zachowania struktury topologicznej zbioru. Podejście to motywuje obserwacja, że nie wszystkie elementy zbioru pierwotnego w toku redukcji są właściwie zachowane w ramach reprezentacji w przestrzeni o zmniejszonej wymiarowości. W artykule przedstawiono najpierw istniejące miary zachowania topologii zbioru, a następnie omówiono możliwości ich włączenia w klasyczne procedury eksploracyjnej analizy danych. Załączono również ilustracyjne przykłady użycia omawianego podejścia w zadaniach analizy skupień i klasyfikacji.
This paper deals with high-dimensional data analysis accomplished through supplementing standard feature extraction procedures with topology preservation measures. This approach is based on an observation that not all elements of an initial dataset are equally preserved in its low-dimensional embedding space representation. The contribution first overviews existing topology preservation measures, then their inclusion in the classical methods of exploratory data analysis is discussed. Finally, some illustrative examples of presented approach in the tasks of cluster analysis and classification are given.
Czasopismo
Rocznik
Tom
Strony
5--15
Opis fizyczny
Bibliogr. 16 poz., wz., tab., wykr.
Twórcy
autor
- Katedra Automatyki i Technik Informacyjnych, Wydział Inżynierii Elektrycznej i Komputerowej, Politechnika Krakowska
- Instytut Badań Systemowych, Polska Akademia Nauk
autor
- Katedra Automatyki i Technik Informacyjnych, Wydział Inżynierii Elektrycznej i Komputerowej, Politechnika Krakowska
- Instytut Badań Systemowych, Polska Akademia Nauk
Bibliografia
- [1] Borg I., Groenen P.J.F., Modern Multidimensional Scaling: Theory and Applications, Springer, Heidelberg 2010.
- [2] Charytanowicz M., Niewczas J., Kulczycki P., Kowalski P.A., Łukasik S., Żak S., Complete Gradient Clustering Algorithm for Features Analysis of X-Ray Images, Advances in Intelligent and Soft Computing, vol. 69, 2010, 15-24.
- [3] Everitt B.S., Landau S., Leese M., Stahl D., Cluster Analysis, Wiley, New York 2011.
- [4] Furht B., Escalante A. (red.), Handbook of Data Intensive Computing, Springer, Heidelberg 2011.
- [5] Karbauskaite R., Dzemyda G., Topology Preservation Measures in the Visualization of Manifold-Type Multidimensional Data, Informatica, vol. 20, 2009, 235-254.
- [6] Kerdprasop K., Kerdprasop N., Sattayatham P., Weighted K-Means for Density-Biased Clustering, Lecture Notes in Computer Science, vol. 3589, 2005, 488-497.
- [7] Konig A., Interactive visualization and analysis of hierarchical neural projections for data mining, IEEE Transactions on Neural Networks, vol. 11/3, 2000, 615-624.
- [8] Lee J.A., Verleysen M., Nonlinear Dimensionality Reduction, Springer, New York 2007.
- [9] Łukasik S., Kulczycki P., An Algorithm for Sample and Data Dimensionality Reduction Using Fast Simulated Annealing, Lecture Notes in Artificial Intelligence, vol. 7120, 2011, 152-161.
- [10] Maaten L.J.P.v., Postma E.O., Herik H.J., Dimensionality Reduction: A Comparative Review, Tilburg University Technical Report, TiCC-TR 2009-005, 2009.
- [11] Parvin H., Alizadeh H., Minati B., A Modification on K-Nearest Neighbor Classifier, Global Journal of Computer Science and Technology, vol. 10, 2010, 37-41.
- [12] Sammon J.W., A Nonlinear Mapping for Data Structure Analysis, IEEE Transactions on Computers, vol. 18, 1969, 401-409.
- [13] Sammut C., Webb G.I. (red.), Encyclopedia of Machine Learning, Springer, New York 2011.
- [14] Silva V.D., Tenenbaum J.B., Global versus local methods in nonlinear dimensionality reduction, [w:] Becker S., Thrun S., Obermayer K. (red.), Advances in Neural Information Processing Systems, vol. 15, MIT Press, Cambridge 2003, 705-712.
- [15] UCI Machine Learning Repository, http://archive.ics.uci.edu/ml/
- [16] Verleysen M., François D., The Curse of Dimensionality in Data Mining and Time Series Prediction, [w:] Cabestany J., Prieto A., Sandoval F. (red.), Computational Intelligence and Bioinspired Systems. Lecture Notes in Computer Science, vol. 3512, Springer, Heidelberg 2005, 758-770.
Uwagi
PL
Badanie zrealizowano dzięki dofinansowaniu w ramach stypendium naukowego z projektu pn. „Technologie informacyjne: badania i ich interdyscyplinarne zastosowania” współfinansowanego ze środków Unii Europejskiej w ramach Europejskiego Funduszu Społecznego, Program Operacyjny Kapitał Ludzki (Umowa nr UDA-POKL.04.01.01-00-051/10-00).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-945d9a69-3eab-4f79-bb93-75a55b18749a