Tytuł artykułu
Autorzy
Identyfikatory
Warianty tytułu
Unusual data exploration – new approach
Języki publikacji
Abstrakty
Celem artykułu jest przedstawienie idei wykrywania nietypowych danych w dużych zbiorach danych poddanych grupowaniu. Autorzy przedstawiają własne podejście do klasycznej wersji algorytmu k-średnich. Modyfikacja prezentuje także definicje skupień odstających i skupień wpływowych. W pracy przedstawiono również wyniki przeprowadzonych badań wraz z analizą ich rezultatów.
The goal of the article is to present the idea of discovering unusual da-ta in large datasets in which the many clusters were created. Authors presents the methods which is modification of classical version of k-means algorithm. The modification introduces the concept of an influential and outlier cluster. The paper consists also of the results of the experiments with the analysis of it.
Czasopismo
Rocznik
Tom
Strony
187--198
Opis fizyczny
Bibliogr. 11 poz.
Twórcy
autor
- Uniwersytet Śląski, Instytut Informatyki
autor
- Uniwersytet Śląski, Instytut Informatyki
Bibliografia
- 1. Larose D.: Odkrywanie wiedzy z danych, wprowadzenie do eksploracji danych. Wydaw-nictwo PWN, Warszawa 2006.
- 2. Han J., Kamber M., Pei J.: Data Mining: Concepts and Techniques. Elsevier, San Franci-sco 2012.
- 3. Nowak-Brzezińska A.: Eksploracja odchyleń w regułowych bazach wiedzy. Studia Infor-matica, ZN Pol. Śl., Vol. 33, No. 2A (105), Gliwice 2012.
- 4. Hawkins D.: Identification of Outliers. Chapman and Hall, London 1980.
- 5. Tomkowicz M.: Wpływ odchyleń na jakość grupowania danych wielowymiarowych. Pra-ca magisterska, Uniwersytet Śląski, Katowice 2013.
- 6. Nowak-Brzezińska A.: Wykrywanie reguł nietypowych – metody oparte na analizie sku-pień. Studia Informatica, ZN Pol. Śl., Vol. 34, No. 2A (111), Gliwice 2013.
- 7. Turos A.: Analiza metod wykrywania odchyleń w danych wielowymiarowych. Praca ma-gisterska, Uniwersytet Śląski, Katowice 2013.
- 8. MacQueen J.: Some Methods for classification and Analysis of Multivariate Observa-tions. University of California, 1967.
- 9. Tryon R.: Cluster Analysis. McGraw Hill, New York 1939.
- 10. Xu R., Wunsch D.: Clustering. Wiley, New York 2008.
- 11. Myatt G., Johnson W.: Making sense of data. Wiley, New York 2009.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-60bbc388-fe27-4201-b531-865c7975780d