Tytuł artykułu
Warianty tytułu
Outliers detection using support vector machine
Języki publikacji
W artykule omówiono metodę wektorów nośnych w bardzo ważnym aspekcie wykrywania wyjątków w dużych zbiorach danych. Wykrywanie wyjątków jest istotne przy procesach analizowania danych, gdzie mamy do czynienia z klasyfikacja, grupowaniem, wyznaczaniem reguł asocjacyjnych. Istnienie wyjątków w klasyfikowanych czy grupowanych danych wpływa na cały kontekst analizy. Może prowadzić do wyznaczenia błędnych reguł. Wyjątki muszą być zatem identyfikowane. W niniejszym artykule skupiono się na metodzie wektorów nośnych w celu wykrywania wyjątków. Badania zostały oparte na zbiorach z repozytorium UCI [17].
Outlier detection in data covers a broad spectrum of science research. In this paper, the author proposes an approach to outlier detection based on support vector machine. In data, an outlier may be considered as a deviation which indicates the existence of outliers. The paper presents the results of tests which were conducted on the set of data from the repository [19].
Opis fizyczny
Bibliogr. 19 poz., rys.
- Instytut Informatyki, Politechnika Łódzka Wólczańska 215, 90-924 Łódź
- [1] Aggarwal, Charu C., Outlier Analysis, Springer, 2013.
- [2] Barnett, V., Lewis, T., Outliers in statistical data, Wiley, 1994.
- [3] Breuning, M.M., Kriegel, H-P., Ng, R.T., Sander, J., LOF: identifyingdensity-basedlocaloutliers, Proc. ACM SIGMOD Conference on Management of Data, 2000, 93-104.
- [4] Chomatek, L. and Duraj, A., Multiobjective genetic algorithm for outliers detection, In: INnovations in Intelligent SysTems and Applications (INISTA), 2017 IEEE International Conference on, IEEE, 2017, pp. 379–384.
- [5] Duraj, A. and Chomatek, L., Supporting Breast Cancer Diagnosis with Multi-objective Genetic Algorithm for Outlier Detection, In: International Conference on Diagnostics of Processes and Systems, Springer, 2017, pp. 304–315.
- [6] Duraj, A. and Krawczyk, A., Finding outliers for large medical datasets, Przeglad Elektrotechniczny, Vol. 86, 2010, pp. 188–191.
- [7] Duraj, A. and Szczepaniak, P. S., Information Outliers and Their Detection, In: Information Studies and the Quest for Transdisciplinarity, World Scientific Publishing Company, 2017, pp. 413–437.
- [8] Duraj, A., Szczepaniak, P. S., and Ochelska-Mierzejewska, J., Detection of Outlier Information Using Linguistic Summarization, 2016, pp. 101–113.
- [9] Duraj, A., Outlier detection in medical data using linguistic summaries, In: INnovations in Intelligent SysTems and Applications (INISTA), 2017 IEEE International Conference on, IEEE, 2017, pp. 385–390.
- [10] Ester, M., Kriegel, H.-P., Sander, J., Xu, X., et al., A density-based algorithm for discovering clusters in large spatial databases with noise. In: Kdd, Vol. 96, 1996, pp. 226–231.
- [11] Knorr, E.M., Ng, R.T.,Tucakov, V., Distance-basedoutliers: algorithms and applications, VLDB Journal 8, 3-4, 2000, 237-253.
- [12] Emets, V. and Rogowski, J., Scattering of acoustical waves by a hard strip and outlier phenomenon, In: INnovations in Intelligent SysTems and Applications (INISTA), 2017 IEEE International Conference on, IEEE, 2017, pp. 376–378.
- [13] Smolinski, M., Resolving classical concurrency problems using adaptive conflictless scheduling, In: INnovations in Intelligent SysTems and Applications (INISTA), 2017 IEEE International Conference on, IEEE, 2017, pp. 397–402.
- [14] Smoliński M., Efficient multidisk database storage configuration. In: International Conference: Beyond Databases, Architectures and Structures. Springer, Cham, 2015. pp. 180-189.
- [15] Smoliński M., Elimination of task starvation in conflictless scheduling concept. Information Systems in Management, 2016, 5.2, pp. 237-247.
- [16] Osowski S, Sieci neuronowe do przetwarzania informacji. Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa 2006
- [17] UC Irvine Machine Learning Repository. http://archive.ics.uci.edu/ml/index.html.
- [18] Kumar M.Arun, A hybrid SVM based decision tree, Pattern Recognition, 2010
- [19] Vapnik A., The Nature of Statistical Learning Theory (Statistics for Engineering and Information Science), Springer-Verlag, Nowy Jork, 1999
Opracowanie ze środków MNiSW w ramach umowy 812/P-DUN/2016 na działalność upowszechniającą naukę (zadania 2017).
Typ dokumentu
Identyfikator YADDA