PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

A new hybrid approach for data level balancing classes in classification problems

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Nowe hybrydowe podejście równoważenienia liczności klas w problemie klasyfikacji
Języki publikacji
EN
Abstrakty
EN
The article concerns the problem of imbalanced data classification. A new algorithm is presented and tested. The HImbA technique is a hybrid method that uses well-known SMOTE algorithm and modified k-nearest neighbours method. 28 datasets have been preprocessed using the HImbA and 10 variants of existing techniques, classified using two algorithms (C4.5 and SMO) and the results have been compared. The new algorithm occurred to give the best results for some datasets.
PL
Praca dotyczy braku zrównoważenia liczności klas w problemie klasyfikacji. Zaprezentowany oraz przetestowany został nowy algorytm. Technika HImbA jest metodą hybrydową, która łączy znany algorytm SMOTE oraz zmodyfikowaną wersję metody k najbliższych sąsiadów. Została ona zastosowana wraz z dziesięcioma wariantami istniejących technik w celu przetwarzania wstępnego 28 zbiorów danych, które zostały następnie poddane klasyfikacji (użyto dwóch algorytmów – C4.5 oraz SMO), a wyniki zostały porównane. Dla wybranych zbiorów przy użyciu nowego algorytmu uzyskano najlepsze rezultaty.
Rocznik
Strony
145--155
Opis fizyczny
Bibliogr. 8 poz., rys., tab.
Twórcy
autor
  • Politechnika Białostocka, Wydział Informatyki ul. Wiejska 45A, 15-351 Białystok
Bibliografia
  • 1. Jesús Alcalá-Fdez, Alberto Fernández, Julián Luengo, Joaquín Derrac, and Salvador García. Keel data-mining software tool: Data set repository, integration of algorithms and experimental analysis framework. Multiple-Valued Logic and Soft Computing, 17(2-3): 255-287, 2011.
  • 2. Chumphol Bunkhumpornpat, Krung Sinapiromsaran, and Chidchanok Lursinsap. Advances in Knowledge Discovery and Data Mining: 13th Pacific-Asia Conference, PAKDD 2009 Bangkok, Thailand, April 27-30, 2009 Proceedings, chapter Safe-Level-SMOTE: Safe-Level-Synthetic Minority Over-Sampling TEchnique for Handling the Class Imbalanced Problem, pp. 475482. Springer, Berlin, Heidelberg, 2009.
  • 3. Chumphol Bunkhumpornpat and Krung Sinapiromsaran. Core: Core-based synthetic minority over-sampling and borderline majority under-sampling technique. Int. J. Data Min. Bioinformatics, 12(1): 4458, April 2015.
  • 4. Chumphol Bunkhumpornpat, Krung and Sinapiromsaran, and ChidchanokLursinsap. Mute: Majority under-sampling technique. In Information, Communications and Signal Processing (ICICS) 2011 8th International Conference on, pages 14, Dec 2011.
  • 5. Nitesh V. Chawla, Kevin W. Bowyer, Lawrence O. Hall, and W. Philip Kegelmeyer. Smote: Synthetic minority over-sampling technique. Journal of Artificial Intelligence Research, 16:321357, 2002.
  • 6. Hui Han, Wen-Yuan Wang, and Bing-Huan Mao. Advances in Intelligent Computing: International Conference on Intelligent Computing, ICIC 2005, Hefei, China, August, 23-26, 2005, Proceedings, Part I, chapter Borderline-SMOTE: A New Over-Sampling Method in Imbalanced Data Sets Learning, pp. 878-887. Springer, Berlin Heidelberg, 2005.
  • 7. Jerzy Stefanowski, Szymon Wilk. DataWarehousing and Knowledge Discovery: 10th International Conference, DaWaK 2008 Turin, Italy, September 2-5, 2008 Proceedings, chapter Selective Pre-processing of Imbalanced Data for Improving Classification Performance, pages 283292. Springer, Berlin, Heidelberg, 2008.
  • 8. UC Irvine Machine Learning Repository, http://archive.ics.uci.edu/ml/, (accessed 20.05.2016).
Uwagi
EN
1. This work was performed in the framework of the grant S/WI/2/2013 (Bialystok University of Technology), founded by the Polish Ministry of Science and Higher Education. 2. Błąd w tytule w języku polskim. 3. Opracowanie rekordu w ramach umowy 509/P-DUN/2018 ze środków MNiSW przeznaczonych na działalność upowszechniającą naukę (2019).
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-2827664a-d3a7-4cc2-803e-790b5f9c9fb9
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.