PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Selektywny wybór przykładów w konstrukcji klasyfikatorów z niezrównoważonych danych

Autorzy
Identyfikatory
Warianty tytułu
EN
Selective filtering for learning classifiers from imbalanced data
Konferencja
Konferecja: INFORMATYKA - SZTUKA CZY RZEMIOSŁO, Złotniki Lubańskie, 19-22 czerwca 2006
Języki publikacji
PL
Abstrakty
PL
W artykule omawia się problemy automatycznego konstruowania klasyfikatorów, będących zbiorem reguł decyzyjnych, z niezrówno-ważonych danych, w których klasa obiektów, będących przedmiotem szczególnego zainteresowania, zawiera zdecydowanie mniej przykładów niż inne klasy. W celu polepszenia zdolności rozpoznawania przykładów z klasy mniejszościowej przedstawia się propozycje wykorzystania selektywnego wyboru przykładów z klasy większościowej przed fazą indukcji reguł. Podejście jest ocenione w eksperymentach porównawczych ze innymi metodami.
EN
This paper concerns problems of automatic learning rule based classifiers from imbalanced data, where the minority class of primary importance is underrepresented in comparison to majority classes. To improve recognition of the minority class, we present the new approach, where the rule induction is combined with the selective filtering phase that removes noisy and borderline majority class examples from the input data. This approach is evaluated in a comparative experimental study.
Wydawca
Rocznik
Strony
65--67
Opis fizyczny
Bibliogr. 12 poz.
Twórcy
Bibliografia
  • [1] Batista G., Prati R., Monard M.: A study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD Explorations Newsletters, Vol. 6 no. 1, 2004, 20-29.
  • [2] Blake C., Koegh E., Mertz C. J.: Repository of Machine Learning, University of California at Irvine. See the WWW link [http://www.ics.uci.edu/~mlearn/MLRepositoru.html].
  • [3] Chawla N., Bowyer K., Hall L., Kegelmeyer W.: SMOTE: Synthetic Minority Over-sampling Technique. Journal of Artificial Intelligence Re-search, vol. 16, 2002, 341-378.
  • [4] Grzymala-Busse J. W., Goodwin L. K., Grzymala-Busse W. J., Zheng X.: An approach to imbalanced data sets based on changing rule strength. In: Proc. of the AAAI Workshop Learning from Imbalanced Data Sets at the 17th Conference on AI, AAAI-2000, Austin, July 30-31, 2000, 69-74.
  • [5] Grzymala-Busse J. W., Stefanowski J. Wilk Sz: A comparison of two ap-proaches to data mining from imbalanced data. In: Proc. of the KES 2004 - 8-th Int. Conf. on Knowledge-based Intelligent Information & Engineering Systems, Springer LNCS vol. 3213, 2004, 757-763.
  • [6] Kubat M., Matwin S.: Addressing the curse of imbalanced training sets: one-side selection. In: Proc. of 14th Int. Conf. on Machine Learning, 1997, 179-186.
  • [7] Laurikkala J.: Improving identification of difficult small classes by balancing class distribution. Technical Report A-2001-2, University of Tampere, 2001.
  • [8] Stefanowski J.: The rough set based rule induction technique for classification problems. In: Proc. of 6th European Conf. on Intelligent Techniques and Soft Computing EUFIT'98, Aachen 7-10 Sept. 1998, 109-113.
  • [9] Stefanowski J.: Algorithms of rule induction for knowledge discovery (In Polish). Habilitation Thesis published as Series “Rozprawy”, no. 361, Poznań, University of Technology Press, Poznań, 2001.
  • [10] Stefanowski J., Wilk Sz.: Combining rough sets and rule based classifiers for handling imbalanced data. Proceedings of the XIV Concurrency Speci-fication & Programming Conference - CS&P 2005, vol. 2. 2005, 497-508.
  • [11] Weiss G.: Mining with rarity: a unifying framework. ACM SIGKDD Explorations Newsletter, vol. 6, no. 1, 2004, 7-19.
  • [12] Wilson D. R., Martinez T., Reduction techniques for instance-based learning algorithms. Machine Learning Journal, vol. 38, 2000, 257-286.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BSW4-0026-0005
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.