Wpływ liczby predyktorów na skuteczność algorytmów opartych na drzewach klasyfikacyjnych

Owczarek, T.; Sojda, A.; Kaczmarek, K.

Artykuł - szczegóły

Tytuł artykułu

Wpływ liczby predyktorów na skuteczność algorytmów opartych na drzewach klasyfikacyjnych

Autorzy

Owczarek T. , Sojda A. , Kaczmarek K.

Treść / Zawartość

Pełne teksty:

Pobierz

Identyfikatory

Warianty tytułu

The influence of number of predictors on accuracy of classification algorithms based on trees

Języki publikacji

Abstrakty

Współczesne organizacje, aby być konkurencyjne, muszą mieć umiejętności przetworzenia olbrzymich danych. Jednym z najbardziej obiecujących kierunków w tym zakresie jest wykorzystanie analityki predykcyjnej, opierającej się na algorytmach i modelach uczenia maszynowego. Związanych z tym jest wciąż wiele wyzwań, m.in. pytanie o „wejście” do takich modeli, czy powinny to być wszystkie dane zgromadzone przez organizację czy może raczej wcześniej wybrane zmienne? Celem artykułu jest zbadanie skuteczności algorytmów opartych na drzewach klasyfikacyjnych ze względu na liczebność predyktorów.

To stay competitive contemporary organizations have to master in processing massive amount of data. Predictive analytics, that is analytics based on machine learning algorithms and models, is one of the most promising directions. But there are many issues involved. One of them is the input to such models: should it be all data gathered by organization or just the selected variables? The aim of the article is to check how the number of predictors influences accuracy of classification algorithms based on trees.

Słowa kluczowe

klasyfikacja dobór zmiennych drzewo klasyfikacyjne analityka predykcyjna

classification feature selection classification trees predictive analytics

Wydawca

Wydawnictwo Politechniki Śląskiej

Czasopismo

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

Rocznik

2015

Tom

z. 86

Strony

507--517

Opis fizyczny

Bibliogr. 15 poz..

Twórcy

autor

Owczarek T.

tomasz.owczarek@polsl.pl

Politechnika Śląska. Wydział Organizacji i Zarządzania

autor

Sojda A.

adam.sojda@polsl.pl

Politechnika Śląska. Wydział Organizacji i Zarządzania

autor

Kaczmarek K.

konrad.kaczmarek@polsl.pl

Politechnika Śląska. Wydział Matematyki Stosowanej

Bibliografia

1. Breiman, L.: Random forests, Machine learning, Vol. 45, No. 1, 2001, p. 5-32.
2. Breiman L.: Statistical Modeling: The Two Cultures, Statistical Science, Vol. 16, No. 3, 2001, p. 199-231.
3. Brynjolfsson E., Lorin M.H., Kim H.H.: Strength in numbers: How does data-driven decisionmaking affect firm performance?, SSRN Electronic Journal, April 2011 (http://dx.doi.org/10.2139/ssrn.1819486).
4. Freund, Y., Schapire R.E.: Experiments with a new boosting algorithm, Proceedings of the Thirteenth International Conference on Machine Learning, 1996, p. 148-156.
5. Friedman, J.H.: Stochastic gradient boosting, Computational Statistics & Data Analysis Vol. 38, No. 4, 2002, p. 367-378.
6. Friedman J., Hastie T., Tibshirani R.: Additive Logistic Regression: A Statistical View of Boosting, The Annals of Statistics, Vol. 28, No. 2, p. 337-374.
7. Guyon I., Elisseeff A.: An Introdustion to Variable and Feature Selection, Journal of Machine Learning Research 3, 2003, p. 1157-1182.
8. Hand, D.J.: Classifier technology and the illusion of progress, Statistical science, Vol. 21, No. 1, 2006, p. 1-15.
9. Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, New York 2009.
10. Koch R.: From Business Intelligence to Predictive Analytics, Strategic Finance 96(7), 2015, p. 56-57.
11. Kuhn M., Johnson K.: Applied Predictive Modeling, Springer, New York, 2013.
12. Kursa M.B., Rudnicki W.R.: Feature Selection with Boruta Package, Journal of Statistical Software, Vol. 36, No. 11, 2010
13. Provost F., Fawcett T.: Data Science for Business, O'Reilly Media, 2013.
14. Schutt R., O'Neil C., Doing Data Science. Straight Talk from the Frontline, O'Reilly Media, 2014.
15. Wielki J.: Implementation of the Big Data concept in organizations – possibilities, impediments and challenges, Proceedings of the 2013 Federated Conference on Computer Science and Information Systems, 2013, p. 985–989.

Typ dokumentu

Bibliografia

Identyfikator YADDA

bwmeta1.element.baztech-ea3d719b-ea25-49ad-83ab-a654954d355d