PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Wpływ liczby predyktorów na skuteczność algorytmów opartych na drzewach klasyfikacyjnych

Treść / Zawartość
Identyfikatory
Warianty tytułu
EN
The influence of number of predictors on accuracy of classification algorithms based on trees
Języki publikacji
PL
Abstrakty
PL
Współczesne organizacje, aby być konkurencyjne, muszą mieć umiejętności przetworzenia olbrzymich danych. Jednym z najbardziej obiecujących kierunków w tym zakresie jest wykorzystanie analityki predykcyjnej, opierającej się na algorytmach i modelach uczenia maszynowego. Związanych z tym jest wciąż wiele wyzwań, m.in. pytanie o „wejście” do takich modeli, czy powinny to być wszystkie dane zgromadzone przez organizację czy może raczej wcześniej wybrane zmienne? Celem artykułu jest zbadanie skuteczności algorytmów opartych na drzewach klasyfikacyjnych ze względu na liczebność predyktorów.
EN
To stay competitive contemporary organizations have to master in processing massive amount of data. Predictive analytics, that is analytics based on machine learning algorithms and models, is one of the most promising directions. But there are many issues involved. One of them is the input to such models: should it be all data gathered by organization or just the selected variables? The aim of the article is to check how the number of predictors influences accuracy of classification algorithms based on trees.
Rocznik
Tom
Strony
507--517
Opis fizyczny
Bibliogr. 15 poz..
Twórcy
autor
  • Politechnika Śląska. Wydział Organizacji i Zarządzania
autor
  • Politechnika Śląska. Wydział Organizacji i Zarządzania
autor
  • Politechnika Śląska. Wydział Matematyki Stosowanej
Bibliografia
  • 1. Breiman, L.: Random forests, Machine learning, Vol. 45, No. 1, 2001, p. 5-32.
  • 2. Breiman L.: Statistical Modeling: The Two Cultures, Statistical Science, Vol. 16, No. 3, 2001, p. 199-231.
  • 3. Brynjolfsson E., Lorin M.H., Kim H.H.: Strength in numbers: How does data-driven decisionmaking affect firm performance?, SSRN Electronic Journal, April 2011 (http://dx.doi.org/10.2139/ssrn.1819486).
  • 4. Freund, Y., Schapire R.E.: Experiments with a new boosting algorithm, Proceedings of the Thirteenth International Conference on Machine Learning, 1996, p. 148-156.
  • 5. Friedman, J.H.: Stochastic gradient boosting, Computational Statistics & Data Analysis Vol. 38, No. 4, 2002, p. 367-378.
  • 6. Friedman J., Hastie T., Tibshirani R.: Additive Logistic Regression: A Statistical View of Boosting, The Annals of Statistics, Vol. 28, No. 2, p. 337-374.
  • 7. Guyon I., Elisseeff A.: An Introdustion to Variable and Feature Selection, Journal of Machine Learning Research 3, 2003, p. 1157-1182.
  • 8. Hand, D.J.: Classifier technology and the illusion of progress, Statistical science, Vol. 21, No. 1, 2006, p. 1-15.
  • 9. Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Springer, New York 2009.
  • 10. Koch R.: From Business Intelligence to Predictive Analytics, Strategic Finance 96(7), 2015, p. 56-57.
  • 11. Kuhn M., Johnson K.: Applied Predictive Modeling, Springer, New York, 2013.
  • 12. Kursa M.B., Rudnicki W.R.: Feature Selection with Boruta Package, Journal of Statistical Software, Vol. 36, No. 11, 2010
  • 13. Provost F., Fawcett T.: Data Science for Business, O'Reilly Media, 2013.
  • 14. Schutt R., O'Neil C., Doing Data Science. Straight Talk from the Frontline, O'Reilly Media, 2014.
  • 15. Wielki J.: Implementation of the Big Data concept in organizations – possibilities, impediments and challenges, Proceedings of the 2013 Federated Conference on Computer Science and Information Systems, 2013, p. 985–989.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ea3d719b-ea25-49ad-83ab-a654954d355d
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.