PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Forecasting stock index movement direction with CPL linear classifier

Autorzy
Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Prognozowanie kierunku zmiany indeksów giełdowych za pomocą klasyfikatora liniowego typu CPL
Języki publikacji
EN
Abstrakty
EN
Stocks, indexes, commodities, and precious metals price prediction is a difficult task where many approaches are used: traditional technical analysis, econometric time series or modern data mining techniques. One particular data mining technique - linear classifier is described in this article. Prediction based on linear classifier is done using current market state, which can be described by various data sets (attributes, features). The simplest form of this model could use data from yesterday’s price movement. Advanced models are using more historical price movements. Very advanced models include various historical price movements for indexes from other countries and other instruments like currencies, commodities, etc. Using more features requires extended time to estimate model parameters.We build the linear classifier models by the minimisation of a convex and piecewise-linear function which is very efficient comparing to other functions. Computational costs for building the model are similar to linear programming. We also use feature selection method called RLS. Those techniques allow us to explore data with many features. Four scenarios are considered, in each scenario a different amount of market data is used to create a model. In the simplest scenario only one day’s change in price is taken, in the most complicated one 421 historical prices of 43 different instruments are taken. Best results were achieved by using middle range of 52 attributes. In this scenario, the model was right 53.19% times. Meaning the directions of daily change in S&P500 index (up or down) were predicted correctly. This doesn’t seem a lot, but if those predictions would have been used for investing, they could produce a total profit of 77% in the tested time period from November 2008 to March 2011 (2 years 4 months), or an average of 28% per year.
PL
Prognozowanie cen akcji i wartośsci indeksów giełdowych jest zadaniem trudnym, dla którego użzywanych jest wiele różnych podejść. Artykuł ten przedstawia wprowadzenie do pewnych standardowych technik. Przedstawiona została tradycyjna analiza techniczna, ekonometryczne modele szeregów czasowych oraz współczesne metody eksploracji danych. Jedna z metod eksploracji danych, klasyfikator liniowy został przedstawiony bardziej szczegółowo. Został on użyty w przeprowadzonym eksperymencie do prognozowania wartości indeksu giełdy amerykańskiej. Prognozowanie takie oparte jest o dane opisujące obecny stan giełdy. Stan giełdy można opisać różną ilością danych (atrybutów, cech). W najprostszym przypadku może to być tylko jednodniowa zmiana ceny prognozowanego indeksu. W bardziej rozbudowanym modelu można użyć wielu cen historycznych. W modelu jeszcze bardziej rozbudowanym można użyć danych z innych giełd, kursów walut, cen towarów jak np. ropa. Użycie dużej ilości danych wymaga dłuższego czasu obliczeń parametrów modelu. W prezentowanym podejściu klasyfikator liniowy budowany jest w oparciu o minimalizację wypukłej i odcinkowo-liniowej funkcji kryterialnej. Metoda ta jest bardzo wydajna o koszcie zbliżonym do programowania liniowego. Dodatkowo użyta została metoda selekcji cech RLS. Techniki te pozwoliły na efektywną eksplorację danych o wielu wymiarach. W artykule przedstawiono cztery scenariusze o różnej ilości danych opisujących giełdę. W najprostszym użyto tylko jednej danej, w najbardziej rozbudowanym 421 danych o 43 instrumentach finansowych. Najlepsze wyniki uzyskano dla pośredniego modelu o 52 cechach, w którym model przewidział prawidłowo 53.19% kierunków dziennych zmian indeksu S&P500. Otrzymany wynik nie wydaje się być wysoki, jednak gdyby inwestowano w indeks zgodnie z modelem zysk z takich inwestycji wyniósłby 77% w okresie od października 2008 do marca 2011, dając średnio 28% zysku rocznie.
Rocznik
Tom
Strony
47--58
Opis fizyczny
Bibliogr. 24 poz., rys., tab.
Twórcy
autor
  • Bialystok University of Technology, Faculty of Computer Science, Białystok
Bibliografia
  • [1] Aizerman M., Braverman E., Rozonoer L., Theoretical foundations of the potential function method in pattern recognition learning, Automation and Remote Control 25, 1964.
  • [2] Bishop M., Neural networks for pattern recognition, Oxford University Press, 2005.
  • [3] Bobrowski L., Eksploracja danych oparta na wypukłych i odcinkowoliniowych funkcjach kryterialnych, Wydawnictwa Politechniki Białostockiej, 2005.
  • [4] Bobrowski L., Łukaszuk T., Feature selection based on relaxed linear separability, Biocybernetics and Biomedcal Engineering, Volume 29,Number 2, 2009, pp. 43-59.
  • [5] Bollerslev T., Generalized Autoregressive Conditional Heteroskedasticity, Journal of Econometrics, 31, 1986, pp. 307-327.
  • [6] Box G.E.P, Jenkins G.M., Analiza szeregów czasowych, Państwowe Wydawnictwo Naukowe, 1983.
  • [7] Cortes C. Vapnik, V., Support-Vector Networks, Machine Learning, 20, 1995.
  • [8] Duda O.R., Hart P.E., Stork D.G., Pattern Classification, J. Wiley, New York, 2001.
  • [9] Edwards R.D., Magee J., Technical Analysis of Stock Trends, AMACOM, 7th edition, 1997.
  • [10] Egeli B., Ozturan M., Badur B., Stock Market Prediction Using Artificial Neural Networks, Proceedings of the 3rd International Conference on Business, 2003.
  • [11] Engle R.F., Autoregressive Conditional Heteroskedasticity with the Estimates of the Variance of U.K. Inflation, Econometrica, 50, No. 4, 1982, pp. 987-1007.
  • [12] Hamilton J.D., Time Series Analysis, Princeton University Press, 1994.
  • [13] Huang W., Nakamoria Y., Wangb S.Y., Forecasting stock market movement direction with support vector machine, Computers & Operations Research Vol. 32, Issue 10, 2005, pp. 2513-2522.
  • [14] Khatimlianskii A., Genetic Algorithms vs. Simple Search in the MetaTrader 4 Optimizer, [http://articles.mql4.com/361]
  • [15] Kim K.J., Financial time series forecasting using support vector machines, Neurocomputing Vol. 55, Issues 1-2, 2003, pp. 307-319.
  • [16] Kimoto T., Asakawa K., Yoda M., Takeoka M., Stock market prediction system with modular neural network, Proceedings of the International Joint Conference on Neural Networks, 1990, pp. 1-6.
  • [17] Krawczuk J., Bobrowski L., Short term prediction of stock indexes changes based on a linear classifier, Symulacja w badaniach i rozwoju, Vol. 1 nr 4/2010.
  • [18] Miller A., Subset selection in regression, Chapman & Hall/CRC, 2002.
  • [19] Mizuno H., Kosaka M., Yajima H., Komoda N., Application of Neural Network to Technical Analysis of Stock Market Prediction, Studies in Informatic and Control, Vol. 7, No. 3, 1998, pp. 111-120.
  • [20] Nison S., Japanese Candlestick Charting Techniques, Second Edition, Prentice Hall Press, 2nd edition, 2001.
  • [21] Poli R., Langdon W.B., McPhee N.F., A Field Guide to Genetic Programming, Lulu.com, 2008.
  • [22] Singhi S.K., Liu H., Feature Subset Selection Bias for Classification Learning, Proceedings of the 23 rd International Conference on Machine Learning, Pittsburgh, PA, 2006, pp. 849-856.
  • [23] Yang J., Honavar V., Feature subset selection using a genetic algorithm, Intelligent Systems and their Applications, IEEE, 1998.
  • [24] Zekic M., Neural Network Applications in Stock Market Predictions – A Methodology Analysis, Proceedings of the 9th International Conference on Information and Intelligent Systems, 1998, pp. 255-263.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPB1-0051-0004
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.