The aim of the article is to indicate the possibility of using text analysis for the research of dynamics of the Polish capital market. The first part of the article notes the changes which took place within the data market in recent years and their impact on the discounting of information by stock market investors. The Information Effectiveness Hypothesis and the paradigm of behavioural finance are the basis of theoretical considerations. The second part presents the result of a study, the objective of which was to build an algorithm allowing the prediction of the WIG20 index rates of return based on text data. The test sample consisted of 901 papers published in the “Parkiet” magazine and 748 daily rates of return. The study was conducted using algorithms processing natural language and decision trees used for classification. The results of the study allowed an indication of a model in which the precision and accuracy indicators exceeded a score of 50%
PL
Celem artykułu jest wskazanie możliwości wykorzystania analizy tekstu do badań nad dynamiką polskiego rynku kapitałowego. W pierwszej części artykułu opisano zmiany, jakie w ostatnich latach nastąpiły na rynku danych, oraz ich wpływ na dyskontowanie informacji przez inwestorów giełdowych. U podstaw teoretycznych rozważań leży klasyczna hipoteza efektywności informacyjnej oraz paradygmat finansów behawioralnych. W drugiej części artykułu przedstawiono wyniki badania, którego celem było zbudowanie algorytmu umożliwiającego przewidywanie stóp zwrotu indeksu WIG20 na podstawie danych tekstowych. Próba badawcza składa się z 901 artykułów czasopisma Parkiet, które zawierały w tytułach sformułowanie „WIG20”, oraz 748 dziennych stóp zwrotu. Badanie przeprowadzono z wykorzystaniem algorytmów przetwarzania języka naturalnego oraz drzew decyzyjnych. Wskazano model, którego wskaźniki precyzji i dokładności przekraczały 50%.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.