A computer system presented in the paper is developed as a data mining tool-it allows using large databases as a source for the process of decision tree generation and visualisation. The designed system (DTB&V-Decision Tree Builder and Visualiser) is able to perform data preprocessing, generation of decision trees followed by their post-processing and visualisation. DTB&V was tested using a number of databases commonly employed for such tasks.
W pracy zbadano wydajność i produktywność programistyczną wykorzystania chmur obliczeniowych oraz dwu odmiennych środowisk programistycznych, a mianowicie SPARK i GASPI, do równoległej implementacji algorytmów eksplorujących duże zbiory danych na przykładzie algorytmu ID3 tworzenia drzew decyzyjnych. Implementacje uruchomiono na platformie Google Compute Engine.
EN
In this paper, the performance and programming productivity of cloud computing is explored for two different programming environments (SPARK and GASPI) applied to parallel implementation of big data problems. The ID3 algorithm of decision tree generation is selected as a test case. All the experiments are performed on the Google Compute Engine platform.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.