Czasopismo
2020
|
R. 96, nr 9
|
108--113
Tytuł artykułu
Autorzy
Wybrane pełne teksty z tego czasopisma
Warianty tytułu
Podejście do tworzenia zespołu w hierarchii klastrów z wykorzystaniem korelacji decyzji modelowych
Języki publikacji
Abstrakty
In the article, an approach based on clustering is proposed, according to which the influence of an individual model is inversely proportional to the volumes of aggregated groups. With this approach, the influence of an individual solution of the model, which differs from others, is significantly increased. Aggregation of groups is made in direct proportion to the correlation of decisions. Moreover, the aggregation of groups of models is performed according to the hierarchical structure of the ensemble. The solutions of strongly correlated groups of models are replaced by a single cluster solution. This solution at the next level can be grouped with other closest groups of models. Due to this architecture, the level of influence of a single solution of the model is increased. The main advantage of the proposed approach is the determination of the structure of the ensemble depending on the correlation of model decisions. Clusterization of decisions for features of similarity enhances the role of diversity and allows levelling out the error of an individual decision at a local level and to provide acceptable global indicators of cluster efficiency. Advantage of the proposed approach is the possibility of building an ensemble based on the properties of the correlation parameters.
W artykule zaproponowano podejście oparte na grupowaniu, zgodnie z którym wpływ modelu indywidualnego jest odwrotnie proporcjonalny do wielkości grup zagregowanych. Dzięki takiemu podejściu wpływ indywidualnego rozwiązania modelu, różniącego się od innych, jest znacząco zwiększony. Agregacja grup jest dokonywana w sposób wprost proporcjonalny do korelacji decyzji. Ponadto agregacja grup modeli odbywa się zgodnie z hierarchiczną strukturą zespołu. Rozwiązania silnie skorelowanych grup modeli są zastępowane przez jedno rozwiązanie klastrowe. Rozwiązanie to na kolejnym poziomie może być grupowane z innymi najbliższymi grupami modeli. Ze względu na taką architekturę zwiększa się poziom wpływu pojedynczego rozwiązania modelu. Główną zaletą proponowanego podejścia jest określenie struktury zespołu w zależności od korelacji decyzji modelowych. Klasteryzacja decyzji dla cech podobieństwa zwiększa rolę różnorodności i pozwala na wyrównanie błędu pojedynczej decyzji na poziomie lokalnym oraz zapewnienie akceptowalnych globalnych wskaźników efektywności klastra. Zaletą proponowanego podejścia jest możliwość budowania zespołu w oparciu o właściwości parametrów korelacji.
Czasopismo
Rocznik
Tom
Strony
108--113
Opis fizyczny
Bibliogr. 18 poz., rys., tab.
Twórcy
autor
- National University of Khmelnytsk, Ukraine, barmakov@khnu.km.ua
autor
- Lublin University of Technology, Poland, waldemar.wojcik@pollub.pl
autor
- National University of Khmelnytsky, Ukraine, barmakov@khnu.km.ua
autor
- Taras Shevchenko National University of Kyiv, Ukraine, krak@univ.kiev.ua
- V.M. Glushkov Institute of Cybernetics of NAS of Ukraine
autor
- V.M. Glushkov Institute of Cybernetics of NAS of Ukraine, kulyas@nas.gov.ua
autor
- Ternopil National Economic University, pugach.vitalina@gmail.com
autor
- Kazakh Academy of Transport & Communication, Kazakhstan, samat_1989@mail.ru
autor
- Kazakh Academy of Transport & Communication, Kazakhstan, aisha_1292@mail.ru
Bibliografia
- [1] Cunningham P., Carney J., Diversity versus quality in classification ensembles based on feature selection. ECML. Springer, (2000), 109–116
- [2] Andiojaya A., Demirhan H., A bagging algorithm for the imputation of missing values in time series. Expert Systems with Applications, 129 (2019), 10-26
- [3] Chen T., Guestrin C., Xgboost: A scalable tree boosting system. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, (2016), 785-794
- [4] Pavl yshenko B., Using Stacking Approaches for Machine Learning Models. In 2018 IEEE Second International Conference on Data Stream Mining & Processing (DSMP), (2018), 255-258
- [5] Cavalcanti G.D., Oliveira L.S., Moura T.J., Carvalho G.V., Combining diversity measures for ensemble pruning. Pattern Recognition Letters, 74 (2016), 38-45
- [6] Shipp C.A., Kuncheva L.I., Relationships between combination methods and measures of diversity in combining classifiers. Information fusion, 3(2), (2002), 135-148
- [7] Brusco M.J., Cradit J.D., Steinley D., Combining diversity and dispersion criteria for anticlustering: A bicriterion approach. British Journal of Mathematical and Statistical Psychology, (2020), doi:10.1111/bmsp.12186.
- [8] Ahmed M.A. O., Didaci L., Lavi B., Fumera G., Using diversity for classifier ensemble pruning: an empirical investigation. Theoretical and Applied Informatics, 29 (2017), 25-39.
- [9] Bian Y., Wang Y., Yao Y., Chen H., Ensemble Pruning Based on Objection Maximization With a General Distributed Framework, IEEE transactions on neural networks and learning systems, (2019), doi: 10.1109/tnnls.2019.2945116
- [10] Soares R.G., Chen H., Yao X., A cluster-based semi supervised ensemble for multiclass classification, IEEE Transactions on Emerging Topics in Computational Intelligence, 1(6) (2017), 408-420
- [11] Dong X., Yu Z., Cao W., Shi Y., Ma Q., A survey on ensemble learning. Frontiers of Computer Science, 14(2) (2020), 241-258
- [12] Krak I., Barmak O., Manziuk E., Using visual analytics to develop human and machine-centric models: A review of approaches and proposed information technology, Computational Intelligence, (2020), 1-26
- [13] Manziuk E.A., Barmak A.V., K rak Yu.V., Kas ianiuk V.S., Definition of information core for documents classification, Journal of AIS, 50 (4) (2018), 25-34
- [14] Nosova Y., Shushliapina N., Kostishyn S.V., Koval, L.G., et al., The use of statistical characteristics of measured signals to increasing the reliability of the rhinomanometric diagnosis, Proc. SPIE, 10031 (2016).
- [15] Smolarz A., Wojcik W., Gromaszek K., Fuzzy modeling for optical sensor for diagnostics of pulverized coal burner, 26th European Conference on Solid-State Transducers (Eurosensors), Krakow, Poland, (2012), Sep 09-12.
- [16] Barmak A.V., Krak Y.V., Manziuk E.A., Kasianiuk V.S., Information Technology of Separating Hyperplanes Synthesis for Linear Classifiers. Journal of AIS, 51(5) (2019), 54-64
- [17] Al Darwich, R., Babout, L., & Strzecha, K. K-means clustering in textured image: example of lamellar microstructure in titanium alloys. Informatyka, Automatyka, Pomiary W Gospodarce I Ochronie Środowiska, 7(2019), No. 3, 43-46.
- [18] Krak I., Barmak O., Manziuk E., Kulias A., Data Classification Based on the Features Reduction and Piecewise Linear Separation. In International Conference on Intelligent Computing & Optimization, (2019), 282-289
Uwagi
Opracowanie rekordu ze środków MNiSW, umowa Nr 461252 w ramach programu "Społeczna odpowiedzialność nauki" - moduł: Popularyzacja nauki i promocja sportu (2020).
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.baztech-7b892b7b-4bb1-4d07-955c-847deba65b92