Identyfikatory
Warianty tytułu
Adaptacyjne modelowanie przestrzennego zróżnicowania jednostek klasyfikacyjnych gleb
Języki publikacji
Abstrakty
The article presents the results of attempts to use adaptive algorithms for classification tasks different soils units. The area of study was the Upper Silesian Industrial Region, which physiographic and soils parameters in the form of digitized was used in the calculation. The study used algorithms, self-organizing map (SOM) of Kohonen, and classifiers: deep neural network, and two types of decision trees: Distributed Random Forest and Gradient Boosting Machine. Especially distributed algorithm Random Forest (algorithm DRF) showed a very high degree of generalization capabilities in modeling complex diversity of soil. The obtained results indicate, that the digitization of topographic and thematic maps give you a fairly good basis for creating useful models of soil classification. However, the results also showed that it cannot be concluded that the best algorithm presented in this research can be regarded as a general principle of system design inference.
Wraz z rozwojem technologii informatycznych następuje stopniowa zmiana podejścia do dokumentacji kartograficznej obiektów przyrodniczych, w tym gleb. Podstawowymi cechami dowolnej klasyfikacji, których przedmiotem są gleby, jest wielowymiarowość jednostek (nie ma pojedynczej właściwości, możliwej do wyznaczenia w drodze pomiaru, która wystarczałaby do jednoznacznego przypisania pedonu do określonej klasy w stosowanych skalach klasyfikacyjnych gleb), w związku z czym właściwe wydaje się wykorzystanie do tego celu dostępnych komputerowych metod przetwarzania danych. Modelowanie przestrzennego zróżnicowania gleb na podstawie przesłanek natury fizjograficznej, odtworzonych na podstawie digitalizacji istniejących materiałów kartograficznych, jest podstawą do tworzenia przestrzennych baz danych przechowywanych w wersji cyfrowej. Inaczej niż w typowej kartografii tematycznej zawierającej treści glebowo-siedliskowe, modele te wskazują na prawdopodobieństwo a priori występowania określonej jednostki glebowej w określonym położeniu, nie zaś bezwzględną przynależność terenu do niej. Taka interpretacja wymaga zbudowania stosownego algorytmu wiążącego czynniki natury geologicznej i fizjograficznej z jednostkami glebowymi. Do tego celu często wykorzystuje się tak zwane algorytmy adaptacyjne, umożliwiające elastyczne tworzenie modeli zależności bazujących na danych. W pracy przedstawiono dwa warianty doboru parametrów przetwarzania danych fizjograficzno-glebowych potencjalnie przydatnych do tych celów. Wykorzystano dane pochodzące z bazy danych fizjograficznoglebowych z rejonu GOP (Górnośląski Okręg Przemysłowy) uzyskanych w wyniku digitalizacji materiałów kartograficznych. Analizie poddano wyłącznie tereny użytków rolnych: gruntów ornych (R) i trwałych użytków zielonych (Ł i Ps). Na obszarze o powierzchni 1 km2 wyodrębniono 6,4 mln jednostek tworzących siatkę kwadratów o rozmiarach 20 × 20 m. Wykorzystane zostały algorytmy samoorganizującej mapy (SOM) Kohonena oraz klasyfikatory – głęboka sieć neuronowa, oraz dwa rodzaje drzew decyzyjnych – rozproszony las losowy (ang. Distributed Random Forest) i wzmacniane drzewa losowe (ang. Gradient Boosting Machine). Szczególnie algorytm rozproszonego lasu losowego (algorytm DRF) wykazał bardzo wysoki stopień zdolności generalizacyjnej w modelowaniu zróżnicowania kompleksów glebowych.
Wydawca
Czasopismo
Rocznik
Tom
Strony
127--139
Opis fizyczny
Bibliogr. 19 poz., rys., tab.
Twórcy
autor
- AGH University of Science and Technology, Faculty of Mining Surveying and Environment Engineering, Department of Environmental Management and Protection, al. Mickiewicza 30, 30-059 Kraków, Poland
autor
- AGH University of Science and Technology, Faculty of Mining Surveying and Environment Engineering, Department of Environmental Management and Protection, al. Mickiewicza 30, 30-059 Kraków, Poland
Bibliografia
- ABE S. 2010. Support vector machines for pattern classification. New York. Springer Verlag. ISBN 978-1-84996-098-4 pp. 473.
- BALDI P., BRUNAK S., CHAUVIN Y., ANDERSEN C., NIELSEN H. 2000. Assessing the accuracy of prediction algorithms for classification: an overview. Bioinformatics. Vol. 16 p. 412–424.
- BREIMAN L., FRIEDMAN J.H., OLSHEN R.A., STONE C.J. 1984. Classification and regression trees. Wadsworth, Belmont. ISBN 0-412-04841-8 pp. 368.
- CANDEL A., PARMAR V., LEDELL E., ARORA A. 2015. Deep learning with H2O [online]. [Access 05.02.2016]. Available at: https://h2o-release.s3.amazonaws.com/h2o/relslater/9/docs-website/h2o-docs/booklets/DeepLearning_Vignette.pdf
- CHMIELNICKI W., STĄPOR K., ROTERMAN-KONIECZNA I. 2010. An efficient multi-class support vector machine classifier for protein fold recognition. Advances in Intelligent and Soft Computing. Vol. 74 p. 77–84.
- CLICK C., MALOHLAVA M., PARMAR V., ROARK H., CANDEL A. 2015. Gradient boosted models with H2O [online]. [Access 05.02.2016]. Available at: https://h2o-release.s3.amazonaws.com/h2o/rel-slater/9/docs-website/h2odocs/booklets/GBM_Vignette.pdf
- DEHZANGI A., PHON-AMNUAISUK S., DEHZANGI O. 2010. Using random forest for protein fold predition problem: An empirical study. Journal of Information Science and Engineering. Vol. 26. No. 6 p. 1941–1956.
- DOBOS E., CARRÉ F., HENGL T., REUTER H.I., TÓTH G. 2006. Digital Soil Mapping as a support to production of functional maps. EUR 22123 EN. Office for Official Publications of the European Communities. Luxembourg pp. 68.
- FRIEDMAN J. 2001. Greedy function approximation: A gradient boosting machine. Annals of Statistics. Vol. 29. Iss. 5 p. 1189–1232.
- GISLASON P.O., BENEDIKTSSON J.A., SVEINSSON J.R. 2006. Random forests for land cover classification. Pattern Recognition Letters. Vol. 27. Iss. 3 p. 294–300.
- JENNY H. 1941. Factors of soil formation – A system of quantitative pedology. New York, USA. McGraw-Hill pp. 281.
- JONES A., MONTANARELLA L., JONES R. (ed.) 2005. Soil atlas of Europe. Luxembourg. Office for Official Publications of the European Communities pp. 128.
- LANDGREBE T.C.W., DUIN R.P.W. 2007. Approximating the multiclass ROC by pairwise analysis. Pattern Recognition Letters. Vol. 28. Iss. 13 p. 1747–1758.
- LECUN Y., BENGIO Y., HINTON G.E. 2015. Deep learning. Nature. Vol. 521 p. 436–444.
- MCBRATNEY A.B., MENDONÇA SANTOS M.L., MINASNY B. 2003. On digital soil mapping. Geoderma. Vol. 117. Iss. 1–2 p. 3–52.
- NATEKIN A., KNOLL A. 2013. Gradient boosting machines, a tutorial. Frontiers in Neurorobotics. Vol. 7. Article 21. DOI 10.3389/fnbot.2013.00021.
- STRZEMSKI M., BARTOSZEWSKI Z., CZARNOWSKI F., DOMBEK E., SIUTA J., TRUSZKOWSKA R., WITEK T. 1964. Instrukcja w sprawie wykonywania map glebowo-rolniczych w skali 1: 5000 i 1: 25000 oraz map glebowo-przyrodniczych w skali 1: 25000. Załącznik do Zarządzenia nr 115 Ministra Rolnictwa z dnia 28 lipca 1964 r. w sprawie organizacji prac gleboznawczo- i rolniczo-kartograficznych. Dz. Urz. Min. Rol. Nr 19 poz. 121.
- TADEUSIEWICZ R. 1993. Sieci neuronowe [Neural networks]. Warszawa. Akademicka Oficyna Wydawnicza. ISBN 83-85769-03-X pp. 195.
- ZHU A.X., HUDSON B., BURT J., LUBICH K., SIMONSEN D. 2001. Soil mapping using GIS, expert knowledge, and fuzzy logic. Soil Science Society of America Journal. Vol. 65. Iss. 5 p. 1463–1472.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-ddba10e4-0b60-454d-ab02-87a239b7af9f