High concentrations of nitrogen dioxide in the air, particularly in heavily urbanized areas, have an adverse effect on many aspects of residents’ health. A method is proposed for modelling daily average, minimal and maximal atmospheric NO2 concentrations in a conurbation, using two types of modelling: multiple linear regression (LR) an advanced data mining technique – Random Forest (RF). It was shown that Random Forest technique can be successfully applied to predict daily NO2 concentration based on data from 2015–2017 years and gives better fi t than linear models. The best results were obtained for predicting daily average NO2 values with R2=0.69 and RMSE=7.47 μg/m3. The cost of receiving an explicit, interpretable function is a much worse fit (R2 from 0.32 to 0.57). Verification of models on independent material from the first half of 2018 showed the correctness of the models with the mean average percentage error equal to 16.5% for RF and 28% for LR modelling daily average concentration. The most important factors were wind conditions and traffic flow. In prediction of maximal daily concentration, air temperature and air humidity take on greater importance. Prevailing westerly and south-westerly winds in Wrocław effectively implement the idea of ventilating the city within the studied intersection. Summarizing: when modeling natural phenomena, a compromise should be sought between the accuracy of the model and its interpretability.
PL
Celem pracy jest zbadanie możliwości prognozowania dziennego stężenia NO2 za pomocą metody losowego lasu – RF i porównanie wyników z wielowymiarową regresją liniową (LR) w oparciu o ten sam zestaw danych. Ponadto zbadano wpływ zwiększenia interpretowalności modelu na jego dokładność. W pracy przedstawiono dwie metody modelowania dziennych wartości minimalnych, średnich oraz maksymalnych stężeń NO2 w aglomeracji miejskiej: wielowymiarowa regresja liniowa (LR) oraz losowy las (RF). Wykazano, że metoda Lasu Losowego (Random Forest) może być skutecznie wykorzystywana do przewidywania dziennych wartości stężenia NO2. Największą dokładność otrzymano dla przewidywania średnich wartości dziennych stężenia z R2=0.69 oraz RMSE=7.47 μg/m3. Kosztem otrzymania jawnej postaci funkcji w modeli liniowym (LR) jest znacząco niższa dokładność przewidywania wartości stężenia (R2 od 0.32 do 0.57). Weryfikacja modeli na niezależnym materiale z pierwszej połowy 2018 roku potwierdziła poprawność modeli ze średnim błędem względnym dla średnich wartości dobowych stężeń równym 16.5% dla RF oraz 28% dla LR. Największy wpływ na stężenia NO2 w kanionie komunikacyjnym ma wiatr oraz natężenie ruchu. W modelowaniu maksymalnych wartości dobowych nabierają znaczenia temperatura powietrza oraz wilgotność względna powietrza. Przeważające zachodnie i północno-zachodnie wiatry we Wrocławiu skutecznie realizują koncepcję przewietrzania miasta w zakresie rozważanego skrzyżowania.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.