PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

Application of machine learning for prediction a methane concentration in a coal-mine

Autorzy
Wybrane pełne teksty z tego czasopisma
Identyfikatory
Warianty tytułu
PL
Zastosowanie algorytmu maszynowego uczenia do predykcji stężenia metanu w kopalni węgla kamiennego
Języki publikacji
EN
Abstrakty
EN
Applications of machine learning methods for creation rule-based data model used in prediction of a methane concentration in the excavation are described in the paper. Data coming from a methane concentration monitoring system and methodology of their transformation into a form acceptable by analytic algorithms that have been used are presented in the second chapter. Next chapter describes the rules induction algorithm used for prediction. Results of the analysis that has been performed on data coming from a coal-mine are presented at the end of the paper.
PL
W artykule przedstawiono pomysł zastosowania inteligentnych technik komputerowych do eksploracyjnej analizy danych pochodzących z systemu monitorowania zagrożeń związanych z wydzielaniem metanu w kopalniach węgla kamiennego. Celem stawianym zastosowanym metodom analitycznym jest predykcja stężenia metanu mierzonego przez wybrany metanomierz z wyprzedzeniem dziesięciominutowym i godzinnym. Spośród różnych metodologii generowania systemów umożliwiających predykcję (m.in. systemy rozmyte, sztuczne sieci neuronowe, metody statystyczne) w artykule wybrano algorytm indukcji reguł o konkluzjach w postaci funkcji liniowych. Przedstawiony algorytm charakteryzuje się jednym z najszybszych czasów analizy oraz dobrymi wynikami predykcji uzyskiwanymi na ogólnodostępnych danych benchmarkowych. Istotną cechą zastosowanego algorytmu jest również to, że wyniki analizy, a więc syntetyczny opis analizowanego zbioru danych jest stosunkowo łatwy do interpretacji przez użytkownika. Z punktu widzenia dziedziny znanej jako odkrywanie wiedzy, w bazach danych jest to bardzo istotna cecha. Dane poddane analizie pochodziły z wyrobiska znajdującego się na kopalni niezagrożonej tąpnięciami. Na rysunku pierwszym przedstawiono schemat rejonu, w którym znajduje się rozważane przez nas wyrobisko, widoczne jest tam również rozmieszczenie czujników. Graficzna analiza szeregów czasowych odzwierciedlających wskazania metanomierzy i anemometrów (rys. 2) wykazała, że największą dynamikę stężenia metanu obserwuje się na wylocie ze ściany. W badaniach podjęto zatem próbę predykcji wskazań metanomierza M32. Dane pomiarowe zbierane były z dziesięciosekundowym interwałem czasowym. Do celów badań dane poddano agregacji tworząc dwa zbiory danych, w których kolejne rekordy zawierały: maksymalne wartości mierzonych wartości w okresach jednominutowych (był to zbiór danych dla predykcji dziesięciominutowej), maksymalne wartości mierzonych wartości w okresach dziesięciominutowych (był to zbiór danych dla predykcji godzinowej). W celu umożliwienia zastosowania metod analitycznych wykorzystujących paradygmat maszynowego uczenia, dostępny zbiór danych należało poddać modyfikacjom. Dane pobrane z systemu monitorowania reprezentowane są przez zbiór rekordów, pomiędzy którymi istnieje związek temporalny, tymczasem zastosowany w artykule algorytm analizuje tabele, w których każdy wiersz jest niezależny. Zatem, informacja o stanie danego procesu w danej chwili czasu (w tym o dynamice zmian parametrów opisujących ten proces) musi być zawarta w jednym wierszu. W rozdziale drugi przedstawiono sposób, w jaki możliwe jest przejście z reprezentacji danych uzyskanych wprost z systemu monitorowania (Tab. l) do reprezentacji akceptowanej przez wykorzystany algorytm analityczny (Tab. 2). W rozdziale drugim wyspecyfikowano także zbiór zmiennych niezależnych: AN31 - wska7JInia anemometru AN31; AN32 - wskazania anemometru AN32; MM32 - wskazania metanomierza MM32; Wydobycie, DAN31 - suma wskazań AN31 za ostatnie dziesięć minut; DAN32 - suma wskazań AN32 za ostatnie dziesięć minut; DMM32 - suma wskazań MM32 za ostatnie dziesięć minut. Zmiennej zależnej nadano nazwę MM32_Pred. W rozdziale trzecim dokładnie opisano zastosowany algorytm analityczny, który umożliwia generowanie reguł o liniowych konkluzjach (I). Algorytm buduje regułę w taki sposób, aby część warunkowa reguły opisywała jak największa liczbę obiektów ze zbioru treningowego (2) przy jednoczesnym ograniczeniu wariancji zmiennej zależnej. Wielowymiarowy model liniowy pozwalający dla danej reguły wyznaczyć wartość zmiennej zależnej znajduje się w jej konkluzji. Algorytm jest heurystyczny i jako kryterium optymalności w czasie budowy reguły wykorzystuje wyrażenie (3). W rozdziale trzecim omówiono także metody optymalizacji (w tym upraszczania) otrzymanego regułowego modelu danych. Rozdział czwarty zawiera wyniki przeprowadzonych analiz. Analizę prowadzono na wydzielonych zbiorach danych, efektywność wyznaczonych modeli sprawdzono na niezależnych zbiorach testowych. Obiektywną miarą efektywności był błąd RMS (4) popełniany przez wyznaczone modele, jako miarę subiektywną przyjęto skomplikowanie (możliwość interpretacji przez użytkownika) wyznaczonego modelu. Metodę proponowaną w artykule porównano z metodami statystycznymi (regresja wielowymiarowa, ARIMA) oraz z metodą stochastyczną (sieci neuronowe). Wyniki eksperymentów dla predykcji dziesięciominutowej podano w tabeli trzeciej, wyniki dla predykcji godzinowej podano w tabeli czwartej. Wizualnie, rzeczywisty szereg czasowy stężenia metanu rejestrowanego przez metanomierz M32 oraz szereg przewidywany przez model pokazano na rysunkach trzecim i czwartym. Przeprowadzone badania wykazały, że zastosowana metoda pozwoliła na uzyskanie najmniejszego błędu predykcji przy jednoczesnym zachowaniu przejrzystości wyznaczonego modelu. Metoda charakteryzowała się również najkrótszym czasem analizy.
Rocznik
Strony
475--492
Opis fizyczny
Bibliogr. 17 poz., rys., tab., wykr.
Twórcy
autor
autor
  • Institute of Computer Sciences, Silesian University of Technology; Akademicka 16,44-100 Gliwice, Poland, Marek.sikora@polsl.pl
Bibliografia
  • Bojko, B., 2004. Dynamika stężenia metanu w wyrobiskach górniczych. Instytut Mechaniki Górotworu PAN, promotor dr hab. inż. Stanisław Wasilewski, Kraków.
  • Box, G.E.P., Jenkins, G.M., 1994. Time series analysis: forecasting and control. Prentice Hall, New Jersey, 3th edition.
  • Breiman, L., Friedman, J.H., Olshen, R.A., Stone, C.J., 1994. Classification and Regression Trees. Wadsworth, Belmont CA.
  • Czogała, E., Łęski, J., 2000. Fuzzy and Neuro-Fuzzy Intelligent Systems. Studies in Fuzziness and Soft Computing vol. 47. Springer-Verlag Company.
  • Dixon, W.D., 1992. A statistical analysis of monitored data for methane prediction. Ph. D. Thesis. University of Nottingham. Dept. of Mining Engineering, May 1992.
  • Michalski, R.S., Kaufmann, K., 1998. Data Mining and Knowledge Discovery: A Review of Issues and a Multistrategy Approach. Kubat M., Bratko I. Michalski R.S. (ed.): Machine Learning and Data Mining: Methods and Applications. John Wiley and Sons.
  • Quinlan , R., 1992a. C4.5 Programs for Machine Learning. Morgan Kaufman Publishers, San Mateo, California.
  • Quinlan, J.R., 1992b. Learning with continuous classes. Proc. of the International Conference on Artificial Intelligence (AI`92), Singapore, World Scientific.
  • Quinlan, R., 1993. Combining instance-based learning and model-based learning. Proc of the Tenth International Conference on Machine Learning (ML-93).
  • Sikora, M., Widera, D., 2004. Identyfication of diagnostics states for dewater pumps working in abyssal mining pump stations, Proceedings of the XV International conference on system sciences, Wrocław, Poland, p. 394-402.
  • Sikora, M., Kozielski, M., 2005. Application of hybrid data exploration methods to prediction tasks. Materiały konferencji Technologie Przetwarzania Danych. Politechnika Poznańska. Poznań, s. 195-215.
  • Sikora, M., Krzykawski, D., 2005. Zastosowanie metod eksploracji danych do analizy wydzielania się dwutlenku węgla w pomieszczeniach stacji odwadniania kopalń węgla kamiennego. Mechanizacja i Automatyzacja Górnictwa, 6/413, Katowice, 2005, s. 29-40.
  • Sobczyk, M., 1997. Statystyka. Wydawnictwo Naukowe PWN.
  • StatSoft Polska. 2001a. Statistica 5.0 podręcznik użytkownika tom II-IV. StatSoft, Kraków.
  • StatSoft Polska. 2001b. Statistica Neural Network podręcznik użytkownika. Statsoft, Kraków.
  • Tadeusiewicz, R., 2003. Sieci neuronowe. Akademicka Oficyna Wydawnicza RM, Warszawa.
  • Yager, R.R., Filev, D.P., 1994. Essential of Fuzzy Modelling and Control. John Wiley & Sons, Inc.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-article-BPZ2-0030-0010
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.