Identyfikatory
Warianty tytułu
Weryfikacja dokładności metod text mining w przypadku analizy historycznych zbiorów danych dotyczących serwisu autobusów miejskich
Języki publikacji
Abstrakty
Constantly increasing maintenance costs impose optimal maintenance policy planning. One possible way which helps to minimize maintenance costs and prevent bus fleet availability is analysis of historical maintenance records, which contain information about failures and performed repairs. In many cases this data have free text form and their analysis require individual log-by-log examination of their content. In order to automate this process, text mining methods can be applied. But, accuracy of the analysis depends on data quality and employed methods and should be tested before using this approach. This is especially important when the service decisions, which influence safety and maintenance costs, are made on this basis. The aim of this paper is to determine whether existing and currently used text-mining methods are sufficiently accurate to be used in classification of unstructured urban bus maintenance and repair data. For that purpose the case study and literature review has been conducted. The study shows great capabilities of proposed classification model. The model has 99% of accuracy and can be applied to support maintenance decisions.
Stale rosnące koszty utrzymania taboru autobusowego wymuszają potrzebę kształtowania odpowiedniej polityki serwisowej. Niezbędna w tym zakresie jest analiza danych historycznych, które zawierają informację o zaistniałych awariach i wykonanych naprawach. W wielu przypadkach dane te posiadają formę tekstową, co wymaga ich indywidualnej oceny rekord po rekordzie. W celu zautomatyzowania tego procesu istnieje możliwość zastosowania metod klasy text mining. Aby jednak wyniki analizy text mining mogły zostać wdrożone muszą wykazywać się one odpowiednią dokładnością. Jest to szczególnie istotne w przypadku, gdy na podstawie tych wyników podejmowane są decyzje serwisowe wpływające na bezpieczeństwo i koszty eksploatacyjne. Celem niniejszego artykułu jest weryfikacja, czy powszechnie stosowane metody text mining są wystarczająco dokładne, aby analizować historyczne dane serwisowe autobusów. W tym celu dokonano przeglądu literaturowego oraz analizy text mining tego konkretnego typu danych. Przeprowadzone badania wykazały, że dokładność klasyfikatora wynosi 99%. Na tej podstawie można stwierdzić, że są to metody wystarczająco dokładne, aby za ich pośrednictwem podejmować decyzję serwisowe.
Czasopismo
Rocznik
Tom
Strony
51--57
Opis fizyczny
Bibliogr. 18 poz., rys., tab., wykr.
Twórcy
autor
- AGH University of Science and Technology, Dept. of Mechanical Engineering and Robotics Al. Mickiewicza 30, 30-059 Kraków, Polska
autor
- AGH University of Science and Technology, Dept. of Mechanical Engineering and Robotics Al. Mickiewicza 30, 30-059 Kraków, Polska
autor
- AGH University of Science and Technology, Dept. of Mechanical Engineering and Robotics Al. Mickiewicza 30, 30-059 Kraków, Polska
Bibliografia
- [1] Lula P. Text mining jako narzędzie pozyskiwania informacji z dokumentów tekstowych. Data Mining: poznaj siebie i swoich klientów, StatSoft Polska 2005.
- [2] Breiman L., Friedman J., Stone C. J., Olshen R.A. Classification and Regression Trees. Chapman and Hall, 1984.
- [3] Divya N. Text Mining Techniques - A Survey. International Journal of Advanced Research in Computer Science and Software Engineering, Vol.2 (4), 2012.
- [4] Department of Defence. DOD Guide for achieving Reliability, Availability, and Maintainability. Department of Defence, USA, 2005.
- [5] Edwards B., Zatorsky M., Nayak R. Clustering and Classification of Maintenance Logs using Text Data Mining. Australasian Data Mining Conference 2008, Australia, November 2008.
- [6] Ghosh S., Roy S., Bandyopadhyay S. A tutorial review on Text Mining Algorithms. International Journal of Advanced Research in Computer and Communication Engineering, Vol. 1 (4), 2012 7.
- [7] Grivel L. Customer feedbacks and opinion surveys analysis in the automotive industry. Text Mining and its applications to intelligence, CRM and Knowledge Management., WITpress, 2006.
- [8] Higgins L., Mobley K. Maintenance Engineering Handbook. McGraw Hill, 2002.
- [9] L. Huang, Y.L. Murphey. Text mining with application to engineering diagnostics. Proceedings of IEA/AIE’2006, vol. 4031, Lecture Notes in Computer Science, 2006.
- [10] Manning C., Schutze H. Foundations of Statistical Natural Languange Processing. MIT Press, Cambridge, 1999.
- [11] Rajaraman, A., Ullman, J. D. Data Mining. Mining of Massive Datasets. pp. 1–17, 2011.
- [12] Rajpathak D. G. An ontology based text mining system for knowledge discovery from the diagnosis data in the automotive domain. Computers in Industry (64), p. 565–580, 2013.
- [13] Russ A.: Taming Text with the SVD. SAS Institute Inc., Cary, NC, 2004.
- [14] Smith R., Hawkins R. Lean maintenance: reduce costs, improve quality, and increase market share. Elsevier, 2004.
- [15] StatSoft (2006). Elektroniczny Podręcznik Statystyki PL, Krakow, WEB: http://www.statsoft.pl/textbook/stathome.html.
- [16] StatSoft, Inc. (2011). STATISTICA (data analysis software system), version 10. www.statsoft.com.
- [17] Sumathy K.L., Chidambaram M, Text Mining. Concepts, Applications, Tools and Issues - An Overview. International Journal of Computer Applications, Vol. 80 (4), 2013.
- [18] Wang H. A survey of maintenance policies of deteriorating systems. European Journal of Operational Research (139), p.469-489, 2002.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-549265f0-c000-4fe0-bc90-e8569f5294e4