Nowa wersja platformy, zawierająca wyłącznie zasoby pełnotekstowe, jest już dostępna.
Przejdź na https://bibliotekanauki.pl

PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Czasopismo
2022 | nr 6 | 587-604
Tytuł artykułu

Symbolic Data Analysis as a Tool for Credit Fraud Detection

Warianty tytułu
Analiza danych symbolicznych jako narzędzie wykrywania oszustw z użyciem kart kredytowych
Języki publikacji
EN
Abstrakty
Oszustwa finansowe nie są zjawiskiem nowym, a rozwój nowoczesnych technik i technologii, który z jednej strony poprawia standard życia, dostarcza także nowych narzędzi oszustom. Nowoczesne metody analizy danych dostarczają narzędzi, które pozwalają na szybsze i znacznie dokładniejsze identyfikowanie oszustw oraz przeciwdziałanie ich powstawaniu. Proces identyfikacji oszustw to w dużym uproszczeniu działania zmierzające do weryfikacji transakcji. Literatura przedmiotu wskazuje, że koszty takiej weryfikacji nie powinny przekraczać strat spowodowanych oszustwem (Quah, Sriganesh 2008). W klasycznej analizie danych wypracowano wiele metod, które mogą być użyteczne w identyfikacji oszustw w transakcjach finansowych. Do metod tych zalicza się m.in. sztuczne sieci neuronowe, drzewa decyzyjne czy regresję logistyczną. W literaturze przedmiotu z zakresu wykrywania oszustw z użyciem kart kredytowych prezentowane oraz porównywane są zwykle metody klasycznej analizy danych. Zazwyczaj artykuły te prezentują zastosowanie takich metod, jak sztuczne sieci neuronowe, drzewa decyzyjne, podejście wielomodelowe czy regresja logistyczna i metoda k-najbliższych sąsiadów (zob. m.in.: Makki i in. 2019; Varmedja i in. 2019; Maniraj i in. 2019; Szczepankiewicz 2016; Miarzyńska 2021). Niemniej jednak w literaturze przedmiotu brakuje artykułów prezentujących możliwość zastosowania różnych metod analizy danych symbolicznych do identyfikacji oszustw finansowych z użyciem kart kredytowych oraz porównujących te metody. Artykuł stanowi uzupełnienie tej luki w literaturze przedmiotu. Proponuje się w nim zastosowanie metod analizy danych symbolicznych, pozwalających opisywać różne obiekty (na przykład transakcje kartami kredytowymi) w dokładniejszy i złożony sposób niż za pomocą danych klasycznych. Główna hipoteza brzmi, że drzewa decyzyjne dla danych symbolicznych są lepszym narzędziem wykrywania oszustw finansowych niż regresja logistyczna dla danych symbolicznych, metoda k-najbliższych sąsiadów dla danych symbolicznych czy jądrowa analiza dyskryminacyjna danych symbolicznych. W analizie danych symbolicznych, w przeciwieństwie do analizy danych klasycznych (gdzie obiekty opisywane są przez pojedyncze zmienne - metryczne lub niemetryczne), można opisywać obiekty w dokładniejszy, złożony sposób. Dostarcza ona odpowiednich narzędzi do analizowania złożonych zbiorów danych, m.in. o dużej zmienności (zob. Bock, Diday 2000; Billard, Diday 2006). Artykuł ma następującą strukturę. We wstępie scharakteryzowano problem wykrywania oszustw finansowych oraz dokonano przeglądu literatury z tego zakresu. Druga część prezentuje podstawowe idee i pojęcia z zakresu analizy danych symbolicznych oraz opisuje metody, które zostaną zastosowane w części empirycznej (drzewa decyzyjne danych symbolicznych, regresję logistyczną danych symbolicznych, jądrową analizę dyskryminacyjną danych symbolicznych oraz metodę k-najbliższych sąsiadów dla danych symbolicznych). Trzecia część artykułu (empiryczna) prezentuje wyniki wykrywania oszustw finansowych. Zastosowano tu zbiór danych zawierający 284 807 transakcji kartami kredytowymi (tylko 492 były oszustwami). Otrzymane wyniki wskazują, że drzewa decyzyjne danych symbolicznych zwykle pozwalają osiągnąć lepsze wyniki niż inne metody analizy danych symbolicznych (dla modeli pojedynczych). Artykuł opatrzono podsumowaniem. (abstrakt oryginalny)
EN
It can be said that the money fraud problem is as old as money itself. The development of new technologies allows criminals to develop new ways of fraud and also provides new methods to prevent them. The process of identifying if a newly authorised transaction is a case of fraudulent or genuine transaction is called fraud detection (Maes et al. 2002). Many classical methods can be used to detect money frauds. This paper proposes to apply symbolic data analysis methods, which allow describing objects in a more precise and complex way in order to handle the credit card fraud detection problem. The main hypothesis is that the decision tree for symbolic data is a better tool in credit card fraud detection than other methods. Symbolic data analysis, unlike classical data analysis, allows describing objects in a more complex way. Symbolic data analysis makes it possible to take into account all variability and uncertainty in the data and provides suitable methods and techniques to deal with such data (see: Bock, Diday 2000; Billard, Diday 2006). The first part is the introduction that describes the problem of credit card fraud detection and presents literature that deals with this problem. The second part presents the basic ideas of symbolic data analysis, describes all the models that will be applied in the empirical part (decision tree for symbolic data, logistic regression for symbolic data, k-nearest neighbour method for symbolic data and kernel discriminant analysis for symbolic data). The third part presents the results of credit card fraud detection. The data set containing 284,807 different card transactions (492 being fraud transactions) is used to build all models. The obtained results show that decision trees usually lead to slightly better results than other methods in the symbolic data case (for a single model). The last part presents the final remarks. (original abstract)
Czasopismo
Rocznik
Numer
Strony
587-604
Opis fizyczny
Twórcy
  • Uniwersytet Ekonomiczny we Wrocławiu
  • Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
  • Asha R.B., Suresh K.S.K. (2021), Credit card fraud detection using artificial neural network, Global Transitions Proceedings, 2(1), 35-41.
  • Bartoszewicz A., Bartoszewicz S. (2016), Implementacja systemu zwalczania nadużyć finansowych przez Instytucję Zarządzającą na potrzeby audytu desygnacyjnego, Studia i Prace Kolegium Zarządzania i Finansów, Szkoła Główna Handlowa, 152, 53-72.
  • Bock H.-H., Diday E., eds (2000), Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Springer Verlag.
  • Billard L., Diday E. (2006), Symbolic Data Analysis. Conceptual Statistics and Data Mining, John Wiley & Sons.
  • Bhatla T.P., Prabhu V., Dua A. (2003), Understanding credit card frauds, Cards Business Review, 1(6), 1-15.
  • Bolton R.J., Hand D.J. (2002), Statistical fraud detection: a review, Statistical Science, 235-249.
  • Carcillo F., Le Borgne Y.A., Caelen O., Kessaci Y., Oblé F., Bontempi G. (2021), Combining unsupervised and supervised learning in credit card fraud detection, Information Sciences, 557, 317-331.
  • Carcillo F., Le Borgne Y.-A., Caelen O., Bontempi G. (2018a), Streaming active learning strategies for real-life credit card fraud detection: assessment and visualisation, International Journal of Data Science and Analytics, 5(4), 285-300.
  • Carcillo F., Dal Pozzolo A., Le Borgne Y.-A., Caelen O., Mazzer Y., Bontempi G. (2018b), Scarff: a scalable framework for streaming credit card fraud detection with spark, Information Fusion, 41, 182-194.
  • Chen J.I.Z., Lai K.L. (2021), Deep convolution neural network model for credit-card fraud detection and alert, Journal of Artificial Intelligence, 3(02), 101-112.
  • Dal Pozzolo A. (2015), Adaptive machine learning for credit card fraud detection, Ph. D. thesis, Université Libre de Bruxelles, Computer Science Department.
  • Dal Pozzolo A., Boracchi G., Caelen O., Alippi C., Bontempi G. (2017), Credit card fraud detection: a realistic modeling and a novel learning strategy, IEEE Transactions on Neural Networks and Learning Systems, 29(8), 3784-3797.
  • Dal Pozzolo A., Caelen O., Johnson R.A., Bonetempi G. (2015), Calibrating probability with undersampling for unbalanced classification, 2015 IEEE Symposium Series on Computational Intelligence.
  • Dal Pozzolo A., Caelen O., Le Borgne Y.A., Waterschoot S., Bontempi G. (2014), Learned lessons in credit fraud detection from a practitioner perspective, Expert Systems with Applications, 41(10), 4915-4928.
  • Dudek A. (2013), Metody analizy danych symbolicznych w badaniach ekonomicznych, Wyd. UE we Wrocławiu.
  • Ganin Y., Ustinova E., Ajakan H., Germain P., Larochelle H., Marchand M., Lempitsky V. (2016), Domain-adversarial training of neural networks, Journal of Machine Learning Results, 17(1), 2096-2030.
  • Gatnar E., Walesiak M., ed. (2011), Analiza danych jakościowych i symbolicznych z wykorzystaniem programu R, C.H. Beck.
  • Härdle W., Simar L. (2003), Applied Multivariate Statistical Analysis, Springer Verlag.
  • Hussein A.S., Khairy R.S., Najeeb S.M.M., Alrikabi H.T. (2021), Credit card fraud detection using fuzzy rough nearest neighbor and sequential minimal optimization with logistic regression, International Journal of Interactive Mobile Technologies, 15(5), 24-42.
  • Khatri S., Arora A., Agrawal A.P. (2020), Supervised machine learning algorithms for credit card fraud detection: a comparison, 10th International Conference on Cloud Computing, Data Science & Engineering.
  • Lebichot B., Le Borgne Y.-A., He-Guelton L., Oblé F., Bontempi G. (2019), Deep-learning domain adaptation techniques for credit cards fraud detection, in: L. Oneto, N. Navarin, A. Sperduti, D. Anguita (eds), Recent Advances in Big Data and Deep Learning. Proceedings of the INNS Big Data and Deep Learning Conference INNS BDDL2019, held at Sestri Levante, Genova, Italy, 16-18 April 2019, Springer.
  • Lach A. (2021), Karnoprawna reakcja na zjawisko kradzieży tożsamości, Wolters Kluwer Polska.
  • Lew A. (2016), Ryzyko istotnego zniekształcenia jako element badania przychodów i kosztów przez biegłego rewidenta, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, 440, 363-371.
  • Lim K.S., Lee L.H., Sim Y.W. (2021), A review of machine learning algorithms for fraud detection in credit card transaction, International Journal of Computer Science & Network Security, 21(9), 31-40.
  • Maes S., Tuyls K., Vanschoenwinkel B., Manderick B. (2002), Credit card fraud detection using Bayesian and neural networks, in: Proceedings of the First International NAISO Congress on NEURO FUZZY TECHNOLOGIES, 16-19 January, Havana, Cuba.
  • Makki S., Assaghir Z., Taher Y., Haque R., Hacid M.S., Zeineddine H. (2019), An experimental study with imbalanced classification approaches for credit card fraud detection, IEEE Access, 7, 93010-93022.
  • Malerba D., Esposito F., Monopoli M. (2002), Comparing dissimilarity measures for probabilistic symbolic objects, in: A. Zanasi, C.A. Brebbia, N.F.F. Ebecken, P. Melli (eds), Data Mining III, WIT Press.
  • Maniraj S.P., Saini A., Ahmed S., Sarkar S. (2019), Credit card fraud detection using machine learning and data science, International Journal of Engineering Research, 8(9), 110-115.
  • Miarzyńska Z. (2021), Porównanie algorytmów uczenia maszynowego na przykładzie rozpoznawania oszustw w transakcjach płatniczych, bachelor thesis, Jagiellonian University in Kraków.
  • Nowak A. (2013), Identyfikacja przyczyn i sprawców oszustw finansowo-księgowych - ujęcie statystyczne, Finanse, Rynki Finansowe, Ubezpieczenia, 61(2), 139-148.
  • Pełka M. (2010), K-nearest neighbour classification for symbolic data, Acta Universitatis Lodziensis. Folia Oeconomica, 235, 171-176.
  • Pełka M. (2018), Podejście wielomodelowe analizy danych symbolicznych w ocenie zdolności kredytowej osób fizycznych, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, 507, 200-207.
  • Pełka M. (2019), Symbolic decision stumps in individual credit scoring, Bank i Kredyt, 50(6), 513-528.
  • Quah J.T.S., Sriganesh M. (2008), Real-time credit card fraud detection using computational intelligence, Expert Systems with Applications, 35(4), 1721-1732.
  • Raj S.B.E., Portia A.A. (2011), Analysis on credit card fraud detection methods, 2011 International Conference on Computer, Communication and Electrical Technology (ICCCET), National College of Engineering.
  • Rasson J.P., Lissoir S. (2000), Symbolic kernel discriminant analysis, in: H.-H. Bock, E. Diday (eds), Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Springer Verlag.
  • Rydzak R. (2016), Rola biegłego rewidenta w wykrywaniu istotnych zniekształceń sprawozdania finansowego będących konsekwencją oszustwa, Prace Naukowe, 9-19, Uniwersytet Ekonomiczny w Katowicach.
  • Sailusha R., Gnaneswar V., Ramesh R., Rao G.R. (2020), Credit card fraud detection using machine learning, 2020 4th International Conference on Intelligent Computing and Control Systems (ICICCS), IEEE.
  • Shirgave S., Awati C., More R., Patil S. (2019), A review on credit card fraud detection using machine learning, International Journal of Scientific & Technology Research, 8(10), 1217-1220.
  • Sonepat R., Sonepat S. (2014), Analysis on credit card fraud detection methods, International Journal of Computer Trends and Technology, 8(1), 45-51.
  • de Souza R.M., Queiroz D.C., Cysneiros F.J.A. (2011), Logistic regression-based pattern classifiers for symbolic interval data, Pattern Analysis and Applications, 14(3), 273-282.
  • Szczepankiewicz E.I. (2016), Rewizja finansowa, audyt wewnętrzny a audyt śledczy w wykrywaniu oszustw gospodarczych, Studia i Prace Kolegium Zarządzania i Finansów, Szkoła Główna Handlowa, 152, 73-93.
  • Tomanek J. (2014), Analiza wielowymiarowa w wykrywaniu oszustw księgowych, Studia Ekonomiczne, 192, 155-169.
  • Varmedja D., Karanovic M., Sladojevic S., Arsenovic M., Anderla A. (2019), Credit card fraud detection - machine learning methods, in: 2019 18th International Symposium INFOTEH-JAHORINA (INFOTEH).
  • Żukowska-Kalita J. (2017), Symptomy oszustw w sprawozdaniach finansowych i ich identyfikacja w procesie badania sprawozdania finansowego przez biegłego rewidenta, Studia i Prace Kolegium Zarządzania i Finansów, Szkoła Główna Handlowa, 154, 53-73.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171656392
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.