PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
Tytuł artykułu

The effectiveness of machine learning in detecting phishingwebsites

Treść / Zawartość
Identyfikatory
Warianty tytułu
PL
Skuteczność uczenia maszynowego w wykrywaniu stron phishingowych
Języki publikacji
EN
Abstrakty
EN
Phishing poses a significant risk in the field of digital security, requiring effective methods for identifying fraudulent websites. This study evaluated the performance of nine machine learning classification models in the context of phishing website detection. Two different input datasets were prepared: the first included the full HTML code, while the second was based on a set of features extracted from that code. The analysis revealed that models trained on the extracted features achieved nearly twice the detection performance compared to those operating on raw HTML code. The use of majority voting further improved classification effectiveness. The study results confirm that proper feature selection and the integration of outputs from multiple models significantly enhance the effectiveness of systems for detecting online threats.
PL
Zjawisko phishingu stanowi poważne ryzyko w dziedzinie bezpieczeństwa cyfrowego, co wymaga efektywnych sposobów identyfikacji fałszywych witryn. W ramach badania oceniono efekty dziewięciu modeli klasyfikacyjnych opartych na uczeniu maszynowym w kontekście rozpoznawania stron phishingowych. Przygotowano dwa różne zestawy danych wejściowych: pierwszy obejmował pełny kod HTML, natomiast drugi opierał się na zestawie cech wydobytych z tego kodu. Przeprowadzona analiza ujawniła, że modele trenowane na wyodrębnionych cechach osiągają niemal dwukrotnie lepsze wyniki w wykrywaniu od modeli działających na surowym kodzie HTML. Wykorzystanie głosowania większościowego przyczyniło się do dalszej poprawy skuteczności klasyfikacji. Rezultaty badań potwierdzają, że odpowiedni dobór cech oraz integracja wyników z wielu modelów znacząco podnoszą efektywność systemów identyfikujących zagrożenia w Internecie.
Rocznik
Strony
105--109
Opis fizyczny
Bibliogr. 20 poz., wykr.
Twórcy
  • Kielce University of Technology, Department of Information Systems, Kielce, Poland
  • Kielce University of Technology, Department of Computer Science, Electronics and Electrical Engineering, Kielce, Poland
  • Kielce University of Technology, Faculty of Electrical Engineering, Automatic Control and Computer Science, Kielce, Poland
Bibliografia
  • [1] Albishri A. A., Dessouky M. M.: A comparative analysis of machine learning techniques for URL phishing detection. Engineering, Technology & Applied Science Research 14(6), 2024, 18495–18501 [https://doi.org/10.48084/etasr.8920].
  • [2] Arvind N.: Phiusiil phishing URL dataset (Version 1) [https://www.kaggle.com/datasets/ndarvind/phiusiil-phishing-url-dataset] (available: 19.03.2025).
  • [3] Carreras-Coch A., et al.: Communication Technologies in Emergency Situations. Electronics 11(7), 2022, 1155 [https://doi.org/10.3390/electronics11071155].
  • [4] Géron A.: Uczenie maszynowe z użyciem Scikit-Learn, Keras i TensorFlow. Wyd. 3, Helion, 2023.
  • [5] Hadnagy C., Fincher M., Dreeke R.: Mroczne odmęty phishingu. Nie daj się złowić! Helion, 2018.
  • [6] Hadnagy C.: Social engineering: the art of human hacking. Wiley Publishing, 2011.
  • [7] Hastie T., Tibshirani R., Friedman J.: The elements of statistical learning: data mining, inference, and prediction. Springer, 2009.
  • [8] Jha A.: Fight fraud with machine learning. Manning Publications, 2023.
  • [9] Liu B.: Web data mining: exploring hyperlinks, contents, and usage data. 2nd ed., Springer, 2011.
  • [10] Mitchell R.: Web scraping with Python: collecting data from the modern web. 2nd ed., O’Reilly Media, 2018.
  • [11] Murphy K.P.: Machine learning: a probabilistic perspective. MIT Press, 2012.
  • [12] PhishTank: Phishing website database [https://phishtank.org/] (accessed: 22.03.2025).
  • [13] Reyes-Dorta N., Caballero-Gil P., Rosa-Remedios C.: Detection of malicious URLs using machine learning. Wireless Networks 30, 2024, 7543–7560 [https://doi.org/10.1007/s11276-024-03700-w].
  • [14] Sasanuma M., et al.: Research and development of very small aperture terminals (VSAT) that can be installed by easy operation during disasters – Issues and the solutions for implementing simple and easy installation of VSAT earth station. IEICE 112(440), 2013, 1–3.
  • [15] Shalev-Shwartz S., Ben-David S.: Understanding machine learning: from theory to algorithms. Cambridge University Press, 2014.
  • [16] Shashwat A.: Web page phishing detection dataset (Version 1) [https://www.kaggle.com/datasets/shashwatwork/web-page-phishing-detection dataset] (available: 23.03.2025).
  • [17] Suematsu N., et al.: Multi-mode SDR VSAT against big disasters. European Microwave Conference’13, Nuremberg, 2013 [https://doi.org/10.23919/EuMC.2013.6686788].
  • [18] Tashtoush Y., et al.: Exploring low-level statistical features of n-grams in phishing URLs: a comparative analysis with high-level features. Cluster Computing 27, 2024, 13717–13736 [https://doi.org/10.1007/s10586-024-04655 5].
  • [19] Wilk-Jakubowski J. Ł.: A review on information systems engineering using VSAT networks and their development directions. Yugoslav Journal of Operations Research 31(3), 2021, 409–428 [https://doi.org/10.2298/YJOR200215015W].
  • [20] Wilk-Jakubowski J. Ł.: Broadband satellite data networks in the context of the available protocols and digital platforms. Informatyka, Automatyka, Pomiary w Gospodarce i Ochronie Środowiska – IAPGOŚ 2, 2021, 56–60 [https://doi.org/10.35784/iapgos.2630].
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.baztech-f143c19b-b367-4837-a9fe-a89919776c42
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.