Tree-based machine learning methods combined with swarm intelligence feature selection for intrusion detection
[ X ]
Tarih
2024
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/closedAccess
Özet
Gelişen teknoloji iletişim ve bilgi taşıma sürecini nesnel dünyadan dijital ortama taşımıştır. Bu değişim özellikle ağ trafiğinde atışa neden olmuştur. Bunun yanı sıra nesnel dünyada gerçekleştirilen bir çok iş ve işlem de dijital dünyaya aktarılmıştır. Banka bilgileri, ticari sır niteliğindeki bilgiler, kişisel veriler gibi hassas veriler de dijital ortama aktarıldığı için bu verilere ulaşıp çıkar elde etmeyi isteyen kötü amaçlı insanlar, geliştirdikleri yazılımlarla veri güvenliğini tehdit etmektedir. Bunun yanı sıra yoğun veri trafiği, kullanıcı sayısının çokluğu veri güvenliği sistemlerinin kapasitelerini zorlamaktadır. Veri trafiği datalarının toplanması ve veri trafiğinin normal olanla anormal olanın ayıklanması süreci yukarıda açıklanan nedenlerden ötürü zorlu bir süreçtir. Veri güvenliği sürecinin bir parçası olarak saldırı tespit sistemleri (IDS) bu süreçte görev alan yapılardan biridir. Bu sistemden beklenen, normal veri trafiği ile anormal veri trafiğini birbirinden ayırması ve bu işlemi yüksek doğruluk oranı ve olabildiğince düşük işlem süresinde yerine getirebilmesidir. Bilim dünyasında saldırıların tespiti süreci çeşitli yöntemlerle ele alınmıştır. Bazı tespit yöntemleri, daha önce anormal veri trafiği olarak işaretlenmiş verilerin izini yani imzasını ararken, bazı tespit sistemleri veri trafiğindeki anormalliği tespit etmeyi hedeflemiştir. Bu çalışmada anomali tespit yöntemi baz alınmıştır. Makine öğrenmesi otonom olması ve yüksek veri boyutlarıyla başa çıkabilmesi özellikleri nedeniyle bu yöntemde sıklıkla kullanılmıştır. Bu araştırma çalışmasında makine öğrenmesi modellerinde kullanılacak veri setini en iyi temsil eden öz nitelikleri belirlemek amacıyla sürü zekası algoritmaları kullanılmış, elde edilen özet veri seti makine öğrenmesi modelleri ile sınıflandırma işlemine tabi tutulmuştur. Önceki çalışmalarda elde edilen sonuçlarla kıyas yapabilmek için yaygın kullanılan 3 veri seti seçilmiştir. Çalışmada elde edilen sonuçlara göre, sürü zekası algoritmaları ile özetlenen veriyi kullanan makine öğrenmesi modelleri yüksek doğruluk oranına ulaşmış ve sürü zekası algoritmaları bu sürece işlem süresini kısaltma anlamında katkı sağlamıştır.
With advancing technology, communication and information transfer have shifted from the physical world to the digital realm. This change has led to an increase in network traffic. At the same time, many tasks and transactions carried out in the physical world have been transferred to the digital environment. Sensitive information such as bank details, trade secrets, and personal data are moved to digital platforms, and malicious individuals aiming to access this information for profit are threatening data security with their developed software. In addition, the high volume of data traffic and the large number of users strain the capacity of data security systems. Collecting data traffic information and distinguishing between normal and abnormal data is challenging due to the reasons mentioned above. Intrusion detection systems (IDS) are key components of data security. These systems are expected to distinguish between normal and abnormal data traffic with high accuracy and in the shortest possible processing time. The scientific community has addressed the process of detecting attacks through various methods. Some detection methods search for data signatures previously marked as abnormal, while others aim to identify anomalies in data traffic. In this study, the anomaly detection method has been adopted. Machine learning is frequently used in this method due to its autonomous nature and ability to handle large data volumes. In this research, swarm intelligence algorithms were employed to determine the features that best represent the dataset used in machine learning models. The resulting summarized dataset was classified with machine learning models. Three commonly used datasets were selected to compare with results from previous studies. According to the study's results, machine learning models using data summarized by swarm intelligence algorithms achieved high accuracy rates, and swarm intelligence algorithms contributed to the process by reducing processing time.
With advancing technology, communication and information transfer have shifted from the physical world to the digital realm. This change has led to an increase in network traffic. At the same time, many tasks and transactions carried out in the physical world have been transferred to the digital environment. Sensitive information such as bank details, trade secrets, and personal data are moved to digital platforms, and malicious individuals aiming to access this information for profit are threatening data security with their developed software. In addition, the high volume of data traffic and the large number of users strain the capacity of data security systems. Collecting data traffic information and distinguishing between normal and abnormal data is challenging due to the reasons mentioned above. Intrusion detection systems (IDS) are key components of data security. These systems are expected to distinguish between normal and abnormal data traffic with high accuracy and in the shortest possible processing time. The scientific community has addressed the process of detecting attacks through various methods. Some detection methods search for data signatures previously marked as abnormal, while others aim to identify anomalies in data traffic. In this study, the anomaly detection method has been adopted. Machine learning is frequently used in this method due to its autonomous nature and ability to handle large data volumes. In this research, swarm intelligence algorithms were employed to determine the features that best represent the dataset used in machine learning models. The resulting summarized dataset was classified with machine learning models. Three commonly used datasets were selected to compare with results from previous studies. According to the study's results, machine learning models using data summarized by swarm intelligence algorithms achieved high accuracy rates, and swarm intelligence algorithms contributed to the process by reducing processing time.
Açıklama
19.09.2026 tarihine kadar kullanımı yazar tarafından kısıtlanmıştır.
Lisansüstü Eğitim Enstitüsü, Bilişim Teknolojileri Ana Bilim Dalı
Lisansüstü Eğitim Enstitüsü, Bilişim Teknolojileri Ana Bilim Dalı
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control ; Bilim ve Teknoloji