Optimization algorithms inspired by sea creatures in feature selection applications
[ X ]
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Veri madenciliği, makine öğrenimi ve örüntü tanıma gibi uygulamalarda, öznitelik seçimi önemli bir ön işleme adımıdır. Gereksiz ve alakasız özellikleri kaldırarak, öğrenme modelinin hesaplama maliyetini azaltırken gereksiz ve alakasız özellikleri kaldırarak sınıflandırma doğruluğunu artırır. Bu tezde, doğadan ilham alan dokuz metasezgisel algoritma ve bir geleneksel yöntem, UCI veritabanından alınan yirmi iki veri seti üzerinde test edildi. Test sonuçları, doğruluk, kesinlik, duyarlılık, F-Score ve seçim boyutu dahil olmak üzere beş farklı değerlendirme metriği kullanılarak değerlendirildi. Algoritmalar ve sınıflandırıcılar arasındaki ilişkiyi daha iyi anlamak için dört farklı sınıflandırıcı kullanılmıştır. Algoritmalar üç kategoriye ayrılır: Emperor Penguin Colony (EPO), Marine Predators Algorithm (MPA), Salp Swarm Algorithm (SSA), Jellyfish Search Optimizer (JS), Sailfish Optimizer (SFO) ve Whale Optimizer (WOA) gibi deniz canlılarından esinlenen algoritmalar; Ant Colony Optimizer (ACO), Genetic Algorithm (GA) ve Particle Swarm Algorithm (PSA) gibi literatürde iyi bilinen algoritmalar; Ki-Kare (CHI2) olarak geleneksel yöntem. Bu tezde, JS algoritmasını literatürde ilk kez öznitelik seçim sürecinde kullanılmak üzere ikili JS algoritması olarak öneriyoruz. Test sonuçları, EPO'nun naïve bayes sınıflandırıcısını kullanarak en iyi algoritma olduğunu, MPA'nın destek vektör makinesi (SVM) sınıflandırıcısını kullanarak en iyi algoritma olduğunu, SFO'nun K-En Yakın Komşu (KNN) sınıflandırıcısını kullanarak en iyi algoritma olduğunu ve JS'nin özellik seçme işlemi için rassal orman (RF) sınıflandırıcısını kullanarak en iyi algoritma olduğunu gösterdi.
In applications such as data mining, machine learning, and pattern recognition, feature selection is an essential preprocessing step. By removing redundant and irrelevant features, it increases its classification accuracy by removing redundant and irrelevant features while reducing the computational expense of the learning model,. In this thesis, nine nature inspired metaheuristic algorithms and one traditional method tested on twenty-two benchmark datasets taken from UCI database. Test results are evaluated using five different evaluation metrics including accuracy, precision, recall, F-Score and selection size. Four different classifiers are used to better understand the correlation between the algorithms and the classifiers. Algorithms are divided into three categories: algorithms inspired from sea creatures including Emperor Penguin Colony (EPO), Marine Predators Algorithm (MPA), Salp Swarm Algorithm (SSA), Jellyfish Search Optimizer (JS), Sailfish Optimizer (SFO) and Whale Optimizer (WOA); well-known algorithms in the literature including Ant Colony Optimizer (ACO), Genetic Algorithm (GA) and Particle Swarm Algorithm (PSA); traditional method as Chi-Square (CHI2). In this thesis, we propose JS algorithm as binary JS algorithm to be used for the feature selection process for the first time in the literature. Test results showed that EPO is the best algorithm using naïve bayes classifier, MPA is the best algorithm using support vector machine (SVM) classifier, SFO is the best algorithm using K-Nearest Neighbor (KNN) classifier and JS is the best algorithm using random forest (RF) classifier for the feature selection process.
In applications such as data mining, machine learning, and pattern recognition, feature selection is an essential preprocessing step. By removing redundant and irrelevant features, it increases its classification accuracy by removing redundant and irrelevant features while reducing the computational expense of the learning model,. In this thesis, nine nature inspired metaheuristic algorithms and one traditional method tested on twenty-two benchmark datasets taken from UCI database. Test results are evaluated using five different evaluation metrics including accuracy, precision, recall, F-Score and selection size. Four different classifiers are used to better understand the correlation between the algorithms and the classifiers. Algorithms are divided into three categories: algorithms inspired from sea creatures including Emperor Penguin Colony (EPO), Marine Predators Algorithm (MPA), Salp Swarm Algorithm (SSA), Jellyfish Search Optimizer (JS), Sailfish Optimizer (SFO) and Whale Optimizer (WOA); well-known algorithms in the literature including Ant Colony Optimizer (ACO), Genetic Algorithm (GA) and Particle Swarm Algorithm (PSA); traditional method as Chi-Square (CHI2). In this thesis, we propose JS algorithm as binary JS algorithm to be used for the feature selection process for the first time in the literature. Test results showed that EPO is the best algorithm using naïve bayes classifier, MPA is the best algorithm using support vector machine (SVM) classifier, SFO is the best algorithm using K-Nearest Neighbor (KNN) classifier and JS is the best algorithm using random forest (RF) classifier for the feature selection process.
Açıklama
Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı, Bilgisayar Bilimleri Bilim Dalı
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control