A new KNN classifier based on the harmonic mean of the majority votes and average distances of the neighbors combined with adaptive K-value selection
[ X ]
Tarih
2023
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Adana Alparslan Türkeş Bilim ve Teknoloji Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışma, KNN algoritmasının geliştirilmiş bir versiyonunu sunarak geleneksel KNN'nin sınıflandırma doğruluğunu iyileştirmeyi amaçlamaktadır. Bu tez, uyarlanabilir ve artımlı k-değeri seçimi ile çoğunluk oylamasının ve ortalama uzaklık harmonik ortalamasına dayanan geliştirilmiş bir KNN sınıflandırıcısı olan HMAKNN'ı önermektedir. Bu çalışma kapsamında, bir ağırlıklandırma mekanizmasının olup olmamasına bağlı olarak HMAKNN'nin sıradan ve ağırlıklı olmak üzere iki farklı türü tasarlanmıştır. Bu metotların adları sırasıyla HMAKNNR ve HMAKNNW'dir. Bu HMAKNN sınıflandırıcıları, sekizi PRTools'tan elde edilen sentetik ve yirmi altısı UCI ve Kaggle depolarından alınan gerçek kıyaslama veri setleri olmak üzere toplam otuz dört veri seti üzerinde değerlendirilmiştir. Önerilen yaklaşımların sınıflandırma etkinliğini ve başarısını belirlemek için geleneksel KNN ve dört iyi bilinen ağırlıklı KNN modeli ile karşılaştırılmıştır. Diğer ağırlıklandırma yöntemlerinin aksine, her iki HMAKNN sınıflandırıcısı da çoğunluk oylaması ve ortalama uzaklık arasındaki sinerjinin yanı sıra k-değerini uyarlamalı olarak değiştirme becerisini kullanarak sınıflandırma doğruluğunu önemli ölçüde artırmıştır. Gerçek kıyaslama veri setlerinin sınıflandırılması sonuçlarına göre, HMAKNNW %83,02 ile en yüksek ACC değerini üretirken, HMAKNNR %82,83 ile ikinci en yüksek değere ulaşmıştır. Karşılaştırılan diğer beş yöntemden elde edilen ortalama sonuçlara göre HMAKNNW ve HMAKNNR sırasıyla %2,69 ve %2,50 üstünlük sağlamıştır. Ayrıca, gerçek kıyaslama veri setlerinin sınıflandırma sonuçları, her iki HMAKNN yönteminin de istatistiksel olarak diğer ağırlıklı KNN yöntemlerinden daha iyi performans gösterdiğini göstermektedir.
This study aims to improve the classification accuracy of traditional KNN by presenting an improved version of the KNN algorithm. This thesis proposes HMAKNN, an improved KNN classifier based on the harmonic mean of the majority voting and average distance phenomena with adaptive and incremental k-value selection. Within the purview of this study, two variants of HMAKNN, regular and weighted, were designed based on the presence or absence of a weighting mechanism. The names of these variants are HMAKNNR and HMAKNNW, respectively. These HMAKNN classifiers were evaluated on a total of thirty-four data sets, of which eight were synthetic obtained from PRTools and twenty-six were real benchmark data sets from UCI and Kaggle repositories. To determine the classification effectiveness and success of the proposed approaches, they were compared with traditional KNN and four well-known weighted KNN models. In contrast to other weighting methods, both HMAKNN classifiers utilize the constructive interaction between majority voting and average distance, as well as the ability to adaptively modify the k-value, thereby substantially enhancing classification accuracy. Based on the results of the classification of real benchmark data sets, HMAKNNW produced the highest ACC value with 83.02%, and HMAKNNR reached the second-highest value with 82.83%. HMAKNNW and HMAKNNR provided an advantage of 2.69% and 2.50% over the other five methods compared, respectively. Furthermore, the classification results of real benchmark data sets indicate that both HMAKNN methods statistically outperform other weighted KNN methods.
This study aims to improve the classification accuracy of traditional KNN by presenting an improved version of the KNN algorithm. This thesis proposes HMAKNN, an improved KNN classifier based on the harmonic mean of the majority voting and average distance phenomena with adaptive and incremental k-value selection. Within the purview of this study, two variants of HMAKNN, regular and weighted, were designed based on the presence or absence of a weighting mechanism. The names of these variants are HMAKNNR and HMAKNNW, respectively. These HMAKNN classifiers were evaluated on a total of thirty-four data sets, of which eight were synthetic obtained from PRTools and twenty-six were real benchmark data sets from UCI and Kaggle repositories. To determine the classification effectiveness and success of the proposed approaches, they were compared with traditional KNN and four well-known weighted KNN models. In contrast to other weighting methods, both HMAKNN classifiers utilize the constructive interaction between majority voting and average distance, as well as the ability to adaptively modify the k-value, thereby substantially enhancing classification accuracy. Based on the results of the classification of real benchmark data sets, HMAKNNW produced the highest ACC value with 83.02%, and HMAKNNR reached the second-highest value with 82.83%. HMAKNNW and HMAKNNR provided an advantage of 2.69% and 2.50% over the other five methods compared, respectively. Furthermore, the classification results of real benchmark data sets indicate that both HMAKNN methods statistically outperform other weighted KNN methods.
Açıklama
Lisansüstü Eğitim Enstitüsü, Bilgisayar Mühendisliği Ana Bilim Dalı
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control