Teknoloji, sosyal bilimler ve diğer alanlarda yapılan çalışmaların sayısı hızla artmaktadır. Bu nedenle dergilerde bulunan makalelerin sayısı da her geçen gün artış göstermektedir. Dergide bulunan makaleleri manuel olarak sınıflandırmak çok zaman almaktadır. Bu nedenle, belge seviyesinde sınıflandırma, günümüzde farklı uygulama alanlarında çok sayıda metin belgesi bulunması nedeniyle her zaman önemli bir araştırma konusu olmuştur. Bu noktada, yapılandırılmamış metin analizi yapılmalı ve sınıflandırmak için uygun yöntemler tasarlanmalıdır. Verilerin hızlı artışı nedeniyle, sınıflandırma yapmak için güçlü yöntemlere ihtiyaç duyulmaktadır. Bundan dolayı, araştırmacılar güçlü yöntemler ve algoritmalar geliştirmeye çalışmaktadırlar. Yöntemlerin ve algoritmaların başarısı, uygulanan dil, verilerin yapısı, analiz edilecek verinin uzunluğu gibi birçok faktöre bağlıdır. Çalışmamızda destek vektör makinesi (DVM), k-en yakın komşu algoritması (KNN), karar ağacı (KA) ve genetik algoritma (GA) tabanlı melez yöntemler kullanılarak Ankara Üniversitesi Siyasal Bilgiler Fakültesi Dergisi’nde bulunan bilimsel makaleler sınıflandırılmıştır. Ayrıca farklı veri kümeleri kullanılarak önerilen yöntemler karşılaştırılmıştır. Çalışmanın sonuçları önerilen GA tabanlı yöntemlerin minimum %82.5 doğruluk oranı ile belge sınıflandırılmasında başarıyla kullanılabileceğini göstermiştir.
The number of studies in technology, social sciences and other fields is increasing rapidly. For this
reason, the number of articles in journals is increasing day by day. It takes a lot of time to manually classify the
articles in the journal. Therefore, classification at the document level has always been an important research
topic because of the large number of text documents in different application areas. At this point, unstructured
text analysis should be used and appropriate methods should be designed to classify. Due to the rapid increase
of data, strong methods are needed to classify. Hence, researchers are trying to develop powerful methods and
algorithms. The success of the methods and algorithms depends on many factors such as the applied language,
the structure of the data, and the length of the data to be analyzed. In our study, scientific articles in Ankara
University Journal of the Faculty of Political Science are classified using hybrid methods based on support
vector machine (DVM), k-nearest neighbor algorithm (KNN), decision tree (KA) and genetic algorithm (GA).
In addition, the proposed methods were compared using different data sets. The results of the study showed
that the proposed GA based methods can be successfully used in document classification with a minimum
accuracy of 82.5%.