Özellik seçimi makine öğrenmesi alanında, sınıflandırma işlemlerinin öncesinde bulunan önemli bir aşamadır. Ayırt edici özelliklerin iyi belirlendiği durumlarda, sınıflandırma başarı performası artar ve daha az özellik değerlendirildiği için hesaplama maliyeti azalır. Elektroensefalografi (EEG) yöntemi ile beynin spontan elektrik aktiviteleri ölçülmektedir. EEG sinyallerinin analiz edilmesiyle, duygu durumu, hastalık teşhisi, anomali tespiti yapılabilmektedir. Bu çalışmada, EEG sinyallerinden epilepsi teşhisi amacıyla, sınıflandırmada kullanılan özelliklerin seçilmesine çalışılmıştır. Kullanılan verisetinde, epileptik ve sağlıklı bireylerden oluşan 2 sınıf mevcuttur. Verisetinde, EEG sinyallerinin alt bileşenlerinden 667 özellik vardır. Sınıflandırma için bu 667 özelikten meta-segisel optimizasyon algoritmaları ile ayırt edici özellikler seçilmiştir. Sınıflandırma için k en yakın komşuluk algoritması kullanılmıştır. EEG sinyallerinin alt bileşenlerinin tamamı ile yapılan sınıflandırmada, %60,05 doğruluk başarısı elde edilmiştir. Gri Kurt Optimizasyonu, Balina Optimizasyonu ve Harris Şahinler Optimizasyonu metasezgisel algoritmaları ile özellik seçimi sonucunda, sınıflandırma başarısı %80,16 olarak elde edilmiştir. Bu sınıflandırma başarısı 5-10 özellik kullanılarak elde edilebilmektedir. Sonuç olarak meta-sezgisel optimizasyon algoritmaları ile daha az özellik seçilerek doğruluk oranı artmış ve hesaplama maliyeti azalmıştır.
Feature selection is an important stage in the field of machine learning before classification processes. In cases where distinguishing features are well determined, classification success performance increases. Another advantage is that the computational cost is reduced because fewer features are evaluated. Electroencephalography (EEG) is a method that measures spontaneous electrical activities of the brain. By analyzing EEG signals, emotional state, disease diagnosis and anomaly detection can be made. In this study, feature selection for classification in epilepsy diagnosis from EEG signals was attempted. The dataset used has two classes, consisting of epileptic and healthy individuals. There are 667 features in the dataset from subcomponents of EEG signals. For classification, distinctive features were selected from these 667 features with metaheuristic optimization algorithms. The k nearest neighbor algorithm was used for classification. In the classification made with all subcomponents of EEG signals, 60.05% accuracy was achieved. As a result of feature selection with Gray Wolf Optimization, Whale Optimization and Harris Hawks Optimization metaheuristic algorithms, the classification success was achieved as 80.16%. This classification success can be achieved by using 5-10 features. As a result, it is seen that the accuracy rate increases and the computational cost decreases by selecting fewer features with meta-heuristic optimization algorithms.