Büyük boyutlu veri sınıflandırmada doğrusal boyut indirgeme yöntemlerinin karşılaştırılması


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Karadeniz Teknik Üniversitesi, Fen Bilimleri Enstitüsü, elektrik-elektronik mühendisliği, Türkiye

Tezin Onay Tarihi: 2018

Tezin Dili: Türkçe

Öğrenci: Eray Yıldız

Danışman: Yusuf Sevim

Özet:

Yüksek boyutlu verinin analiz edilmesi ile birçok alanda karşılaşılır. Yüksek boyutlu veri analizinde, işlem yükü ve zaman açısından verinin etkin ve hızlı bir şekilde işlenmesi zor olabilir. Bu zorluğun üstesinden gelebilmek için boyut indirgeme yöntemleri yaygın bir şekilde kullanılmaktadır. Doğrusal boyut indirgeme yöntemleri, işlem yükü ve zaman açısından doğrusal olmayan yöntemlere göre daha iyi sonuç verirler. Bu yüzden yüksek boyutu veri analizinde daha çok tercih edilmektedirler. Bu tez çalışmasında yüz ve rakam veri kümeleri kullanılarak çeşitli sınıflandırma yöntemleri üzerinde popüler doğrusal boyut indirgeme yöntemleri ve performansları incelenmiştir. Bu yöntemler, Temel Bileşen Analizi (TBA), Doğrusal Ayırma Analizi (DAA), Yerellik Koruyan İzdüşüm (YKİ), Komşuluk Koruyan Gömme (KKG), Yerellik Duyarlı Ayırma Analizi (YDAA) ve İzometrik İzdüşümdür (İZİ). Doğrusal boyut indirgeme yöntemleri kullanılarak bir veri kümesinin sınıflandırılmasında doğrulukta bir artma veya azalma olmasının veri kümesinin türüne bağlı olduğu görülmüştür. Bazı boyut indirgeme yöntemlerinin sınıflandırma doğrulukları açısından veri kümelerinin türüne göre öne çıktığı görülmüştür. Hatta veri kümelerinden elde edilen özniteliklere göre bazı yöntemlerin öne çıktığı da görülmüştür.