Tez Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Karadeniz Teknik Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği, Türkiye
Tez Danışmanı: Güzin Ulutaş
Tezin Onay Tarihi: 2024
Tezin Dili: Türkçe
Özet:
Günümüzde haberleşme, adli
süreçler ve sesli komutla çalışan sistemlerde kullanılan ses kayıtlarının
doğruluğu ve güvenilirliği büyük önem taşımaktadır. Ses kayıtları, kişilerin
izni dahilinde veya rızası olmadan elde edilebilmektedir ve bu kayıtlar sahte
ses üretimi amacıyla kullanılabilmektedir. Ses üzerinde yapılan sahtecilik
işlemlerinden en yaygın ve gerçekleştirilmesi kolay olanı kopyala yapıştır
işlemidir.
Kopyala yapıştır ses
sahteciliği tespiti için iki yöntem önerilmiştir: anahtar noktalarının
kümelendirilmesi ve sesten elde edilen graf görüntülerinin sınıflandırılması.
İlk yöntemde, BRIEF, AKAZE, SIFT ve SURF teknikleri kullanılarak anahtar
noktalar ve tanımlayıcılar çıkarılmış, ardından bu tanımlayıcılar OPTICS,
k-Means ve g2NN algoritmaları ile kümelendirilmiştir. Bu yöntem, TIMIT
verisetinde ataksız sahte seslerde ve çeşitli saldırı senaryolarında ortalama
0.90 duyarlılık elde etmiştir. İkinci yöntemde, yüksek çözünürlüklü
spektrogramdan elde edilen SIFT anahtar noktaları g2NN kullanılarak
kümelendirilmiş, yoğun eşleşme bölgeleri tespit edildikten sonra bu bölgeye ait
frekans aralığı belirlenmiş ve ses, band geçiren süzgeçten geçirilmiştir. Hızlı
Fourier Transform ile frekans uzayına geçilerek, önerilen sarmal yapı sayesinde
çerçeve bazında özellikler çıkarılmış ve bu özelliklerden graf görüntüleri
oluşturulmuştur. Graf görüntülerinin sınıflandırılmasıyla, sesler sahte veya
orijinal olarak etiketlenmiş ve bu yöntem Arabic, TIMIT ve Türkçe veri
setlerinde sırasıyla 0.95, 0.87 ve 0.92 F-skoru ile başarı göstermiştir.