Copy-Move Audio Forgery Detection with Instantaneous Frequency


Kılıç M., Tahaoğlu G., Üstübioğlu B., Üstübioğlu A., Ulutaş G.

2024 32nd Signal Processing and Communications Applications Conference (SIU), Mersin, Türkiye, 15 - 18 Mayıs 2024, ss.1-4

  • Yayın Türü: Bildiri / Tam Metin Bildiri
  • Doi Numarası: 10.1109/siu61531.2024.10600890
  • Basıldığı Şehir: Mersin
  • Basıldığı Ülke: Türkiye
  • Sayfa Sayıları: ss.1-4
  • Karadeniz Teknik Üniversitesi Adresli: Evet

Özet

Son zamanlarda teknolojinin gelişmesi ve bu teknolojiye erişimin kolaylaşması, dijitalleşen dünyada verilere daha rahat ulaşma ve ulaşılan veriler üzerinde zahmetsizce değişiklik yapma olanağı sağlamaktadır. Bu çalışmada sesin bir bölümünün kopyalanıp aynı sese yapıştırılması ve çeşitli atakların uygulanmasıyla elde edilen sahteciliklerin tespiti için yeni bir yaklaşım önerilmiştir. Önerilen yöntemde perde izleme yöntemi kullanılarak konuşma kaydı sesli kısımlara bölünmekte ve bu kısımlardan Anlık Frekans özelliği çıkarılmaktadır. Benzerlik karşılaştırması yapılacak sesli segment çiftlerinin Perde dizileri incelenmektedir. İlk perde dizisinin deneysel çalışmalarla belirlenen eşit aralıklı 𝒎 sayıda genlik değeri alınmakta ve ikinci perde dizisinde bu değerler aranmaktadır. Birinci diziden alınan m elemanın 𝒏 tanesi ikinci dizi içerisinde bulunması durumunda sesli segment çiftleri arası benzerlik bakılmaktadır. Sesli bölgeler arası hesaplanan minimum Dinamik Zaman Atlama skoru kopyalanan ve yapıştırılan bölgelerin konumu hakkında fikir vermektedir.

Recently, the development of technology and access to this technology facilitates the possibility of easier access to data in the digitalized world and making effortless changes to the data reached. In this study, a new approach was proposed to copy a part of the audio to the same audio and to determine the forgery obtained by applying various attacks. In the proposed method, the speech recording is divided into syllables by using the Pitch Tracking method, and the Instantaneous frequency feature is extracted from these parts. Before comparing similarity, the Pitch sequences of syllable segment pairs are examined. The equal number of amplitude m value of the first Pitch series determined by experimental studies is obtained and these values are sought in the second Pitch series. If the n element from the first series is found in the second series, the similarity between syllable segment pairs is examined. The minimum Dynamic Time Warping score calculated between syllable regions gives an idea about the location of the copied and pasted areas.