Tez Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Karadeniz Teknik Üniversitesi, Fen Bilimleri Enstitüsü, Fen Bilimleri Enstitüsü, Türkiye
Tez Danışmanı: İbrahim Savran
Tezin Onay Tarihi: 2018
Tezin Dili: Türkçe
Özet:
| Genetik, genom bilgisini öğrenip canlıların tüm yapı ve aktivitelerini incelemeyi hedefleyen bir bilimdir. Bu amaçla 20.yy başından günümüze kadar canlıların genom dizilerinin elde edilmesine çalışılmaktadır. DNA dizilimi; adli tıp, mikrobiyoloji, tıbbı tanı koyma, genetik hastalıkların tespiti ve biyokimyasal alanındaki problemlere çözüm bulmak için kullanılmaktadır. DNA dizileme çalışmalarına, geleneksel dizileme yöntemleriyle başlanmış olup, bu yöntemler düşük hatalı dizilim elde etse de uzun sürede ve yüksek maliyette kısa parçaları dizilemeye daha uygundur. Bu yöntemlerin dezavantajlarını gidermek amacıyla kısa sürede ve düşük maliyette tüm genom bilgisini elde edebilecek yeni nesil dizileme yöntemleri geliştirilmiştir. Ancak yeni nesil dizileme yöntemlerinin hata oranları geleneksel yöntemlere göre fazladır. Bu problemi çözmek amacıyla, bu çalışmada yeni nesil dizileme yöntemleriyle elde edilen genom bilgisindeki okuma hatalarını tespit edip düzeltecek yeni bir algoritma önerilmiştir. Önerilen algoritmada k-mer yaklaşımı kullanılarak okunan sekanslar gruplandırılmıştır. Aynı bölgeyi temsil eden sekanslarda çoğunluk oylaması yapılarak, hatalı nükleotidler doğru nükleotidlerle değiştirilerek sekanslar güncellenmektedir. Önerilen hata düzeltme algoritması farklı veri setleri üzerinde test edilmiş olup mevcut hata düzeltme algoritmalarına çok yakın veya daha iyi sonuçlar elde ettiği gözlemlenmiştir. Önerilen algoritmanın duyarlılık değeri [97,00-98,18] özgüllük değeri ise [99,62-99,88] aralığında bulunmaktadır. Literatürdeki mevcut algoritmalarda duyarlılık değeri [96,60-99,99], özgüllük değeri ise [48,81-100,00] aralığında değişmektedir. | |||