Tezin Türü: Yüksek Lisans
Tezin Yürütüldüğü Kurum: Karadeniz Teknik Üniversitesi, Fen Bilimleri Enstitüsü, --, Türkiye
Tezin Onay Tarihi: 2024
Tezin Dili: Türkçe
Öğrenci: Alperen Uzun
Danışman: Mehmet Öztürk
Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu
Özet:
El Yazısı Karakter Tanıma, karakterleri bir görüntü olarak algılayıp bu görüntüleri analiz ederek metin formatında işleyebilen algoritmalar kullanır. Bu teknoloji belgelerin dijitalleştirilmesi ve arşivlenmesi gibi birçok alanda önemli bir rol oynar. Literatürde el yazısı karakter tanıma çalışmaları genellikle İngilizce alfabe ve yaygın olarak kullanılan Latin karakterleri üzerine yoğunlaşmaktadır. Türkçe gibi özel karakterler içeren diller için geliştirilmiş veri setlerinin sınırlı olması bu dillerdeki tanıma sistemlerinin performansını olumsuz yönde etkileyebilir. Bu çalışmanın hedefi Türk alfabesindeki özel karakterleri içeren veri setleri hazırlayarak el yazısı karakter tanıma alanında literatüre katkı sağlamak ve kendi oluşturduğumuz bir veri seti üzerinde derin öğrenme tekniklerinin başarımını değerlendirmektir. Bu amaçla bir kurumda çalışan 400 kişinin farklı yazım stilleriyle gönüllü olarak doldurduğu belgelerden el yazısı karakterler elde edilerek bir veri seti oluşturulmuş, ardından derin öğrenme tabanlı CNN (Evrişimsel Sinir Ağı) modelleri bu veri setiyle eğitilmiştir. CNN modellerinin test sonuçları karşılaştırıldığında en başarılı modelin %93,86 test başarısına ulaştığı görülmüştür. En başarılı CNN modelininin performansı çeşitli metriklerle değerlendirilmiş ve modelin sınıflandırma başarısı detaylı bir şekilde analiz edilmiştir.