Derin öğrenme yöntemleri ile Türkçe el yazısı tanıma


Tezin Türü: Yüksek Lisans

Tezin Yürütüldüğü Kurum: Karadeniz Teknik Üniversitesi, Fen Bilimleri Enstitüsü, --, Türkiye

Tezin Onay Tarihi: 2024

Tezin Dili: Türkçe

Öğrenci: Alperen Uzun

Danışman: Mehmet Öztürk

Açık Arşiv Koleksiyonu: AVESİS Açık Erişim Koleksiyonu

Özet:

El Yazısı Karakter Tanıma, karakterleri bir görüntü olarak algılayıp bu görüntüleri analiz ederek metin formatında işleyebilen algoritmalar kullanır. Bu teknoloji belgelerin dijitalleştirilmesi ve arşivlenmesi gibi birçok alanda önemli bir rol oynar. Literatürde el yazısı karakter tanıma çalışmaları genellikle İngilizce alfabe ve yaygın olarak kullanılan Latin karakterleri üzerine yoğunlaşmaktadır. Türkçe gibi özel karakterler içeren diller için geliştirilmiş veri setlerinin sınırlı olması bu dillerdeki tanıma sistemlerinin performansını olumsuz yönde etkileyebilir. Bu çalışmanın hedefi Türk alfabesindeki özel karakterleri içeren veri setleri hazırlayarak el yazısı karakter tanıma alanında literatüre katkı sağlamak ve kendi oluşturduğumuz bir veri seti üzerinde derin öğrenme tekniklerinin başarımını değerlendirmektir. Bu amaçla bir kurumda çalışan 400 kişinin farklı yazım stilleriyle gönüllü olarak doldurduğu belgelerden el yazısı karakterler elde edilerek bir veri seti oluşturulmuş, ardından derin öğrenme tabanlı CNN (Evrişimsel Sinir Ağı) modelleri bu veri setiyle eğitilmiştir. CNN modellerinin test sonuçları karşılaştırıldığında en başarılı modelin %93,86 test başarısına ulaştığı görülmüştür. En başarılı CNN modelininin performansı çeşitli metriklerle değerlendirilmiş ve modelin sınıflandırma başarısı detaylı bir şekilde analiz edilmiştir.