阿拉伯手写识别(AHR)由于阿拉伯文字的复杂性和培训数据的可用性有限,提出了独特的挑战。本文提出了一种在强大的CNN-BLSTM体系结构中集成生成对抗网络(GAN)以进行数据增强的方法,旨在显着提高AHR性能。我们采用了CNN-BLSTM网络,加上连接式时间分类(CTC)进行准确的序列建模和识别。为了解决数据限制,我们结合了基于gan的数据增强模块,该模块在IFN-En-Enit Arabic手写数据集中训练,以生成现实和多样化的合成样本,从而有效地增强了原始的培训语料库。对IFN-ENIT基准的广泛评估证明了采用方法的功效。我们达到95.23%的识别率,超过基线模型3.54%。本研究提出了一种有希望的AHR数据增强方法,并证明了单词识别准确性的显着提高,为更健壮和准确的AHR系统铺平了道路。
主要关键词