2 个月前

Persis:一种使用卷积神经网络的波斯字体识别管道

Mohammadian, Mehrdad ; Maleki, Neda ; Olsson, Tobias ; Ahlgren, Fredrik
Persis:一种使用卷积神经网络的波斯字体识别管道
摘要

如果我们在设计工作中遇到合适的字体但不知道其名称,该怎么办?视觉字体识别(Visual Font Recognition, VFR)系统可以用于识别图像中的字体类型。这些系统可以帮助平面设计师确定图像中使用的字体。此外,VFR系统还有助于提高光学字符识别(Optical Character Recognition, OCR)系统的速度和准确性。在本文中,我们介绍了首个公开可用的波斯字体识别数据集,并采用了卷积神经网络(Convolutional Neural Networks, CNN)来解决这一问题。实验结果表明,所提出的流水线在我们的新数据集上达到了78.0%的Top-1准确率,在IDPL-PFOD数据集上达到了89.1%的Top-1准确率,在KAFD数据集上则达到了94.5%的Top-1准确率。此外,对于所提出的数据集中每个样本,整个流水线在CPU上的平均处理时间为0.54秒,在GPU上的平均处理时间为0.017秒。我们得出结论,CNN方法可以在无需额外预处理步骤(如特征提取、二值化、归一化等)的情况下用于识别波斯字体。