2 个月前
TextCaps:小规模数据集上的手写字符识别
Vinoj Jayasundara; Sandaru Jayasekara; Hirunima Jayasekara; Jathushan Rajasegaran; Suranga Seneviratne; Ranga Rodrigo

摘要
许多地方性语言由于缺乏大量标注训练数据而难以从近期字符识别系统的进展中获益。这主要是因为生成这些语言的大规模标注数据较为困难,同时深度学习技术在少量训练样本上无法有效学习。为了解决这一问题,我们引入了一种从现有样本生成新训练样本的技术,通过向其对应的实例参数添加随机控制噪声来实现现实增强,从而反映人类手写中的实际变化。我们的实验结果显示,在每个类别仅有200个训练样本的情况下,该方法在EMNIST字母数据集上的字符识别性能超过了现有结果,并且在三个数据集(EMNIST平衡数据集、EMNIST数字数据集和MNIST数据集)上达到了现有水平。此外,我们还开发了一种策略,通过有效结合损失函数来改进重建效果。我们的系统对于那些缺乏大量标注训练数据的地方性语言字符识别非常有用,甚至在其他相关的一般性场景如物体识别中也有应用价值。