Command Palette
Search for a command to run...
الانتباه إلى ما تقرأه: التعرف على النص المكتوب بخط اليد غير المتكرر
الانتباه إلى ما تقرأه: التعرف على النص المكتوب بخط اليد غير المتكرر
Lei Kang Pau Riba Marçal Rusiñol Alicia Fornés Mauricio Villegas
الملخص
标志着手写识别领域一个重要里程碑的是循环神经网络的出现,尽管在不同书写风格之间存在巨大差异,这些网络仍实现了令人印象深刻的识别准确率。序列化架构非常适合建模文本行,不仅因为文本本身具有固有的时间特性,还因为它们能够学习字符和词语序列上的概率分布。然而,使用此类循环范式在训练阶段会带来代价,因为其顺序处理流程阻碍了并行化。在本研究中,我们提出了一种非循环方法,通过使用Transformer模型来识别手写文本。我们提出了一种新颖的方法,完全避免了循环结构。通过在视觉阶段和文本阶段均采用多头自注意力(multi-head self-attention)层,我们能够同时处理字符识别任务,并学习待解码字符序列中的语言相关依赖关系。我们的模型不受任何预定义词汇表的限制,能够识别训练词汇表之外的词汇,即“未登录词”(out-of-vocabulary words)。与先前方法相比,我们取得了显著进展,并证明即使在少样本学习(few-shot learning)场景下,也能获得令人满意的识别准确率。