15 天前

基于门控全卷积网络的无约束手写文本无复发识别

Denis Coquenet, Clément Chatelain, Thierry Paquet
基于门控全卷积网络的无约束手写文本无复发识别
摘要

无约束手写文本识别是大多数文档分析任务中的关键步骤。传统方法通常采用深度循环神经网络,尤其是基于长短期记忆(Long Short-Term Memory, LSTM)单元的结构。然而,这类模型的主要局限在于参数量庞大,且在训练与推理过程中必须顺序执行,难以充分发挥并行计算的优势。作为一种替代方案,可通过大量使用卷积层来弥补长期记忆缺失的问题,因为卷积操作具有高度并行性,且参数量相对较少。本文提出一种门控全卷积网络(Gated Fully Convolutional Network)架构,作为对经典的CNN+LSTM结构的无循环替代方案。该模型采用连接时序分类(CTC)损失函数进行训练,在RIMES与IAM两个标准数据集上均取得了具有竞争力的识别性能。为便于实验复现,我们已公开全部代码:https://github.com/FactoDeepLearning/LinePytorchOCR。