HyperAIHyperAI

Command Palette

Search for a command to run...

基于门控全卷积网络的无约束手写文本无复发识别

Denis Coquenet Clément Chatelain Thierry Paquet

摘要

无约束手写文本识别是大多数文档分析任务中的关键步骤。传统方法通常采用深度循环神经网络,尤其是基于长短期记忆(Long Short-Term Memory, LSTM)单元的结构。然而,这类模型的主要局限在于参数量庞大,且在训练与推理过程中必须顺序执行,难以充分发挥并行计算的优势。作为一种替代方案,可通过大量使用卷积层来弥补长期记忆缺失的问题,因为卷积操作具有高度并行性,且参数量相对较少。本文提出一种门控全卷积网络(Gated Fully Convolutional Network)架构,作为对经典的CNN+LSTM结构的无循环替代方案。该模型采用连接时序分类(CTC)损失函数进行训练,在RIMES与IAM两个标准数据集上均取得了具有竞争力的识别性能。为便于实验复现,我们已公开全部代码:https://github.com/FactoDeepLearning/LinePytorchOCR


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供