11 天前

CDeC-Net:用于文档图像中表格检测的复合可变形级联网络

Madhav Agarwal, Ajoy Mondal, C. V. Jawahar
CDeC-Net:用于文档图像中表格检测的复合可变形级联网络
摘要

定位文档图像中的页面元素(如表格、图表、公式等)是信息提取的关键第一步。本文提出一种新型端到端可训练的深度神经网络——CDeC-Net,用于检测文档图像中的表格。该网络基于Mask R-CNN的多阶段扩展结构,采用双主干网络设计,并引入可变形卷积,能够高效检测不同尺度的表格,在较高的交并比(IoU)阈值下仍保持优异的检测精度。我们在所有公开可用的基准数据集上对CDeC-Net进行了全面的实证评估,包括ICDAR-2013、ICDAR-2017、ICDAR-2019、UNLV、Marmot、PubLayNet和TableBank,并开展了大量实验验证。本方法具有三个重要特性:(i)仅需一个训练好的模型CDeC-Net‡,即可在所有主流基准数据集上表现良好;(ii)在多个IoU阈值(包括更高的阈值)下均展现出卓越的检测性能;(iii)在每个基准数据集上均遵循近期相关研究的统一评估协议,持续展现出优越的定量性能。我们将在项目发布中公开代码与模型,以保障实验结果的可复现性。

CDeC-Net:用于文档图像中表格检测的复合可变形级联网络 | 最新论文 | HyperAI超神经