2 个月前
平安-VCGroup 的 ICDAR 2021 科学文献解析竞赛任务 B 解决方案:表格识别至 HTML
Jiaquan Ye; Xianbiao Qi; Yelin He; Yihao Chen; Dengyi Gu; Peng Gao; Rong Xiao

摘要
本文介绍了我们为ICDAR 2021科学文献解析竞赛任务B:表格识别至HTML所提出的解决方案。在我们的方法中,我们将表格内容识别任务划分为四个子任务:表格结构识别、文本行检测、文本行识别和框分配。我们的表格结构识别算法是在MASTER [1]的基础上进行定制的,MASTER是一种稳健的图像文本识别算法。PSENet [2]用于检测表格图像中的每一行文本。对于文本行识别,我们的模型同样基于MASTER构建。最后,在框分配阶段,我们将PSENet检测到的文本框与通过表格结构预测重建的结构项关联起来,并将识别出的文本行内容填充到相应的项中。我们提出的方法在开发阶段对9,115个验证样本达到了96.84%的TEDS分数,在最终评估阶段对9,064个样本达到了96.32%的TEDS分数。