2 个月前

Doc2Graph:一种基于图神经网络的任务无关文档理解框架

Andrea Gemelli; Sanket Biswas; Enrico Civitelli; Josep Lladós; Simone Marinai
Doc2Graph:一种基于图神经网络的任务无关文档理解框架
摘要

几何深度学习最近在包括文档分析在内的多个机器学习领域引起了广泛关注。图神经网络(GNNs)由于能够揭示关键信息提取过程中至关重要的结构模式,已成为各种文档相关任务中的关键技术。然而,以往文献中提出的工作主要集中在任务驱动模型上,未能充分利用图的全部潜力。本文提出了一种基于图神经网络模型的任务无关文档理解框架——Doc2Graph,旨在解决不同类型文档的不同任务。我们在两个具有挑战性的数据集上评估了该方法,这些数据集涉及表单理解的关键信息提取、发票布局分析和表格检测。我们的代码已免费发布在 https://github.com/andreagemelli/doc2graph 上。

Doc2Graph:一种基于图神经网络的任务无关文档理解框架 | 最新论文 | HyperAI超神经