2ヶ月前

Doc2Graph: グラフニューラルネットワークに基づくタスク非依存の文書理解フレームワーク

Andrea Gemelli; Sanket Biswas; Enrico Civitelli; Josep Lladós; Simone Marinai
Doc2Graph: グラフニューラルネットワークに基づくタスク非依存の文書理解フレームワーク
要約

最近、幾何学的ディープラーニングはドキュメント分析を含む幅広い機械学習分野で大きな関心を集めています。グラフニューラルネットワーク(GNN)の応用は、重要な構造パターンを解明できるため、キーアイフォメーション抽出プロセスにおいて基本的な役割を果たし、さまざまなドキュメント関連タスクで不可欠となっています。これまでの研究では、タスク駆動型モデルが提案されており、グラフの全般的な可能性が十分に考慮されていませんでした。本研究では、異なる種類のドキュメントに対して異なるタスクを解決するためのGNNモデルに基づいたタスク非依存型ドキュメント理解フレームワーク「Doc2Graph」を提案します。当方針は、フォーム理解におけるキーアイフォメーション抽出、請求書レイアウト分析、テーブル検出などの困難なデータセットで評価されました。当方針のコードは、https://github.com/andreagemelli/doc2graph にて自由にアクセス可能です。

Doc2Graph: グラフニューラルネットワークに基づくタスク非依存の文書理解フレームワーク | 最新論文 | HyperAI超神経