HyperAIHyperAI

Command Palette

Search for a command to run...

DocTr: 文書内の構造化情報抽出のためのドキュメントトランスフォーマー

Haofu Liao Aruni RoyChowdhury Weijian Li Ankan Bansal Yuting Zhang Zhuowen Tu Ravi Kumar Satzoda R. Manmatha Vijay Mahadevan

概要

視覚的に豊かな文書から構造化された情報抽出(Structured Information Extraction: SIE)の新しい枠組みを提案します。この枠組みは、既存のIOBタギングやグラフベースの枠組みが、入力テキストの正しい順序に過度に依存するか、複雑なグラフのデコーディングに苦労するという制限に対処することを目指しています。代わりに、視覚におけるアンカーベースのオブジェクト検出器に触発され、エンティティをアンカーワードとバウンディングボックスで表現し、エンティティリンクをアンカーワード間の関連として表現します。これにより、テキスト順序に対するロバスト性が向上し、エンティティリンク用のコンパクトなグラフを維持できます。この枠組みに基づいて、1) 視覚的に豊かな文書においてエンティティのバウンディングボックスを検出し関連付けることを目指したDOCument TRansformer(DocTr)と 2) 言語の文脈でのエンティティ検出学習を支援する単純な事前学習戦略を導入します。3つのSIEベンチマークでの評価結果は、提案された枠組みの有効性を示しており、全体的なアプローチは既存の解決策を上回っています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています