2ヶ月前

ドキュメントレベルのエンティティベース抽出としてのテンプレート生成

Kung-Hsiang Huang; Sam Tang; Nanyun Peng
ドキュメントレベルのエンティティベース抽出としてのテンプレート生成
要約

ドキュメントレベルのエンティティベースの抽出(EE)は、エンティティの役割やエンティティ間の関係などのエンティティ中心の情報を様々な分野からテキストコーパスに自動的に取得するために重要な技術です。多くのドキュメントレベルのEEシステムは抽出モデルを構築していますが、これらのモデルはドキュメント全体での長期的な依存関係を表現することが困難です。この問題に対処するため、我々は2つのドキュメントレベルのEEタスク、つまりロールフィラー・エンティティ抽出(REE)と関係抽出(RE)のために生成フレームワークを提案します。まず、これらをテンプレート生成問題として定式化し、モデルが効率的にクロスエンティティ依存関係を捉え、ラベルの意味論を利用し、N項関係の識別における指数関数的な計算複雑さを避けることを可能にします。さらに、事前学習されたシーケンス・ツー・シーケンスモデルに新しいクロスアテンションガイド付きコピー機構「TopK Copy」を取り入れることで、入力ドキュメント内の重要な情報の識別能力を向上させます。MUC-4およびSciREXデータセットでの実験結果は、REEにおいて+3.26%、バイナリREにおいて+4.8%、4項REにおいて+2.7%というF1スコアで新たな最先端の成果を示しています。

ドキュメントレベルのエンティティベース抽出としてのテンプレート生成 | 最新論文 | HyperAI超神経