2ヶ月前

Doc2EDAG: 中国語金融イベント抽出のためのエンドツーエンド文書レベルフレームワーク

Shun Zheng; Wei Cao; Wei Xu; Jiang Bian
Doc2EDAG: 中国語金融イベント抽出のためのエンドツーエンド文書レベルフレームワーク
要約

既存のイベント抽出(EE)手法の多くは、文内の範囲でしかイベント引数を抽出できません。しかし、金融、立法、医療などの新興アプリケーションから急速に増加するドキュメント量に対処する際には、このような文レベルのEE手法が苦戦します。これらのアプリケーションでは、イベント引数が異なる文に分散しており、同じドキュメント内に複数のイベント参照が頻繁に存在することがあります。これらの課題を解決するために、我々は新たなエンドツーエンドモデルであるDoc2EDAGを提案します。このモデルはエンティティベースの有向非循環グラフを生成し、ドキュメントレベルでのEE(DEE)を効果的に実現します。さらに、トリガーワードなし設計を採用することで、DEEタスクを再定式化し、ドキュメントレベルでのイベントラベリングを容易にしています。Doc2EDAGの有効性を示すために、上記の課題を持つ中国語の金融公告から構成される大規模な実世界データセットを作成しました。包括的な分析と広範な実験により、Doc2EDAGが最先端手法よりも優れていることが示されています。データとコードはhttps://github.com/dolphin-zs/Doc2EDAGで入手できます。

Doc2EDAG: 中国語金融イベント抽出のためのエンドツーエンド文書レベルフレームワーク | 最新論文 | HyperAI超神経