17日前

関係三項抽出のための新規カスケード二値タギングフレームワーク

Zhepei Wei, Jianlin Su, Yue Wang, Yuan Tian, Yi Chang
関係三項抽出のための新規カスケード二値タギングフレームワーク
要約

構造化されていないテキストから関係トリプルを抽出することは、大規模な知識グラフ構築において極めて重要である。しかし、同一文内に同一のエンティティを共有する複数の関係トリプルが存在する「オーバーラップトリプル問題」を効果的に解決できる既存の手法は少ない。本研究では、関係トリプル抽出タスクを再考する新たな視点を提示し、原理的な問題定式化に基づいて、新たなカスケード二値タギングフレームワーク(CasRel)を提案する。従来の手法が関係を離散的なラベルとして扱うのに対し、本フレームワークは関係を「文内の主語を目的語にマッピングする関数」としてモデル化することで、オーバーラップ問題を自然に扱える。実験の結果、CasRelフレームワークはランダム初期化されたBERTエンコーダを用いても、既存の最先端手法を上回る性能を示しており、新しいタギングフレームワークの強力さを示している。さらに、事前学習済みBERTエンコーダを用いることで性能がさらに向上し、公開データセットNYTおよびWebNLGにおいて、それぞれF1スコアで17.5および30.2の絶対的な向上を達成し、最も強力なベースラインを上回った。オーバーラップトリプルのさまざまなシナリオに対する詳細な分析から、本手法がすべてのシナリオにおいて一貫した性能向上を実現していることが明らかになった。本研究のソースコードおよびデータはオンラインで公開されている。

関係三項抽出のための新規カスケード二値タギングフレームワーク | 最新論文 | HyperAI超神経