12日前

TDEER:エンティティおよび関係の共同抽出のための効率的な翻訳デコードスキーマ

{Zhen He, Beidi Luan, Daichuan Yang, Chenghao Dong, Xiaotian Luo, Xianming Li}
TDEER:エンティティおよび関係の共同抽出のための効率的な翻訳デコードスキーマ
要約

構造的知識ベース(KB)の構築において、非構造化テキストからエンティティと関係を共同抽出し、事実トリプルを形成することは基本的なタスクである。一般的なアプローチは、エンティティペアを予測することで対応する関係を取得する方式である。しかし、特に重複するトリプル(overlapping triple)の処理において、このタスクを効率的に実行することは依然として困難である。このような課題に対処するために、本論文では新しい効率的なエンティティおよび関係抽出モデル、TDEER(Translating Decoding Schema for Joint Extraction of Entities and Relations)を提案する。従来のアプローチとは異なり、TDEERは関係を「主語から目的語へと変換する操作」として捉える。すなわち、TDEERはトリプルを「主語+関係→目的語」という形式でデコードする。この変換デコードスキーマにより、重複するトリプルを含むすべての可能なトリプルを自然に認識できるため、重複トリプル問題を効果的に処理できる。モデルの堅牢性を向上させるために、異なる段階における誤差蓄積を軽減するため、ネガティブサンプルを導入している。公開データセットにおける広範な実験の結果、TDEERは最先端(SOTA)のベースラインと比較して競争力ある性能を示した。さらに、計算複雑度の分析から、TDEERは強力なベースラインよりも効率的であることが示された。特に、最近のSOTAモデルと比較して、TDEERは2倍の速度で処理が可能である。コードは https://github.com/4AI/TDEER で公開されている。

TDEER:エンティティおよび関係の共同抽出のための効率的な翻訳デコードスキーマ | 最新論文 | HyperAI超神経