18日前

TPLinker:トークン対リンクによる単段階的エンティティおよび関係の共同抽出

Yucheng Wang, Bowen Yu, Yueyang Zhang, Tingwen Liu, Hongsong Zhu, Limin Sun
TPLinker:トークン対リンクによる単段階的エンティティおよび関係の共同抽出
要約

近年、構造化されていないテキストからエンティティおよび関係を抽出することはますます注目を集めているが、共有エンティティを持つ重複する関係を識別するという本質的な困難さから、依然として挑戦的な課題である。従来の研究では、同時学習(joint learning)が顕著な性能向上をもたらすことが示されている。しかし、これらの手法は通常、順次的かつ相互に関連する複数のステップを含んでおり、露出バイアス(exposure bias)の問題に直面している。訓練時には真の条件(ground truth)を用いて予測を行う一方で、推論時には完全に初期状態から抽出を開始しなければならない。この差異が誤差の蓄積を引き起こす。本論文では、この問題を軽減するため、一度のステージで重複する関係(共有エンティティを含む)を同時に発見できる、暴露バイアスに影響されないワンステージ同時抽出モデル、すなわちTPLinkerを提案する。TPLinkerは、同時抽出をトークンペアのリンク問題として定式化し、各関係タイプごとにエンティティペアの境界トークンを整合させるための新規なハンドシェイキングタギング方式を導入している。実験結果により、TPLinkerは重複関係および複数関係抽出において顕著な性能向上を達成し、2つの公開データセットにおいて最先端(state-of-the-art)の性能を実現した。

TPLinker:トークン対リンクによる単段階的エンティティおよび関係の共同抽出 | 最新論文 | HyperAI超神経