11日前
集合予測ネットワークを用いたエンティティおよび関係の同時抽出
Dianbo Sui, Yubo Chen, Kang Liu, Jun Zhao, Xiangrong Zeng, Shengping Liu

要約
共同エンティティおよび関係抽出タスクは、文からすべての関係トリプルを抽出することを目的としている。本質的に、文に含まれる関係トリプルは順序が無関係である。しかし、従来のseq2seqベースのモデルは、学習フェーズにおいてトリプルの集合を順序付きのシーケンスに変換する必要があった。この課題を克服するため、本研究では共同エンティティおよび関係抽出を直接集合予測問題として扱い、抽出モデルが複数のトリプルの順序を予測する負担から解放されるようにした。この集合予測問題を解決するために、Transformerを特徴とする非自己回帰的並列デコードを備えたネットワークを提案する。自己回帰的手法が特定の順序で一つずつトリプルを生成するのに対し、提案するネットワークは一度の推論で最終的なトリプル集合を直接出力する。さらに、二部マッチングを用いて一意な予測を強制する集合ベースの損失関数も設計した。交差エントロピー損失はトリプルの順序のわずかなずれに対して過剰にペナルティを課すのに対し、提案する二部マッチング損失は予測の任意の順列に対して不変である。このため、トリプルの順序に依存せず、関係タイプとエンティティに焦点を当てることで、提案ネットワークに対してより正確な学習信号を提供できる。2つのベンチマークデータセットにおける実験結果から、提案モデルが現在の最先端手法を顕著に上回ることが示された。学習用コードおよび学習済みモデルは、http://github.com/DianboWork/SPN4RE にて公開される予定である。