
要約
エンティティと関係の同時抽出は、自然言語処理(NLP)における重要なタスクであり、平文からすべての関係三項組(triplet)を抽出することを目的としている。このタスクは、ある文から抽出される三項組の一部がエンティティを共有する(重複する)場合があるため、大きな課題である。従来の大多数の手法は、まずエンティティ認識を行い、その後、すべてのエンティティペア間で関係検出を行うが、このアプローチは多くの冗長な処理を伴うことが一般的である。本論文では、この問題に対処するため、関係特化型アテンションネットワーク(Relation-Specific Attention Network, RSAN)を提案する。本RSANは、関係に敏感なアテンション機構を用いて、各関係ごとに特化した文表現を構築し、その後、シーケンスラベリングによって対応する頭部エンティティと尾部エンティティを抽出する。公開データセット2つにおける実験結果から、本モデルが重複する三項組を効果的に抽出でき、最先端の性能を達成することが示された。コードは以下のURLで公開されている:https://github.com/Anery/RSAN