
要約
最近の進展により、エンティティ・関係抽出は複数回の質問応答(QA)タスクとして再定式化され、機械読解(MRC)モデルに基づく効果的な解決策が提供されている。しかし、既存の手法はエンティティおよび関係の意味を表すために単一の質問を使用しているため、文脈の意味的多様性を考慮すると、直感的に不十分である。また、既存のモデルはすべての関係タイプを列挙して質問を生成するため、効率が低く、混乱を招く質問が生じやすいという問題がある。本研究では、多様な質問応答を活用することで、既存のMRCベースのエンティティ・関係抽出モデルを改善する。まず、エンティティのスパンを検出するための多様性を考慮した質問応答メカニズムを導入し、異なる回答を統合するための2種類の回答選択戦略を設計した。次に、潜在的な関係の部分集合を予測し、無関係な関係を除外することで、効率的な質問生成を実現する手法を提案した。最後に、エンティティ抽出と関係抽出をエンドツーエンドで統合し、共同学習によって最適化した。実験の結果、提案手法はベースラインモデルを顕著に上回り、ACE05では関係のF1スコアが62.1%(+1.9%)に、CoNLL04では71.9%(+3.0%)に改善された。本研究の実装コードは、https://github.com/TanyaZhao/MRC4ERE にて公開されている。