
要約
遠距離教師(Distant Supervision, DS)は、大規模なヒューリスティックラベル付きコーパスを生成することを目的としており、現在、ニューラル関係抽出において広く用いられている。しかし、この手法はラベルノイズの問題および長尾分布問題に大きく悩まされている。多くの先進的なアプローチは、これらの2つの問題を別々に取り扱うことが多く、それらの相互作用を無視している。本研究では、強化学習(Reinforcement Learning)と階層的関係探索モジュールを活用して、関係抽出の性能を向上させる新しいフレームワークRH-Netを提案する。本手法では、強化学習を用いてモデルが高品質なサンプルを選択するように指導する。さらに、データ豊富なクラスとデータ貧困なクラスの間で関連するサンプルから意味情報を共有するための階層的関係探索モジュールを提案する。反復プロセスにおいて、これらの2つのモジュールが相互に作用し合い、ノイズと長尾分布の問題を同時に緩和する。広く用いられているNYTデータセットを用いた大規模な実験により、本手法が最先端のベースラインに対して顕著な性能向上を達成することが明確に示された。