
要約
関係抽出は、与えられた文における2つのエンティティ間の関係を分類する問題である。遠隔監督(Distant Supervision, DS)は、限られた教師データから関係抽出器を開発するための一般的な手法である。本研究では、遠隔監督による関係抽出設定において、多くの文が非常に長く、単語注目(word attention)によってより良い文表現が得られることに注目した。本論文での主な貢献は以下の3点である。第一に、我々は遠隔監督による関係抽出のために2つの新しい単語注目モデルを提案する。(1)双方向ゲートリカレントユニット(Bi-directional Gated Recurrent Unit, Bi-GRU)に基づく単語注目モデル(BGWA)、(2)エンティティ中心の注目モデル(Entity-centric Attention, EA)、そして(3)重み付け投票法を使用して複数の補完的なモデルを組み合わせた統合モデルである。第二に、GDSという新しい遠隔監督データセットを紹介する。GDSは、これまでのすべての遠隔監督ベンチマークデータセットに存在していたテストデータのノイズを取り除き、信頼性のある自動評価を可能にする。第三に、複数の実世界データセットを用いた広範な実験を通じて、提案手法の有効性を示す。