2ヶ月前

文内のノイズ削減と転移学習を用いたニューラル関係抽出

Tianyi Liu; Xinsong Zhang; Wanhao Zhou; Weijia Jia
文内のノイズ削減と転移学習を用いたニューラル関係抽出
要約

関係抽出は、既存の知識ベースを用いて自動的に関係事実を抽出するために広く使用される遠隔監督法により、知識ベースの完成と構築において重要な役割を果たします。しかし、自動的に構築されたデータセットには、ノイズワードを含む低品質の文が多数存在し、これが現在の遠隔監督法で無視されているため、精度が受け入れられないレベルに低下しています。この問題を緩和するため、我々は新しい単語レベルの遠隔監督アプローチを提案します。まず、Sub-Tree Parse (STP) を構築して、関係に関連しないノイズワードを削除します。次に、サブツリーを入力として使用し、エンティティごとの注意機構(entity-wise attention)を適用して各インスタンスにおける関係語の重要な意味的特徴を識別するニューラルネットワークを構築します。さらに、我々のモデルがノイズワードに対してより堅牢になるように、転移学習によってエンティティ分類という関連タスクから得られた先験的な知識でネットワークを初期化します。我々は New York Times (NYT) と Freebase のコーパスを使用して広範な実験を行いました。実験結果は、我々のアプローチが効果的であり、最新の研究よりも Precision/Recall (PR) 曲線下面積(area under the PR curve)が 0.35 から 0.39 に向上することを示しています。

文内のノイズ削減と転移学習を用いたニューラル関係抽出 | 最新論文 | HyperAI超神経