2ヶ月前

単語とエンティティの埋め込みを組み合わせた学習による固有名詞の曖昧性解消

Ikuya Yamada; Hiroyuki Shindo; Hideaki Takeda; Yoshiyasu Takefuji
単語とエンティティの埋め込みを組み合わせた学習による固有名詞の曖昧性解消
要約

固有表現解釈(Named Entity Disambiguation: NED)とは、文書中に複数存在する固有表現の言及を知識ベース(Knowledge Base: KB)(例:Wikipedia)内の正確な参照に解決するタスクを指します。本論文では、NEDに特化した新しい埋め込み手法を提案します。提案手法は、単語とエンティティを同一の連続ベクトル空間に同時射影します。スキップグラムモデルを拡張するために2つのモデルを使用しています。KBグラフモデルは、KBのリンク構造を利用してエンティティ間の関連性を学習し、アンカーコンテキストモデルは、KBのアンカーとそのコンテキスト単語を利用することで、類似した単語とエンティティがベクトル空間内で近接するようにベクトルを整列することを目指しています。提案された埋め込みに基づくコンテキストと標準的なNED特徴量を組み合わせることで、標準的なCoNLLデータセットでは93.1%、TAC 2010データセットでは85.2%という最先端の精度を達成しました。

単語とエンティティの埋め込みを組み合わせた学習による固有名詞の曖昧性解消 | 最新論文 | HyperAI超神経