3ヶ月前

知識グラフ埋め込みが未観測データにどのように外挿するか:意味的証拠の視点から

Ren Li, Yanan Cao, Qiannan Zhu, Guanqun Bi, Fang Fang, Yi Liu, Qian Li
知識グラフ埋め込みが未観測データにどのように外挿するか:意味的証拠の視点から
要約

知識グラフ埋め込み(Knowledge Graph Embedding, KGE)は、エンティティおよび関係の表現を学習することを目的としている。多くのKGEモデルは、特に外挿(extrapolation)シナリオにおいて顕著な成果を上げており、未観測の三項組(h, r, t)に対して、訓練済みモデルが(h, r, ?)からtを、あるいは(?, r, t)からhを正しく予測できる。このような外挿能力は非常に印象的である。しかし、既存の多くKGE研究は、精密な三項組モデリング関数の設計に注力しており、これは観測された三項組の妥当性を測定する方法を提供するが、なぜその手法が未観測データに外挿可能であるのか、また外挿を可能にする重要な要因は何であるかについての説明は限定的である。本研究では、以下の2つの課題に取り組む:1. KGEはどのように未観測データに外挿するのか? 2. 外挿能力に優れたKGEモデルをどのように設計するか? 問題1に対して、外挿に影響を与える要因を関係、エンティティ、三項組のレベルからそれぞれ検討し、訓練データから観測可能な3つの意味的証拠(Semantic Evidences, SEs)を提案する。これらのSEsは、外挿のための重要な意味的情報を提供する。その後、複数の代表的なKGE手法を用いた広範な実験により、SEsの有効性を検証した。問題2に対しては、上記の3レベルのSEを効果的に活用できるように、新しいGNNベースのKGEモデル、すなわち「意味的証拠認識型グラフニューラルネットワーク(Semantic Evidence aware Graph Neural Network, SE-GNN)」を提案する。SE-GNNでは、各レベルのSEが対応する近傍パターンによって明示的にモデル化され、多層アグリゲーションにより十分に統合される。これにより、より外挿性の高い知識表現を獲得することが可能となる。最後に、FB15k-237およびWN18RRデータセットを用いた広範な実験を通じて、SE-GNNが知識グラフ補完タスクにおいて最先端の性能を達成し、特に外挿能力において優れた性能を発揮することを示した。本研究のコードは、https://github.com/renli1024/SE-GNN にて公開されている。