ニューラルリンク予測器のデータ効率的な複雑なクエリ応答への適応

不完全な知識グラフ上の複雑なクエリに答えることは、モデルが欠落する知識の存在下で複雑な論理クエリに答えるという課題であり、非常に困難です。従来の研究では、この問題を解決するために、複雑なクエリ応答タスクのために端から端まで訓練されたアーキテクチャを設計することを提案してきました。しかし、その推論プロセスは解釈が難しく、大量のデータとリソースが必要となるため、問題がありました。別の研究方向では、単純なニューラルリンク予測器を再利用して複雑なクエリに答える方法が提案され、訓練データ量を数桁削減しながら解釈可能な答えを提供しています。このようなアプローチで使用されるニューラルリンク予測器は、複雑なクエリ応答タスクに対して明示的に最適化されていないため、そのスコアは相互作用するために調整されていません。これらの問題に対処するために、我々はCQD$^{\mathcal{A}}$(Complex Query Decomposition with Adaptation)と呼ばれるパラメータ効率の高いスコア \emph{適応} モデルを提案します。このモデルは、ニューラルリンク予測器のスコアを複雑なクエリ応答タスクのために再調整することを目指しています。ニューラルリンク予測器は固定されたままですが、適応コンポーネント(モデルパラメータ数を $0.03\%$ だけ増加させる)は下流の複雑なクエリ応答タスクで訓練されます。さらに、校正コンポーネントにより原子的な否定を含むクエリに対する推論が可能となりました。これは以前にはリンク予測器では不可能でした。実験において、CQD$^{\mathcal{A}}$ は現行の最先端手法よりも著しく正確な結果を生成し、すべてのデータセットとクエリタイプにおける平均 Mean Reciprocal Rank (MRR) 値が $34.4$ から $35.1$ へと向上しました。これには利用可能な訓練用クエリタイプの $\leq 30\%$ のみを使用しています。また、CQD$^{\mathcal{A}}$ はデータ効率的であり、訓練用複雑なクエリの $1\%$ のみを使用して競争力のある結果を得ることができることを示しています。さらにドメイン外評価でも堅牢性が確認されています。