
要約
多様な応用分野からの知識は、RDFエンジンに格納された知識グラフ(KG)として整理され、SPARQLエンドポイントを介してWeb上でアクセス可能となっている。適切な構文を持つSPARQLクエリを記述するには、グラフ構造およびその構成要素の正確なURIに関する情報が必要となるが、これは一般ユーザーにとって現実的ではない。質問応答(QA)システムは、自然言語による質問をSPARQLに変換することで、ユーザーを支援する。従来のQAシステムは、通常、アプリケーション固有の手動で作成されたルールに基づいており、あるいはターゲットとなるKGごとに事前情報の収集、高コストな前処理、モデルの再適応が必要となる。その結果、広範なアプリケーションやKGに一般化することが困難である。本論文では、ターゲットとなる各KGに合わせてカスタマイズする必要のない汎用QAシステム「KGQAn」を提案する。従来の手動ルールに代わり、KGQAnは神経ネットワークのシーケンス・トゥ・シーケンスモデルを用いて、質問を中間的な抽象表現に変換するという、質問理解をテキスト生成問題として新たに形式化するアプローチを導入する。さらに、事前処理を一切不要とする「ジャストインタイムリンク」を構築した。このリンクは、RDFストアの公開APIおよび既存のインデックスのみを用いて、クエリ実行時に抽象表現を特定のKG向けのSPARQLクエリにマッピングする。実際の複数のKGを用いた実験の結果、KGQAnは導入が容易であり、回答の質および処理時間において、既存の最先端技術を大きく上回ることが示された。特に、学習段階で見未曾有のKGに対しても、優れた性能を発揮することが確認された。