
要約
知識グラフ上の質問応答(KG-QA)は情報検索(IR)分野における重要な課題である。時間的意図を持つ質問は実用的に重要な特殊なクラスであるが、これまで研究において十分な注目を受けていない。本研究では、複数のエンティティおよび述語を含み、関連する時間的条件を伴う複雑な時間的質問に応答するための、初めてのエンドツーエンドシステムであるEXAQTを提案する。EXAQTは、自然言語で提示された質問を知識グラフ上に回答する際に、2段階のアプローチを採用している。1段階目は高い再現率(recall)を重視し、質問に関連するコンパクトなサブグラフを知識グラフ内から抽出し、Group Steiner Treeと微調整されたBERTモデルを用いて、関連する時間的知識を適切に拡張する。2段階目では、1段階目の出力をもとに関係性グラフ畳み込みネットワーク(R-GCN)を構築し、時系列に敏感なエンティティ埋め込みと時間的関係に対する注目機構(attention)を導入して、R-GCNの性能を向上させる。本研究では、さまざまな汎用知識グラフ質問応答ベンチマークから収集・編集した16,000件の時間的質問から構成される大規模データセット「TimeQuestions」を用いてEXAQTの評価を行った。実験結果から、EXAQTは知識グラフ上で複雑な質問に応答するための3つの最先端システムを上回る性能を発揮した。これにより、時間的質問応答に対する特別な取り扱いの正当性が裏付けられた。