17日前
TempoQR:知識グラフ上の時系列質問推論
Costas Mavromatis, Prasanna Lakkur Subramanyam, Vassilis N. Ioannidis, Soji Adeshina, Phillip R. Howard, Tetiana Grinberg, Nagib Hakim, George Karypis

要約
知識グラフ質問応答(KGQA)は、自然言語によるクエリを用いて知識グラフ(KG)から事実を取得するタスクである。KGとは、エンティティと関係によってリンクされた、構造化された事実の集合である。一部の事実には時系列情報が含まれており、これをTemporal KG(TKG)と呼ぶ。多くの自然言語の質問には明示的または暗黙的な時刻制約が含まれるが、TKG上での質問応答(QA)は依然として比較的未開拓の分野である。既存の手法は、単一のTKG事実から直接答えが得られるような単純な時系列質問に主に対応している。本論文では、TKG上で複雑な質問に応じる包括的な埋め込みベースのフレームワークを提案する。本手法は「時系列質問推論(TempoQR)」と名付けられ、TKGの埋め込みを活用して、質問が指す特定のエンティティおよび時間範囲に質問を「接地(grounding)」する。これは、3つの専門的なモジュールを用いて、質問の埋め込みに文脈情報、エンティティ情報、時刻に敏感な情報を追加することによって実現される。第一のモジュールは与えられた質問のテキスト表現を計算し、第二のモジュールは質問に登場するエンティティの埋め込みとそれを統合する。第三のモジュールは、質問に特有の時刻埋め込みを生成する。最後に、Transformerベースのエンコーダが生成された時系列情報を質問表現と融合させ、これを用いて答えの予測を行う。広範な実験の結果、TempoQRは最先端のアプローチに対して、複雑な時系列質問において正解率を25~45パーセンテージポイント向上させるとともに、未観測の質問タイプにもより優れた汎化性能を示した。