17日前

開領域質問応答のための生成拡張検索

Yuning Mao, Pengcheng He, Xiaodong Liu, Yelong Shen, Jianfeng Gao, Jiawei Han, Weizhu Chen
開領域質問応答のための生成拡張検索
要約

開領域質問に答えるため、我々は生成拡張検索(Generation-Augmented Retrieval, GAR)を提案する。GARは、外部リソースを用いた教師信号なしに、ヒューリスティックに発見された関連文脈をテキスト生成によってクエリに拡張する手法である。本研究では、生成された文脈がクエリの意味情報を著しく豊かにすることを示し、スパース表現(BM25)を用いたGARが、DPRをはじめとする最先端の密表現検索手法と同等またはそれ以上の性能を達成することを実証した。また、同一クエリに対して多様な文脈を生成することは有益であり、それらの検索結果を統合することで、一貫して高い検索精度が得られることを示した。さらに、スパース表現と密表現はしばしば補完的であるため、GARはDPRと容易に統合可能であり、より優れた性能を実現できる。抽出型読解(extractive QA)設定下において、抽出型読解器を搭載したGARはNatural QuestionsおよびTriviaQAデータセットで最先端の性能を達成し、同一の生成型読解器を用いた場合、他の検索手法を常に上回る結果を示した。

開領域質問応答のための生成拡張検索 | 最新論文 | HyperAI超神経