17日前

チェーン内検索:知識集約型タスクにおける検索を用いた大規模言語モデルのインタラクティブな強化

Shicheng Xu, Liang Pang, Huawei Shen, Xueqi Cheng, Tat-Seng Chua
チェーン内検索:知識集約型タスクにおける検索を用いた大規模言語モデルのインタラクティブな強化
要約

大規模言語モデル(LLM)が生成するコンテンツの正確性、信頼性、追跡可能性を確保することは、多段階の推論を要する複雑な知識集約型タスクにおいて特に重要である。このようなタスクでは、各推論ステップが正確な知識に基づく必要がある。この問題を解決するための有力なアプローチとして、リトリーバル拡張生成(Retrieval-Augmented Generation, RAG)が挙げられる。しかし、LLMに情報検索(Information Retrieval, IR)をどのように、またどこに導入するかは依然として大きな課題である。従来の手法には、IRによって誤った知識が検索され、LLMを誤った方向に導く問題や、IRとLLMの相互作用がLLMの推論連鎖を破壊するという問題がある。本論文では、LLMとIRの相互作用を解決するための新規フレームワークであるSearch-in-the-Chain(SearChain)を提案する。SearChainの主な特徴は以下の通りである。第一に、LLMは「クエリ・オブ・チェーン」(Chain-of-Query, CoQ)と呼ばれる推論連鎖を生成する。CoQの各ノードは、IRに向けたクエリとその回答のペアで構成される。第二に、IRはCoQの各ノードの回答を検証する。特に、IRが高い信頼度を示した場合、検索結果と整合性のない回答は修正される。これにより、推論の信頼性が向上する。第三に、LLMはCoQ内で自身が不足している知識を明示し、IRにその知識の提供を依存することができる。このプロセスにより、推論および知識の正確性が向上する。最後に、SearChainは推論プロセスを生成するとともに、各推論ステップに対して支援文書への参照を明示する。これにより、生成内容の追跡可能性が高まる。SearChainにおけるIRとの相互作用は、木構造に基づく新たな推論経路を形成する。この構造により、LLMは推論の方向性を動的に修正することが可能となる。実験の結果、SearChainは多ホップQA、スロットフィルリング、事実検証、長文QAを含む複雑な知識集約型タスクにおいて、最先端のベースラインを上回る性能を示した。