17 天前

链式搜索:通过搜索交互式增强大型语言模型以应对知识密集型任务

Shicheng Xu, Liang Pang, Huawei Shen, Xueqi Cheng, Tat-Seng Chua
链式搜索:通过搜索交互式增强大型语言模型以应对知识密集型任务
摘要

确保大型语言模型(Large Language Model, LLM)生成内容的准确性、可信度与可追溯性,在需要多步推理且每一步均依赖知识支持的复杂知识密集型任务中至关重要。检索增强生成(Retrieval-Augmented Generation, RAG)在解决该问题方面展现出巨大潜力。然而,如何在何时何地引入信息检索(Information Retrieval, IR)机制与LLM进行交互,仍是一个重大挑战。以往的研究存在两个主要问题:其一,IR检索到的错误知识会误导LLM;其二,IR与LLM之间的交互破坏了LLM原有的推理链条,导致推理过程断裂。本文提出一种名为链中搜索(Search-in-the-Chain, SearChain)的新型框架,旨在优化LLM与IR之间的交互机制,以应对上述挑战。SearChain的核心思想在于构建一种基于树结构的新型推理路径,实现动态推理方向的调整。具体而言,SearChain包含以下关键机制:生成查询-答案链(Chain-of-Query, CoQ):LLM首先生成一条推理链CoQ,其中每个节点均由一个面向检索的查询-答案对构成,明确表达当前推理步骤所需的知识目标。基于IR的验证与修正机制:IR模块对CoQ中每个节点的答案进行验证。当IR以高置信度判断答案与检索结果不一致时,系统将自动修正该节点的答案,从而显著提升生成内容的可信度。知识缺失的动态补全:LLM可在CoQ中显式标识自身知识的缺失,并主动依赖IR提供缺失信息,实现知识的动态补充,有效提升推理过程的准确性与完整性。增强可追溯性:SearChain在生成最终推理过程的同时,为每一步推理标注所依据的支持文档来源,实现了生成结果的全程可追溯。通过上述机制,SearChain实现了LLM与IR之间的协同推理,形成一种以树状结构为基础的新型推理路径,支持LLM在推理过程中动态调整方向。实验结果表明,SearChain在多项复杂知识密集型任务中均显著优于现有最先进方法,涵盖多跳问答(multi-hop Q&A)、槽位填充(slot filling)、事实核查(fact checking)以及长文本问答(long-form Q&A)等典型场景。