11 天前

HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架

Jiejun Tan, Zhicheng Dou, Yan Yu, Jiehan Cheng, Qiang Ju, Jian Xie, Ji-Rong Wen
HierSearch:一种集成本地搜索与网络搜索的分层企业深度搜索框架
摘要

近期,大型推理模型在数学求解与代码生成方面展现出强大的能力,而深度搜索(deep search)则利用这些模型的推理能力来应对复杂的信息检索任务。现有的深度搜索方法通常局限于单一知识源,无论是本地数据还是网络数据。然而,企业用户往往需要能够同时利用本地与网络语料库的私有化深度搜索系统。尽管采用扁平强化学习(flat reinforcement learning, RL)训练一个配备多种搜索工具的智能体看似直接可行,但该方法存在训练数据效率低、难以掌握复杂工具等问题。为解决上述挑战,本文提出一种基于分层强化学习(hierarchical RL)训练的分层智能体深度搜索框架——HierSearch。在底层,分别训练本地深度搜索智能体与网络深度搜索智能体,以从各自对应领域中检索证据;在高层,由规划智能体(planner agent)协调底层智能体,并生成最终答案。此外,为防止答案直接复制及错误传播,我们设计了一种知识精炼模块(knowledge refiner),用于过滤底层智能体返回的幻觉内容与无关证据。实验结果表明,与扁平强化学习方法相比,HierSearch在性能上表现更优,并在涵盖通用、金融与医疗领域的六个基准测试中,超越了多种现有的深度搜索方法以及多源检索增强生成(retrieval-augmented generation)基线模型。