11 天前

端到端束搜索用于多跳问答

Jiahao Zhang, Haiyang Zhang, Dongmei Zhang, Yong Liu, Shen Huang
端到端束搜索用于多跳问答
摘要

多跳问答(Multi-hop Question Answering, QA)需要检索多个相关段落并进行逐步推理以回答复杂问题,体现了“检索-阅读”(retrieve-and-read)的范式。然而,以往的检索器主要针对两跳问题进行定制化设计,且多数在不同跳跃阶段独立训练,导致整个多跳检索过程缺乏端到端的监督,从而在超过两跳的复杂场景中表现不佳。本文提出一种端到端的束检索框架——Beam Retrieval,用于多跳问答任务。该方法通过联合优化编码器及所有跳跃阶段的两个分类头,以端到端的方式建模多跳检索过程。此外,Beam Retrieval 在每一步均维护多个部分相关的段落假设,有效扩展了搜索空间,降低了遗漏关键信息段落的风险。为构建完整的问答系统,我们结合了监督式阅读器或大型语言模型(Large Language Model, LLM)。实验结果表明,与基线方法相比,Beam Retrieval 在具有挑战性的 MuSiQue-Ans 数据集上实现了近50%的性能提升;在 HotpotQA 上超越了所有先前的检索器,并在 2WikiMultiHopQA 上达到了99.9%的精确率。高质量的上下文输入显著提升了监督阅读器的性能,使其达到新的最先进水平,同时大幅改善了大型语言模型在少样本问答场景下的表现。

端到端束搜索用于多跳问答 | 最新论文 | HyperAI超神经