HyperAIHyperAI

Command Palette

Search for a command to run...

端到端束搜索用于多跳问答

Jiahao Zhang Haiyang Zhang Dongmei Zhang Yong Liu Shen Huang

摘要

多跳问答(Multi-hop Question Answering, QA)需要检索多个相关段落并进行逐步推理以回答复杂问题,体现了“检索-阅读”(retrieve-and-read)的范式。然而,以往的检索器主要针对两跳问题进行定制化设计,且多数在不同跳跃阶段独立训练,导致整个多跳检索过程缺乏端到端的监督,从而在超过两跳的复杂场景中表现不佳。本文提出一种端到端的束检索框架——Beam Retrieval,用于多跳问答任务。该方法通过联合优化编码器及所有跳跃阶段的两个分类头,以端到端的方式建模多跳检索过程。此外,Beam Retrieval 在每一步均维护多个部分相关的段落假设,有效扩展了搜索空间,降低了遗漏关键信息段落的风险。为构建完整的问答系统,我们结合了监督式阅读器或大型语言模型(Large Language Model, LLM)。实验结果表明,与基线方法相比,Beam Retrieval 在具有挑战性的 MuSiQue-Ans 数据集上实现了近50%的性能提升;在 HotpotQA 上超越了所有先前的检索器,并在 2WikiMultiHopQA 上达到了99.9%的精确率。高质量的上下文输入显著提升了监督阅读器的性能,使其达到新的最先进水平,同时大幅改善了大型语言模型在少样本问答场景下的表现。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供