6 个月前

摘要

多跳问答（Multi-hop Question Answering, QA）需要检索多个相关段落并进行逐步推理以回答复杂问题，体现了“检索-阅读”（retrieve-and-read）的范式。然而，以往的检索器主要针对两跳问题进行定制化设计，且多数在不同跳跃阶段独立训练，导致整个多跳检索过程缺乏端到端的监督，从而在超过两跳的复杂场景中表现不佳。本文提出一种端到端的束检索框架——Beam Retrieval，用于多跳问答任务。该方法通过联合优化编码器及所有跳跃阶段的两个分类头，以端到端的方式建模多跳检索过程。此外，Beam Retrieval 在每一步均维护多个部分相关的段落假设，有效扩展了搜索空间，降低了遗漏关键信息段落的风险。为构建完整的问答系统，我们结合了监督式阅读器或大型语言模型（Large Language Model, LLM）。实验结果表明，与基线方法相比，Beam Retrieval 在具有挑战性的 MuSiQue-Ans 数据集上实现了近50%的性能提升；在 HotpotQA 上超越了所有先前的检索器，并在 2WikiMultiHopQA 上达到了99.9%的精确率。高质量的上下文输入显著提升了监督阅读器的性能，使其达到新的最先进水平，同时大幅改善了大型语言模型在少样本问答场景下的表现。

源 PDF