17 天前

通过迭代式查询生成回答复杂开放域问题

Peng Qi, Xiaowen Lin, Leo Mehr, Zijian Wang, Christopher D. Manning
通过迭代式查询生成回答复杂开放域问题
摘要

当前的一阶段“检索-阅读”问答(QA)系统在回答诸如“《Armada》的作者所著的哪部小说将由史蒂文·斯皮尔伯格改编为电影?”这类问题时面临挑战,原因在于此类问题通常缺乏关于缺失实体(此处指作者)的可检索线索。要回答这类问题,需要进行多跳推理——即首先获取缺失实体(或相关事实)的信息,才能继续推进后续推理过程。为此,我们提出 GoldEn(Gold Entity)检索器,该模型通过在阅读上下文与检索更多支持性文档之间进行迭代,以应对开放域多跳问答任务。与使用不透明且计算成本高昂的神经检索模型不同,GoldEn 检索器基于问题和已有上下文生成自然语言形式的搜索查询,并利用现成的信息检索系统来查找缺失实体。这一设计使得 GoldEn 检索器在实现高效扩展的同时,保持了良好的可解释性。我们在近期提出的开放域多跳问答数据集 HotpotQA 上对 GoldEn 检索器进行了评估,结果表明,尽管未采用 BERT 等预训练语言模型,其性能仍优于此前已发表的最佳模型。