3 个月前
从文本中回答需要不同推理步骤的开放域问题
Peng Qi, Haejun Lee, Oghenetegiri ", TG", Sido, Christopher D. Manning

摘要
我们提出了一种统一的系统,能够直接从文本中回答开放域问题,且这些问题可能需要不同数量的检索步骤。该系统采用单一的多任务Transformer模型,以迭代方式完成所有必要子任务——包括检索支持性事实、对检索结果进行重排序,并基于所有检索到的文档预测答案。与以往研究中依赖于难以迁移到现实场景的假设不同(例如,假设每个问题所需的检索步骤数量是固定的,或依赖于知识库、网页链接等结构化元数据,而这些信息在实际中往往难以获取),我们设计的系统无需事先了解推理复杂度,即可在任意文本集合上回答开放域问题。为模拟这一设定,我们构建了一个新的基准测试集——BeerQA,该数据集通过整合现有的单步和双步数据集,并新增了530个需要三篇维基百科文章才能回答的问题,同时统一了维基百科语料库的不同版本。实验结果表明,我们的模型在现有基准和该新基准上均表现出具有竞争力的性能。新基准数据集已公开,可通过 https://beerqa.github.io/ 获取。