2 个月前

开放领域问答中用于答案重排序的证据聚合

Shuohang Wang; Mo Yu; Jing Jiang; Wei Zhang; Xiaoxiao Guo; Shiyu Chang; Zhiguo Wang; Tim Klinger; Gerald Tesauro; Murray Campbell
开放领域问答中用于答案重排序的证据聚合
摘要

近期一种流行的方法来回答开放域问题,是首先搜索与问题相关的段落,然后应用阅读理解模型从中提取答案。现有的方法通常独立地从单个段落中提取答案。然而,某些问题需要综合来自不同来源的证据才能正确回答。在本文中,我们提出了两种利用多个段落生成答案的模型。这两种模型都采用了基于答案重排序的方法,即重新排列由现有最先进的问答模型生成的答案候选。我们提出了两种具体方法,分别是基于强度的重排序(strength-based re-ranking)和基于覆盖范围的重排序(coverage-based re-ranking),以利用不同段落中的聚合证据更好地确定最终答案。我们的模型在三个公开的开放域问答数据集上取得了最先进的结果:Quasar-T、SearchQA 和 TriviaQA 的开放域版本,在前两个数据集上的表现比之前的方法提高了约8个百分点。