2 个月前
多篇幅机器阅读理解与跨篇幅答案验证
Yizhong Wang; Kai Liu; Jing Liu; Wei He; Yajuan Lyu; Hua Wu; Sujian Li; Haifeng Wang

摘要
基于真实网络数据的机器阅读理解(MRC)通常需要机器通过分析搜索引擎检索到的多个段落来回答问题。与单个段落的MRC相比,多段落MRC更具挑战性,因为不同段落中可能会出现多个令人困惑的答案选项。为了解决这一问题,我们提出了一种端到端的神经模型,该模型能够根据内容表示让来自不同段落的答案选项相互验证。具体而言,我们联合训练了三个模块,这些模块可以根据三个因素预测最终答案:答案边界、答案内容以及跨段落答案验证。实验结果表明,我们的方法在英语MS-MARCO数据集和中文DuReader数据集上均大幅优于基线方法,并且在这两个旨在模拟现实世界MRC场景的数据集上达到了最先进的性能。