2 个月前

粗粒度细粒度协同注意力网络用于多证据问答

Victor Zhong; Caiming Xiong; Nitish Shirish Keskar; Richard Socher
粗粒度细粒度协同注意力网络用于多证据问答
摘要

端到端神经模型在问答领域取得了显著进展,然而最近的研究表明,这些模型隐含地假设答案和证据在单个文档中紧密相邻出现。在这项工作中,我们提出了一种新的问答模型——粗粒度细粒度共注意网络(Coarse-grain Fine-grain Coattention Network, CFC),该模型结合了多个文档中的证据信息。CFC 包括一个粗粒度模块,该模块根据查询解释文档并找到相关答案;以及一个细粒度模块,该模块通过比较每个候选答案在所有文档中的出现情况与查询来对候选答案进行评分。我们使用共注意和自注意的层次结构设计了这些模块,这些结构能够学习突出输入的不同部分。在 Qangaroo WikiHop 多证据问答任务中,CFC 在盲测集上获得了 70.6% 的新最先进结果,尽管没有使用预训练的上下文编码器,但其准确率仍比之前的最佳结果高出 3%。