2 个月前

机器理解的多视角上下文匹配

Zhiguo Wang; Haitao Mi; Wael Hamza; Radu Florian
机器理解的多视角上下文匹配
摘要

先前的机器阅读理解(Machine Comprehension, MC)数据集要么规模太小,无法训练端到端的深度学习模型,要么难度不够,无法充分评估当前MC技术的能力。新发布的SQuAD数据集缓解了这些限制,并为我们提供了开发更加现实的MC模型的机会。基于该数据集,我们提出了一种多视角上下文匹配(Multi-Perspective Context Matching, MPCM)模型,这是一种直接预测段落中答案起始点和结束点的端到端系统。我们的模型首先通过计算每个词嵌入向量与问题的相关性权重来调整段落中的每个词嵌入向量。然后,我们使用双向LSTM对问题和加权后的段落进行编码。对于段落中的每一个位置点,我们的模型从多个视角将该位置点的上下文与编码后的问题进行匹配,并生成一个匹配向量。给定这些匹配向量后,我们使用另一个双向LSTM聚合所有信息并预测答案的起始点和结束点。在SQuAD测试集上的实验结果表明,我们的模型在排行榜上取得了具有竞争力的成绩。