2 个月前

使用Match-LSTM和答案指针的机器理解

Shuohang Wang; Jing Jiang
使用Match-LSTM和答案指针的机器理解
摘要

文本机器理解是自然语言处理中的一个重要问题。最近发布的一个数据集——斯坦福问答数据集(Stanford Question Answering Dataset, SQuAD)——提供了大量通过众包方式由人类创建的真实问题及其答案。SQuAD 为评估机器理解算法提供了一个具有挑战性的测试平台,部分原因是与之前的 数据集相比,SQuAD 中的答案并非来自少量候选答案集合,且答案长度可变。我们提出了一种端到端的神经架构来完成这一任务。该架构基于我们之前提出的用于文本蕴含的匹配 LSTM(match-LSTM)模型以及 Vinyals 等人(2015)提出的用于限制输出标记来自输入序列的指针网络(Pointer Net)。我们提出了两种使用指针网络的方法来解决我们的任务。实验结果表明,我们的两种模型在性能上显著优于 Rajpurkar 等人(2016)使用逻辑回归和人工设计特征所获得的最佳结果。