2 个月前

MEMEN:用于机器理解的多层嵌入与记忆网络

Boyuan Pan; Hao Li; Zhou Zhao; Bin Cao; Deng Cai; Xiaofei He
MEMEN:用于机器理解的多层嵌入与记忆网络
摘要

机器阅读理解(MC)风格的问题回答是自然语言处理中的一个代表性问题。以往的方法很少在编码层的改进上投入时间,尤其是对词语的句法信息和命名实体的嵌入,这些对于编码质量至关重要。此外,现有的注意力机制要么将每个查询词表示为向量,要么使用单个向量表示整个查询句子,这两种方法都无法处理查询句子中关键词的适当权重。本文介绍了一种新颖的神经网络架构——多层嵌入记忆网络(Multi-layer Embedding with Memory Network, MEMEN),用于机器阅读任务。在编码层,我们采用了经典的跳字模型来训练一种新的嵌入层,以捕捉词语的句法和语义信息。我们还提出了一种全向匹配的记忆网络,以捕获更多的关键信息。实验结果表明,我们的模型在斯坦福问答数据集(Stanford Question Answering Dataset, SQuAD)中从精确性和效率两个方面均取得了与其他已发表结果相当的成绩,并在TriviaQA数据集上达到了最先进的水平。