2 个月前

稀疏数据上的并行-层次模型用于机器理解

Adam Trischler; Zheng Ye; Xingdi Yuan; Jing He; Phillip Bachman; Kaheer Suleman
稀疏数据上的并行-层次模型用于机器理解
摘要

理解非结构化文本是自然语言处理领域的一个主要目标。理解测试通过基于短文本段落提出问题来评估这种理解能力。在本研究中,我们探讨了机器在具有挑战性的《MCTest》基准上的理解能力。由于其规模有限,《MCTest》之前的研究主要集中在设计更好的特征上。我们采用神经网络方法处理该数据集,利用简单的神经网络以并行层次结构排列。并行层次结构使我们的模型能够从多种可训练的角度比较段落、问题和答案,而不仅仅是使用手动设计的固定特征集。这些角度涵盖了从词级到句子片段再到句子序列;网络仅在文本的词嵌入表示上进行操作。当采用一种旨在帮助应对有限训练数据的方法进行训练时,我们的并行层次模型为《MCTest》设定了新的最先进水平,略微超过了先前的特征工程方法,并显著优于之前的神经网络方法(绝对提高了超过15%)。