2 个月前

增强型LSTM用于自然语言推理

Qian Chen; Xiaodan Zhu; Zhenhua Ling; Si Wei; Hui Jiang; Diana Inkpen
增强型LSTM用于自然语言推理
摘要

推理和推断是人类智能和人工智能的核心。在人类语言中建模推断非常具有挑战性。随着大规模标注数据的可用(Bowman 等,2015),最近已经可以训练基于神经网络的推断模型,这些模型已被证明非常有效。本文展示了最新的研究成果,在斯坦福自然语言推断数据集上达到了 88.6% 的准确率。与之前使用复杂网络架构的顶级模型不同,我们首先证明了通过精心设计基于链式 LSTM 的顺序推断模型可以超越所有先前的模型。在此基础上,我们进一步表明,在局部推断建模和推断组合中显式考虑递归架构可以实现额外的改进。特别是,加入句法解析信息对我们的最佳结果起到了重要作用——即使在已经非常强大的模型基础上,它仍能进一步提升性能。