2 个月前

DR-BiLSTM:依赖阅读双向长短期记忆网络用于自然语言推理

Reza Ghaeini; Sadid A. Hasan; Vivek Datla; Joey Liu; Kathy Lee; Ashequl Qadir; Yuan Ling; Aaditya Prakash; Xiaoli Z. Fern; Oladimeji Farri
DR-BiLSTM:依赖阅读双向长短期记忆网络用于自然语言推理
摘要

我们提出了一种新颖的深度学习架构,以解决自然语言推理(NLI)任务。现有的方法大多依赖于简单的读取机制,分别对前提和假设进行独立编码。相比之下,我们提出了一种新颖的依赖读取双向长短期记忆网络(DR-BiLSTM),在编码和推理过程中高效地建模前提与假设之间的关系。此外,我们还引入了一种复杂的集成策略来结合所提出的模型,显著提高了最终预测的准确性。最后,我们展示了通过增加一个预处理步骤可以进一步提升结果。我们的评估表明,DR-BiLSTM不仅在单个模型上取得了最佳成绩,在集成模型上也达到了新的最先进水平,在斯坦福自然语言推理数据集上获得了最高的分数。