2 个月前

用于同义句识别、语义文本相似性、自然语言推理和问答的神经网络模型

Wuwei Lan; Wei Xu
用于同义句识别、语义文本相似性、自然语言推理和问答的神经网络模型
摘要

在本文中,我们分析了多种神经网络设计(及其变体)用于句子对建模,并广泛地在八个数据集上比较了它们的性能,这些数据集涵盖了同义句识别、语义文本相似度、自然语言推理和问答任务。尽管大多数模型声称达到了最先进的性能,但原始论文通常仅报告了一两个选定的数据集上的结果。我们提供了系统性的研究,表明:(i) 通过LSTM编码上下文信息以及句子间的交互作用是至关重要的;(ii) Tree-LSTM的效果并不如先前所宣称的那样显著,但在Twitter数据集上意外地提高了性能;(iii) 对于较大的数据集,增强顺序推理模型(Enhanced Sequential Inference Model)目前表现最佳,而在数据较少的情况下,成对词交互模型(Pairwise Word Interaction Model)则取得了最好的性能。我们发布了我们的实现代码作为开源工具包。