
摘要
大多数传统的句子相似度方法仅关注两个输入句子中的相似部分,而简单地忽略了不同部分,这些不同部分通常能为我们提供关于句子的一些线索和语义信息。在本研究中,我们提出了一种模型,通过分解和组合句子中的词汇语义来同时考虑相似性和差异性。该模型将每个词表示为一个向量,并根据另一句中的所有词计算每个词的语义匹配向量。随后,每个词向量基于其语义匹配向量被分解为相似成分和差异成分。在此基础上,采用两通道卷积神经网络(CNN)模型来通过组合相似成分和差异成分捕捉特征。最后,通过对组合后的特征向量进行评估以估计相似度得分。实验结果表明,我们的模型在答案句子选择任务上达到了最先进的性能,并在同义句识别任务上取得了可比的结果。