
摘要
在本文中,我们提出了一种新颖的端到端神经架构,用于对候选答案进行排序,该架构结合了层次递归神经网络和潜在主题聚类模块。通过我们提出的模型,文本从词级到块级被编码为向量表示,从而有效地捕捉整个意义。特别是,通过采用层次结构,我们的模型在处理较长文本时表现出很小的性能下降,而其他最先进的递归神经网络模型则会受到较大影响。此外,潜在主题聚类模块从目标样本中提取语义信息。该聚类模块对于任何与文本相关的任务都非常有用,因为它允许每个数据样本找到其最近的主题簇,从而帮助神经网络模型分析整个数据集。我们在 Ubuntu 对话语料库和与三星产品相关的消费电子领域问答数据集上评估了我们的模型。实验结果表明,所提出的模型在排名问题-答案对方面达到了当前最佳水平。