8 个月前

摘要

跨模态文本-分子检索模型旨在学习文本和分子模态之间的共享特征空间，以实现准确的相似度计算，从而在药物设计中快速筛选出具有特定性质和活性的分子。然而，先前的研究存在两个主要缺陷。首先，它们在捕捉模态共享特征方面不足，因为文本序列和分子图之间存在显著差异。其次，这些研究主要依赖对比学习和对抗训练来实现跨模态对齐，这两种方法主要关注一阶相似度，忽略了嵌入空间中可以捕捉更多结构信息的二阶相似度。为了解决这些问题，我们提出了一种具有双重改进的新型跨模态文本-分子检索模型。具体而言，在两个模态特定编码器的基础上，我们叠加了一个基于记忆库的特征投影器，该投影器包含可学习的记忆向量，以更好地提取模态共享特征。更重要的是，在模型训练过程中，我们为每个实例计算了四种相似度分布（文本到文本、文本到分子、分子到分子以及分子到文本的相似度分布），然后通过最小化这些相似度分布之间的距离（即二阶相似度损失）来增强跨模态对齐。实验结果和分析强有力地证明了我们模型的有效性。特别是，我们的模型达到了最先进的性能（SOTA），比之前报道的最佳结果提高了6.4%。

源 PDF