2 个月前

LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型

Jinho Chang; Jong Chul Ye
LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型
摘要

随着扩散模型作为前沿生成模型的出现,许多研究人员提出了基于条件扩散模型的分子生成技术。然而,分子不可避免的离散性使得扩散模型难以将原始数据与像自然语言这样高度复杂的条件连接起来。为了解决这一问题,本文提出了一种新颖的潜在扩散模型——LDMol,用于文本条件下的分子生成。通过认识到合适的潜在空间设计是扩散模型性能的关键,我们采用了对比学习策略从文本数据中提取出新的特征空间,该特征空间嵌入了分子结构的独特特性。实验结果表明,LDMol在文本到分子生成基准测试中优于现有的自回归基线模型,成为首批在文本数据生成方面超越自回归模型的扩散模型之一,这得益于其对潜在域的更好选择。此外,我们还展示了LDMol可以应用于下游任务,如分子到文本检索和文本引导的分子编辑,证明了其作为扩散模型的多功能性。

LDMol:一种具有结构信息潜在空间的文本到分子扩散模型超越了自回归模型 | 最新论文 | HyperAI超神经