
摘要
近年来,深度学习的快速发展在加速量子化学(QC)性质预测方面取得了显著进展,其核心在于无需依赖计算成本高昂的电子结构计算方法(如密度泛函理论,DFT)。然而,以往的方法大多基于一维SMILES序列或二维分子图进行学习,难以达到高精度,原因在于量子化学性质主要依赖于由电子结构方法优化得到的三维平衡构象,这与序列型或图结构型数据存在本质差异。针对这一挑战,本文提出一种新方法——Uni-Mol+。Uni-Mol+首先通过低成本方法(如RDKit)生成分子的初始三维构象,随后利用神经网络迭代地将该初始构象逐步更新至目标DFT平衡构象,最终基于学习得到的精确构象进行量子化学性质预测。为有效建模这一向平衡构象逼近的更新过程,我们设计了一种双通道Transformer模型架构,并结合量子化学性质预测任务进行端到端训练。此外,我们还提出一种新颖的训练引导机制,以提升模型的学习效率与稳定性。大量基准测试结果表明,所提出的Uni-Mol+在多个数据集上显著提升了量子化学性质预测的准确性。相关代码与模型已公开发布于 \url{https://github.com/dptech-corp/Uni-Mol}。