15 天前

SemiRetro:半模板框架提升深度逆合成预测

Zhangyang Gao, Cheng Tan, Lirong Wu, Stan Z. Li
SemiRetro:半模板框架提升深度逆合成预测
摘要

近期,基于模板(Template-Based, TB)与无模板(Template-Free, TF)的分子图学习方法在逆合成分析中展现出良好的性能。TB方法通过使用预先编码的反应模板,具有更高的预测准确性;而TF方法则通过将逆合成过程分解为中心识别与合成子补全两个子问题,具备更强的可扩展性。为兼顾TB与TF方法的优势,本文提出将完整模板拆分为多个半模板(semi-templates),并将其嵌入两阶段无模板框架中。由于大量半模板具有重复性,该策略在有效降低模板冗余的同时,仍保留了关键的化学知识,从而有助于提升合成子补全的准确性。我们将其方法命名为SemiRetro,并引入一种新型图神经网络层(DRGAT)以增强中心原子的识别能力,同时设计了一种新颖的自校正模块,用于提升半模板分类的性能。实验结果表明,SemiRetro在各项指标上显著优于现有的TB与TF方法。在可扩展性方面,SemiRetro仅使用150个半模板即可覆盖98.9%的数据,而此前基于模板的GLN方法需使用11,647个模板才能覆盖93.3%的数据。在Top-1准确率上,SemiRetro相较于无模板方法G2G分别提升4.8%(已知类别)和6.0%(未知类别)。此外,SemiRetro在训练效率方面也优于现有方法,展现出更优的实用潜力。

SemiRetro:半模板框架提升深度逆合成预测 | 最新论文 | HyperAI超神经