11日前

SemiRetro:セミテンプレートフレームワークがディープ逆合成予測を強化

Zhangyang Gao, Cheng Tan, Lirong Wu, Stan Z. Li
SemiRetro:セミテンプレートフレームワークがディープ逆合成予測を強化
要約

最近、テンプレートベース(TB)およびテンプレートフリー(TF)の分子グラフ学習手法が、逆合成(retrosynthesis)において有望な成果を示している。TB手法は事前にエンコードされた反応テンプレートを用いるため、高い精度を発揮するが、TF手法は逆合成を部分問題、すなわち「中心原子の特定」と「シンセトン完成」に分解することで、スケーラビリティに優れる。TBとTFの両者の利点を統合するため、本研究では完全なテンプレートを複数のセミテンプレート(semi-template)に分割し、二段階TFフレームワークに組み込む手法を提案する。多くのセミテンプレートは重複するため、テンプレートの冗長性を低減しつつ、重要な化学知識を保持することで、シンセトン完成を効果的に支援できる。本手法を「SemiRetro」と命名し、中心原子の特定を強化する新たなGNN層(DRGAT)を導入するとともに、セミテンプレート分類の精度を向上させるための新規自己修正モジュールを提案した。実験結果によると、SemiRetroは既存のTBおよびTF手法を大きく上回る性能を示した。スケーラビリティ面では、SemiRetroは150個のセミテンプレートで98.9%のデータをカバーするが、従来のテンプレートベースGLNは11,647個のテンプレートを用いても93.3%のデータしかカバーできなかった。トップ1精度においては、クラス既知条件下でテンプレートフリー手法G2Gを4.8%、クラス未知条件下で6.0%上回った。さらに、SemiRetroは既存手法と比較して優れた学習効率を示した。

SemiRetro:セミテンプレートフレームワークがディープ逆合成予測を強化 | 最新論文 | HyperAI超神経