4ヶ月前
ノードアラインド グラフ・ツー・グラフ (NAG2G): テンプレートフリーの深層学習手法を単一ステップ逆合成に昇華させる
Lin Yao; Wentao Guo; Zhen Wang; Shang Xiang; Wentan Liu; Guolin Ke

要約
有機化学における一歩逆合成(Single-step retrosynthesis: SSR)は、コンピュータ支援合成設計において深層学習(Deep Learning: DL)技術の恩恵をますます受けつつあります。テンプレートを使用しないDLモデルは、逆合成予測に柔軟で有望である一方、重要な2次元分子情報がしばしば無視され、ノード生成のための原子アライメントに苦戦することがあり、これによりテンプレートベースおよび半テンプレートベースの手法と比較して性能が低下する傾向があります。これらの課題に対処するために、我々はノードアライメントに基づくグラフ対グラフ変換モデル(Node-Aligned Graph-to-Graph: NAG2G)を導入します。NAG2Gは、2次元分子グラフと3次元構造を組み合わせることで包括的な分子情報を保持し、製品-反応物の原子マッピングをノードアライメントを通じて組み込むことで、自己回帰的にノードごとのグラフ出力プロセスの順序を決定します。厳密なベンチマーク評価と詳細なケーススタディを通じて、我々はNAG2GがUSPTO-50kおよびUSPTO-FULLという大規模データセットにおいて優れた予測精度を示すことを実証しました。さらに、複数の医薬候補分子の合成経路予測に成功したことから、NAG2Gの実用性が強調されています。これはNAG2Gの堅牢性だけでなく、将来の合成ルート設計タスクにおける複雑な化学合成過程の予測を革新する可能性も示しています。