3D分子生成に反応経路を統合したSYNCOGENの新フレームワーク
人工知能(AI)が生成した分子が実験室で合成可能かどうかは、創薬研究において重要な課題である。従来の生成モデルは、主に2Dの分子構造に焦点を当てており、3Dの構造情報や実際の合成経路を考慮していないため、生成された分子が実用性に欠ける場合がある。この問題を解決するため、トロント大学、ケンブリッジ大学、マギル大学などの研究者らが、合成可能な3D分子生成を可能にする新たな機械学習フレームワーク「SYNCOGEN」を開発した。 SYNCOGENは、反応経路と原子座標を同時にモデル化する独自のアプローチを採用している。これにより、生成された分子が物理的に現実的であるだけでなく、既存の反応を利用して実験的に合成可能であることを保証している。この統合的なアプローチは、創薬や材料開発において実現可能な分子設計を可能にし、従来のモデルが抱えていた課題を克服している。 研究チームは、SYNCOGENのトレーニングに使用するため、60万を超える合成可能な分子を含む「SYNSPACE」データセットを構築した。このデータセットには、93種類の商業的な構造ブロックと19種類の反応テンプレートから構成され、それぞれにエネルギー最適化された3D構造が付随している。モデルの構造は、SE(3)不変のニューラルネットワークを基盤としたSEMLAFLOWを改変したもので、反応グラフと座標を同時に学習する。 SYNCOGENは、無条件の3D分子生成において最優秀の性能を示しており、従来の全原子モデルやグラフベースモデルを上回っている。また、複雑な薬剤の類似体を容易に生成し、ドッキングスコアや逆合成の実行可能性が優れていることも確認されている。 今後の応用としては、特定の特性やタンパク質結合部位に基づいて分子を生成する、反応と構造ブロックの拡大、ロボット技術との連携による自動合成・スクリーニングなどが挙げられる。SYNCOGENは、計算による分子設計が実験室で実現可能になる一歩を踏み出し、創薬や材料科学の発展に貢献する可能性を秘めている。