2ヶ月前
神経ネットワークを用いた逆合成反応予測
Bowen Liu; Bharath Ramsundar; Prasad Kawthekar; Jade Shi; Joseph Gomes; Quang Luu Nguyen; Stephen Ho; Jack Sloane; Paul Wender; Vijay Pande

要約
我々は、レトロシンセティック反応予測タスクを学習する完全にデータ駆動型のモデルについて説明します。このタスクはシーケンス・ツー・シーケンス(sequence-to-sequence)マッピング問題として扱われます。エンドツーエンドで訓練されたモデルは、エンコーダー-デコーダー構造を持ち、2つの再帰型ニューラルネットワーク(Recurrent Neural Networks, RNN)から構成されています。このアーキテクチャは、機械翻訳などの他のシーケンス・ツー・シーケンス予測タスクにおいて大きな成功を収めてきました。本モデルは、米国の特許文献から抽出した50,000件の実験的な反応例を使用して訓練されました。これらの反応例は、医薬化学者が一般的に使用する10種類の広範な反応タイプをカバーしています。我々の研究結果によると、本モデルはルールベースの専門システム基準モデルと同等の性能を示し、さらにルールベースの専門システムやそのコンポーネントを含む任意の機械学習アプローチに関連する特定の制限も克服しています。本モデルは、計算レトロシンセティック解析という難問への重要な第一歩となるものであり、今後の研究発展に寄与すると期待されます。