17日前

少量およびゼロショット反応テンプレート予測の向上に向けた現代的ホフライドネットワークの活用

{and Günter Klambauer, Sepp Hochreiter, Marwin Segler, Jörg K. Wegner, Jonas Verhoeven, Paulo Neves, Natalia Dyubankova, Philipp Renz, Philipp Seidl}
要約

関心を持つ分子の合成経路を発見することは、新薬や新素材の開発において不可欠である。このような経路を探索するため、コンピュータ支援合成計画(CASP)手法が用いられており、それらは化学反応の単一ステップモデルに依拠している。本研究では、現代のホープフィールドネットワーク(Modern Hopfield Networks)に基づく、テンプレートを用いた単一ステップ逆合成モデルを提案する。このモデルは、分子および反応テンプレートの両方のエンコーディングを学習し、特定の分子に対して各テンプレートの関連性を予測することを目的としている。テンプレート表現により、異なる反応間での一般化が可能となり、特に訓練例が少ないうえにゼロのテンプレートにおいて、関連性予測の性能が著しく向上する。ベースライン手法と比較して、推論速度が桁違いに高速化された一方で、逆合成ベンチマークUSPTO-50kにおいて、k ≥ 3のtop-k正確一致精度(exact match accuracy)において、既存の最良手法と同等または上回る性能を達成した。結果の再現に用いるコードは、github.com/ml-jku/mhn-reactにて公開されている。