1ヶ月前
学習された分子表現の性質予測への応用分析
Kevin Yang; Kyle Swanson; Wengong Jin; Connor Coley; Philipp Eiden; Hua Gao; Angel Guzman-Perez; Timothy Hopper; Brian Kelley; Miriam Mathea; Andrew Palmer; Volker Settels; Tommi Jaakkola; Klavs Jensen; Regina Barzilay

要約
神経機械の進歩により、分子特性予測のための幅広いアルゴリズムソリューションが開発されました。特に、計算された分子フィンガープリントや専門家によって作成された記述子にニューラルネットワークを適用するモデルと、分子のグラフ構造に対して操作を行うことで学習した分子表現を構築するグラフ畳み込みニューラルネットワーク(GCNN)の2つのクラスが有望な結果をもたらしています。しかし、最近の文献では、これらの2つの手法が新しい化学空間への汎化においてどちらが優れているかはまだ明確に示されていません。さらに、これまでの研究では、既存の使用されているモデルと比較して、産業研究環境でのこれらの新モデルについてほとんど検討されてきませんでした。本論文では、19の公開データセットと16の独自産業データセットを用いて、多様な化学エンドポイントにわたるモデルを広範にベンチマーク評価しました。また、固定された分子記述子を使用するモデルや以前のグラフニューラルアーキテクチャ(GNA)よりも一貫して同等または優れた性能を示す新しいグラフ畳み込みモデルを提案します。我々の実証的な知見は、これらの表現に基づく手法が実験的な再現性に達していないものの、提案されたモデルは産業ワークフローで現在使用されているモデルに対して大幅な改善を提供することを示しています。