1ヶ月前

MoleculeNet: 分子機械学習のベンチマーク

Zhenqin Wu; Bharath Ramsundar; Evan N. Feinberg; Joseph Gomes; Caleb Geniesse; Aneesh S. Pappu; Karl Leswing; Vijay Pande
MoleculeNet: 分子機械学習のベンチマーク
要約

分子機械学習は最近数年で急速に成熟してきました。手法の改善と大規模なデータセットの存在により、機械学習アルゴリズムが分子特性についてますます正確な予測を行うことが可能になりました。しかし、提案された手法の効果を比較するための標準的なベンチマークが不足していることから、アルゴリズムの進歩は制限されていました。新しいアルゴリズムは異なるデータセットで評価されることが多いため、提案された手法の品質を正確に評価することが困難でした。本研究では、分子機械学習用の大規模ベンチマークであるMoleculeNetを導入します。MoleculeNetは複数の公開データセットを整理し、評価指標を確立し、さらに複数の既存の分子特徴量化および学習アルゴリズムの高品質なオープンソース実装を提供しています(DeepChemオープンソースライブラリの一環として公開)。MoleculeNetベンチマークは、学習可能な表現が分子機械学習において強力なツールであり、一般的に最良の性能を提供することを示しています。ただし、この結果には注意点があります。学習可能な表現は依然としてデータ不足や極度に不均衡な分類問題における複雑なタスクに対処するのが難しいです。量子力学的および生物物理学的なデータセットの場合、物理意識的な特徴量化(physics-aware featurizations)を使用することが特定の学習アルゴリズムを選択することよりも重要であることがあります。

MoleculeNet: 分子機械学習のベンチマーク | 最新論文 | HyperAI超神経