2ヶ月前

Molecule3D: 分子グラフから3次元幾何学構造を予測するためのベンチマーク

Zhao Xu; Youzhi Luo; Xuan Zhang; Xinyi Xu; Yaochen Xie; Meng Liu; Kaleb Dickerson; Cheng Deng; Maho Nakata; Shuiwang Ji
Molecule3D: 分子グラフから3次元幾何学構造を予測するためのベンチマーク
要約

グラフニューラルネットワークは、分子グラフのモデリングに有望な手法として注目を集めています。分子グラフでは、ノードとエッジがそれぞれ原子と化学結合に対応します。最近の研究では、ボンド長や角度などの3次元分子幾何学的情報が利用可能である場合、分子特性予測タスクの精度が向上することが示されています。しかし、3次元分子幾何構造の計算には量子計算が必要であり、その計算量は非常に大規模で現実的ではありません。例えば、小さな分子の正確な3次元幾何構造を密度汎関数理論(DFT)を使用して計算するには数時間かかることがあります。本稿では、機械学習手法を用いて分子グラフから基底状態の3次元幾何構造を予測することを提案します。これを実現するために、約400万個の分子の正確な基底状態幾何構造をDFTから導出したデータセットを含むベンチマーク「Molecule3D」を開発しました。また、データ処理、分割、学習、評価などに使用できる一連のソフトウェアツールも提供しています。特に、予測された幾何構造の誤差と妥当性を評価するために4つの指標を使用することを提案しています。我々は2つのベースライン手法を実装しました。これらの手法は、原子間距離または3次元空間における原子座標を予測します。実験結果によると、RDKitを使用して3次元幾何構造を生成する方法と比較して、我々の手法は同等の予測精度を得られる一方で、計算コストは大幅に削減されました。Molecule3DはMoleculeXソフトウェアライブラリ(https://github.com/divelab/MoleculeX)のモジュールとして利用可能です。