HyperAI超神経

GEOM-Drugs 3D分子構造データセット

日付

2ヶ月前

公開URL

github.com

ダウンロードヘルプ

GEOM-Drugs データセットは、一連の高品質な有機分子立体配座を含む大規模な 3D 分子立体配座データセットです。 2022年4月21日にマルチモーダルアートプロジェクションチームによって発表された、関連する論文の結果は次のとおりです。GEOM、機械学習のためのエネルギー注釈付き分子構造”。

このデータセットは下流の機械学習タスクに使用され、平均 44 個の原子を持つ 430,000 個の分子が含まれています。データ処理後、各分子には最大 181 個の原子を含めることができます。実験では、研究者らは各分子のエネルギーが最も低い30の配座を収集し、各ベースライン手法にこれらの分子を構成する原子の3D位置とタイプを生成するよう依頼した。