GEOM-Drugs 3D 分子构象数据集
GEOM-Drugs 数据集是一个大型的 3D 分子构象数据集,它包含了一系列高质量的有机分子构象。由 Multimodal Art Projection 团队于 2022 年 4 月 21 日 发布,相关论文成果为「GEOM, energy-annotated molecular conformations for machine learning」。
该数据集被用于下游机器学习任务,包含 43 万分子,每个分子平均有 44 个原子,经过数据处理后,每个分子最多可以包含 181 个原子。在实验中,研究者收集了每个分子对应的 30 个最低能量的构象,并要求每个基线方法生成这些分子的 3D 位置和组成原子的类型。