OMat24 是由 Meta 于 2024 年发布的 Open Materials 2024 大规模开源数据集,相关论文成果为「Open Materials 2024 (OMat24) Inorganic Materials Dataset and Models」。
OMat24 数据集包含超过 1.1 亿次以结构和成分多样性为重点的密度泛函理论 (DFT) 计算结果,涵盖从平衡态和非平衡态结构取样的不同原子构型,是该领域最大的开源数据集之一。
OMat24 数据集是目前用于材料训练 DFT 替代模型的最大的开源数据集。该数据集由一系列无机体块材料的 DFT 单点计算 (single-point calculations) 、结构弛豫 (structural relaxations) 和分子动力学轨迹 (molecular dynamic trajectories) 组成。研究人员总共计算了约 1.18 亿个标注有总能量、力 (forces norm) 和晶胞应力 (stress) 的结构,使用了超过 4 亿核时的计算资源。
此外,OMat24 数据集还提供了一些子数据集,包括训练集和验证集,每个集合包含基于不同输入生成策略的多个子数据集。这些子数据集的大小从数百万到数千万不等,涵盖了不同的结构和元素组合,为研究人员提供了丰富的材料特性数据。