
摘要
我们提出一个大规模的晶体材料量子力学计算属性数据集,用于图表示学习,该数据集包含约90万个条目(OQM9HK)。该数据集基于包含超过一百万条目的开放量子材料数据库(Open Quantum Materials Database, OQMD)v1.5版本构建,是此前包含约60万个条目的OQMD v1.2数据集(OQM6HK)的继任版本。我们开发了一种图构建算法,用于生成一种带有二值边标签(Binary Edge-Labeled, BEL)的图结构,以表示晶体材料。相较于无边标签的图结构,BEL图在表征晶体结构方面具有更高的表达能力。在材料性能预测任务中,基于BEL图数据集训练的晶体图神经网络,其性能优于在其他图数据集上训练的模型。OQM9HK图数据集已发布于Zenodo存储库,访问链接为:https://doi.org/10.5281/zenodo.7124330。