15 天前

OQM9HK:面向材料科学中机器学习的大规模图数据集

{Takenori Yamamoto}
OQM9HK:面向材料科学中机器学习的大规模图数据集
摘要

我们提出一个大规模的晶体材料量子力学计算属性数据集,用于图表示学习,该数据集包含约90万个条目(OQM9HK)。该数据集基于包含超过一百万条目的开放量子材料数据库(Open Quantum Materials Database, OQMD)v1.5版本构建,是此前包含约60万个条目的OQMD v1.2数据集(OQM6HK)的继任版本。我们开发了一种图构建算法,用于生成一种带有二值边标签(Binary Edge-Labeled, BEL)的图结构,以表示晶体材料。相较于无边标签的图结构,BEL图在表征晶体结构方面具有更高的表达能力。在材料性能预测任务中,基于BEL图数据集训练的晶体图神经网络,其性能优于在其他图数据集上训练的模型。OQM9HK图数据集已发布于Zenodo存储库,访问链接为:https://doi.org/10.5281/zenodo.7124330。

OQM9HK:面向材料科学中机器学习的大规模图数据集 | 最新论文 | HyperAI超神经