MP-20-PXRD 原子材料基准数据集
*该数据集支持在线使用,点击此处跳转。
MP-20-PXRD 基准数据集是由哥伦比亚大学、斯坦福大学于 2025 年联合提出,用来对一种基于扩散模型的生成式人工智能结构解析方法 PXRDnet,进行以端到端的训练。相关研究以「Ab initio structure solutions from nanocrystalline powder diffraction data via diffusion models」为题,发表于 Nature Materials 。
该数据集从 Materials Project 数据库中采样的材料组成,其晶胞内原子数量最多为 20 个,包含 45,229 种材料,按照 90% 、 7.5% 、 2.5% 的比例用以训练、验证和测试。