Command Palette
Search for a command to run...
MatterGen:一种用于无机材料设计的生成模型
MatterGen:一种用于无机材料设计的生成模型
一键部署无机材料设计模型 MatterGen
摘要
设计具有所需功能的材料对于推动能源存储、催化和碳捕获等领域的技术进步至关重要。生成模型通过根据所需的性能约束直接生成全新的材料,为材料设计提供了一种新范式。尽管近期取得了进展,但当前的生成模型在提出稳定晶体方面的成功率较低,或者只能满足非常有限的性能约束集。在此,我们提出了 MatterGen,这是一种能够生成跨越元素周期表的稳定且多样化的无机材料的模型,并且可以进一步进行微调,以将生成过程引导至广泛的性能约束。为实现这一目标,我们引入了一种新的基于扩散的生成过程,该过程通过逐步细化原子类型、坐标和周期性晶格来产生晶体结构。我们还引入了适配器模块,以便利用带标签的数据集针对任何给定的性能约束进行微调。与之前的生成模型相比,由 MatterGen 产生的结构成为新颖且稳定结构的概率高出两倍以上,且更接近局部能量最小值(距离缩小了15倍以上)。经过微调后,MatterGen 成功生成了具有所需化学组成、对称性以及机械、电子和磁性能的稳定新材料。
一句话总结
MatterGen 是一种基于扩散的生成模型,通过迭代优化原子类型、坐标和周期晶格来设计稳定的无机材料。该模型采用适配器模块进行属性引导的微调,使其生成的结构相比先前方法更有可能新颖且稳定(概率提升两倍以上),且更接近局部能量极小值(距离缩短15倍以上),同时能够成功针对特定的化学组成、对称性以及机械、电子或磁性属性进行设计。
引言
功能材料的快速发现对于推动储能、催化和碳捕获技术的发展至关重要。传统的实验流程与高通量筛选仍受限于已知的化学空间,无法高效针对特定或相互冲突的材料属性进行设计。尽管生成模型提供了一种极具前景的逆向设计替代方案,但现有方法经常产生不稳定的晶体,依赖狭窄的元素子集,且在基础形成能之外的优化方面表现不佳。为了解决这些瓶颈,研究引入 MatterGen,这是一种基于扩散的框架,能够联合优化原子类型、原子坐标和周期晶格。该模型集成了可训练的适配器模块,支持针对化学组成、对称性以及机械或电子属性等多样化目标进行微调。该架构始终能生成比先前方法更稳定、更新颖且能量更优化的结构,充分展现了其在多属性材料设计方面的强大能力。
方法
MatterGen 的框架建立在专为晶体材料生成设计的扩散模型架构之上,利用一种联合扩散过程,作用于晶体结构的基本组成部分:原子类型、分数坐标和晶格。模型的核心是一个评分网络,它学习逆转精心设计的正向扩散过程,从而实现稳定且多样化材料的生成。该过程始于一个稳定的晶体结构,其晶胞包含原子类型 A、分数坐标 X 和晶格向量 L,并通过马尔可夫链逐步将其扰动为随机材料。反向过程(即去噪)由评分网络引导,从含噪状态重建合理的晶体结构。
模型的架构经过设计,以处理各结构组件的不同特性。原子类型扩散被表述为离散去噪扩散概率模型(D3PM),作用于化学元素的类别空间。该过程采用掩码扩散策略,原子逐步被扰动至特殊的掩码状态,旨在学习一个评分函数,以根据含噪状态预测原始原子类型。坐标扩散在分数坐标上进行,由于周期性边界条件,分数坐标定义在平坦环面上。这需要使用环绕正态分布来建模噪声,且模型采用方差爆炸扩散过程,以确保最终步骤的先验分布为晶胞上的均匀分布。为适应不同晶胞尺寸下的原子密度变化,扩散方差按原子数量的立方根进行缩放。晶格扩散在对称矩阵上进行以保证旋转不变性,并采用方差保持扩散过程,该过程经过修改以具备物理依据的极限分布。该自定义极限分布旨在偏好立方晶格,并使用从训练数据中得出的平均原子密度,从而引导生成过程朝向合理且稳定的结构。
评分网络本身是一个 SE(3) 等变图神经网络(GNN),改编自 GemNet-dT 架构,专为高效预测非保守力而设计。该网络处理原子级结构,并预测晶格、原子位置和原子类型的评分。针对晶格评分,模型采用链式法则方法,将 GNN 预测的键长转换为晶格变换评分。引入了一项关键修改,通过将预测结果与笛卡尔坐标矩阵组合,确保这些评分符合对称矩阵形式,以满足对称晶格扩散过程的要求。为提升模型的表达能力,GNN 通过拼接边向量的余弦值与晶格向量至输入边表示中,补充了晶格角度信息,从而打破了对晶胞选择的不变性。训练目标是一个复合损失函数,结合了对坐标和晶格的评分匹配损失以及对原子类型的 D3PM 损失,并进行了适当的权重分配。

实验
MatterGen 通过微调实验进行了评估,目标针对特定化学体系、晶体对称性以及单一或多项物理属性,并以传统替代法、随机结构搜索(RSS)和筛选基线作为性能基准。这些实验共同验证了模型稳健的逆向设计能力,表明其在不同化学复杂度和属性约束下,均能稳定生成稳定、独特且新颖的结构。定性分析显示,MatterGen 高效应对数据稀疏区域,并成功平衡相互竞争的目标,例如在优化磁性能的同时最小化供应链风险,最终在发现率和计算效率方面均优于传统方法。
研究通过将 MatterGen 与替代法和 RSS 方法进行对比,评估了其生成具有目标化学组成、对称性和属性的稳定材料的能力。结果表明,MatterGen 在凸包上发现新颖结构的效率和性能更高,尤其在复杂的五元体系中表现突出,并能有效生成具有所需对称性以及目标磁性、电子和机械属性的材料。MatterGen 在联合优化高磁密度与低供应链风险评分方面成功设计出低供应链风险的磁体。在生成样本较少的情况下,MatterGen 在发现新颖稳定结构方面优于替代法和 RSS,尤其在复杂的五元体系中。MatterGen 成功生成了具有目标对称性的材料,使相当比例的结构属于所需的空间群,包括高对称性结构。即使标注数据有限,MatterGen 也能生成具有目标磁性、电子和机械属性的材料,推动属性分布向期望值偏移,并在寻找极端属性候选者方面优于筛选方法。
研究评估了 MatterGen 在目标化学组成、对称性和特定材料属性等多种约束下生成稳定且多样化晶体结构的能力。该模型在三元、四元和五元体系的凸包上发现新颖结构方面表现强劲,尤其在复杂的五元体系中,相比基线方法仅需显著更少的生成样本即可取得优异效果。模型成功生成了具有目标磁性、电子和机械属性的结构,显示出属性分布向期望值偏移的明显趋势,并有效结合高磁密度与低供应链风险等多重约束以指导材料设计。MatterGen 在生成凸包上的结构方面优于基线方法,尤其在五元体系中使用的样本量大幅减少。模型成功生成了具有目标磁性、电子和机械属性的材料,推动属性分布向期望值移动。MatterGen 能够联合优化多重约束,例如高磁密度与低供应链风险,从而生成避免使用供应不稳定元素的稳定结构。
MatterGen 通过与替代法和 RSS 基线进行对比,评估了其在针对特定化学组成、对称性和物理属性的约束下生成稳定晶体结构的能力。实验表明,该模型在发现新颖稳定结构方面始终优于现有方法,尤其在复杂的五元体系中仅需显著更少的样本。定性分析显示,MatterGen 成功使生成的结构与目标空间群对齐,并有效推动属性分布偏移以满足预期的磁性、电子和机械规格。此外,模型可靠地处理了多目标优化任务,例如在最大化磁密度的同时最小化供应链风险,确立了其作为约束驱动材料设计稳健框架的地位。