中国科学院研发出融合空间群对称性的新型晶体生成模型CrystalFormer 科研人员成功开发出一种基于空间群对称性的自回归晶体生成模型——CrystalFormer,标志着材料科学与生成式人工智能融合的重要进展。该模型由中国科学院物理研究所/北京凝聚态物理国家研究中心联合吉林大学共同研发,相关成果发表于《科学通报》(Science Bulletin)。 传统生成模型在语言和图像领域已取得显著成果,但直接应用于无机晶体生成面临挑战。晶体材料具有天然的对称性先验,其结构由空间群对称性严格定义。自然界通过“化学元素周期表”与“空间群Wyckoff位置表”构建晶体,即从元素中选择原子,并将其按对称性规则放置在特定位置。这一过程使晶体结构呈现出“意料之外、情理之中”的序列化特征。 CrystalFormer首次将晶体的对称性语言纳入生成模型框架,通过学习海量晶体数据库,内化固体化学规律,以序列化方式生成晶体的Wyckoff占位与晶格参数,从而构造全新的晶体结构。模型以神经网络表达固体化学知识,利用网络激活实现材料空间中的联想推理,并通过概率似然函数体现化学直觉,探索自然界可能存在但尚未发现的晶体材料。 与依赖势能面优化的传统方法不同,CrystalFormer直接在对称性约束下“推测”合理的晶体结构,无需迭代优化,显著提升生成效率。该模型既可无约束地探索整个材料空间,也可定向生成具备特定结构特征的晶体。结合性质预测模型后,还可实现基于贝叶斯公式的材料反向设计,推动新材料从“发现”到“设计”的范式转变。 CrystalFormer将数学对称性、化学直觉与生成式AI深度融合,构建了一个简洁、通用且灵活的晶体生成框架,为下一代材料发现提供了强大工具。研究得到国家自然科学基金与中国科学院战略性先导科技专项的支持。相关论文及基于JAX的开源代码已公开,为全球科研人员提供可复现、可扩展的应用平台。
生成式人工智能在材料科学领域的应用正迎来关键突破。中国科学院物理研究所/北京凝聚态物理国家研究中心与吉林大学合作,成功开发出一种新型晶体生成模型——CrystalFormer。该模型首次将晶体材料的固有对称性,特别是空间群对称性,深度融入生成过程,为无机晶体的智能设计提供了全新范式。 传统生成模型在处理图像或文本时,依赖于数据的统计规律,但晶体材料具有独特的结构先验:其原子排列严格遵循空间群对称性。这一特性决定了晶体结构并非随机组合,而是由化学元素与对称性位置(Wyckoff位置)共同决定。自然界通过“元素周期表”和“空间群Wyckoff位置表”两张“基础表”构建所有已知晶体。基于此,研究团队提出一种序列化表示方法:将晶体结构分解为原子类型与对应Wyckoff位置的有序组合,从而将复杂的三维结构转化为可学习的序列数据。 CrystalFormer正是基于这一思想,利用自回归神经网络建模晶体生成过程。它通过学习海量晶体数据库,内化固体化学中的隐含规律,以概率方式逐步预测每个原子的占位和晶格参数。模型的核心优势在于:它并非依赖传统势能函数优化,而是直接在对称性约束下“推理”合理的晶体结构,实现了从“试错式模拟”到“智能生成”的跃迁。 该模型具备双重能力:既可无约束地探索整个材料空间,发现潜在的新晶体结构;也可定向生成具备特定对称性或功能特征的材料。更重要的是,CrystalFormer支持与性质预测模型无缝集成,实现基于贝叶斯优化的材料反向设计——即根据目标性能反推候选结构,极大加速新材料的发现流程。 与现有机器学习力场相比,CrystalFormer不依赖分子动力学模拟或能量最小化,而是以对称性为骨架、以概率为逻辑,构建了一个兼具物理合理性与生成灵活性的框架。其简洁而通用的设计,使得模型既能捕捉晶体的数学对称性,又能体现化学家的直觉判断。 相关成果已发表于《科学通报》(Science Bulletin),研究工作获得国家自然科学基金与中国科学院战略性先导科技专项的资助。项目团队已公开基于JAX的开源代码及应用示例,推动该技术在材料科学界的广泛使用。CrystalFormer的出现,标志着材料智能设计正从“数据驱动”迈向“知识驱动”,为未来功能材料的发现与创新提供强大工具。
