HyperAI超神经

在生物学中，缺陷通常是有害的。但在材料科学中，缺陷可以被有意地调控，从而赋予材料有用的新特性。如今，在钢铁、半导体和太阳能电池等产品的制造过程中，人们会精心引入原子级缺陷，以提高强度、控制导电性、优化性能等等。例如，通过在硅中进行可控掺杂，可以调节载流子浓度；同样，在超宽禁带半导体中进行缺陷工程，可以提升其在下一代功率电子器件中的应用潜力。

尽管缺陷分析已成为一种强大的工具，但准确测量成品中不同类型缺陷及其浓度仍然极具挑战性，尤其是在不切割或损坏最终材料的情况下。如果工程师不了解材料中存在的缺陷，就可能制造出性能低下或具有非预期特性的产品。尽管现有缺陷表征技术种类繁多，但在灵敏度、选择性、可定量性以及是否具有破坏性等方面仍存在显著局限。

在此背景下，来自麻省理工学院（MIT）的研究团队提出了一种基础型机器学习模型 DefectNet，能够直接从测量声子态密度（PDoS）的振动光谱中预测取代型点缺陷的化学种类及其浓度，即使在多元素共存的情况下亦可实现。该模型基于来自 2,000 种半导体材料、超过 16,000 条模拟光谱数据进行训练，采用定制化注意力机制，可识别最多 6 种不同缺陷元素，其浓度范围覆盖 0.2% 至 25% 。模型在包含 56 种元素的未见晶体中展现出良好的泛化能力，并可通过实验数据进行微调。通过对 SiGe 合金与 MgB₂ 超导体的非弹性散射实验数据进行验证，证明了模型的准确性与可迁移性。

相关研究成果以「A foundation model for non-destructive defect identification from vibrational spectra」为题，已发表预印本于 arXiv 。

研究亮点：

* 将测量声子态密度（PDoS）的振动光谱与机器学习相结合，为实现体材料中点缺陷的无损表征与定量提供了一条极具潜力的路径

* 引入光谱注意力机制，解决低浓度情况下含缺陷与完美晶体的声子光谱可能几乎无差别的问题

* 引入机器学习原子间势（MLIPs），解决基于密度泛函理论（DFT）的声子模拟计算成本高昂的挑战

论文地址：

https://arxiv.org/abs/2506.00725

查看更多 AI 论文：

https://hyper.ai/cn/papers

数据集：基于 2 千种完美晶体材料构建数据集

研究构建了一个包含 16,000 条掺杂超级细胞（supercells）的数据集，来源于 2,000 种完美晶体材料，涵盖二元、三元、四元及五元半导体，如下图所示：

掺代型缺陷选自周期表前 56 种元素（不包括稀有气体图），如下图，可单独或组合引入，以模拟真实共掺杂场景，并为未来高维设计空间中的缺陷工程提供参考。

研究人员采用机器学习推荐器指导掺代元素的选择——每个结构通过掺杂剂推荐器筛选 n 型和 p 型掺杂候选。随后，将母体晶体扩展为包含 433–500 个原子的超晶胞，尺寸自适应调整以保证稀掺杂浓度下限约为 0.2% 。掺杂剂被替换进母体晶格，每个掺杂结构经结构弛豫，直到所有原子力收敛到 0.01 eV/Å 以下。结构弛豫后，利用有限位移法计算 PDoS 以评估振动性质，形成 DefectNet 的谱输入。

* 结构弛豫指玻璃态物质内部原子排列随时间或在退火过程中逐渐转变为更稳定结构的过程

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

DefectNet 用于从声子光谱预测缺陷化学元素及浓度，其整体架构可以拆解为 4 个模块，工作流程如下图所示，模型的目标是从 PDoS 中无损地直接识别点缺陷的化学种类及浓度。

数据生成（Data Generation）

研究人员构建数据集后，使用 MACE-MP-0 基础型 MLIP 在冻结声子形式下，对完美晶体及掺杂超级细胞进行高通量结构弛豫与声子计算。为模拟实验分辨率，还对计算得到的 PDoS 曲线进行了高斯平滑处理。

DefectNet 输入（Input for DefectNet）

模型接收四类输入：母体完美晶体组成、完美晶体的 PDoS 、掺杂体系的 PDoS 、可能缺陷化学种类的初始猜测。初始猜测可以由人工直觉或已有知识提供，也可以通过基于机器学习的缺陷推荐器自动生成，该推荐器是一个概率模型，用于预测最可能的掺代元素。尽管训练数据为模拟数据，该框架设计可通过微调，适用于实验光谱数据（如非弹性中子散射 INS 数据）。

模型架构（Model architecture）

DefectNet 模型基于 PyTorch 实现，采用模块化架构，由四个主要部分组成：

* 基于一维卷积的谱编码器（spectral encoder based on 1D convolutions）：输入包括三条长度为 100 的一维信号，未掺杂材料的 PDoS 、掺杂后的 PDoS 、宿主晶体组成向量，这些信息被拼接为三通道输入，通过一维卷积网络提取特征，最终形成 100 个「谱 token」，每个 token 为 128 维向量。

* 掺杂原子嵌入模块（dopant embedding module）：掺杂候选的初始猜测以 56 维二进制向量提供，指示给定样本考虑的掺杂元素；该二进制向量通过全连接层投影到相同的 128 维潜在空间，得到单一的掺杂嵌入向量。该嵌入向量作为注意力机制的全局查询，使模型能够根据特定的掺杂上下文调整其谱特征的解释。

* 多头注意力机制（multi-head attention mechanism）：为建模掺杂候选与振动特征之间的交互，DefectNet 使用多头自注意力机制，掺杂嵌入作为查询 Q，而谱特征 V 作为键和值矩阵，注意力机制遵循标准的缩放点积公式。

* 掺杂屏蔽模块（dopant-masked module）：模型输出为 56 个掺杂元素的浓度预测，但通过「硬掩码」机制，即只有候选元素允许非零输出，损失函数也仅在这些元素上计算。这带来三重好处，一是提升训练稳定性，二是避免无关类别干扰，三是与物理先验保持一致。

输出（Output）

最终输出特征根据初始缺陷猜测进行硬掩码处理，剔除不在猜测集合中的掺杂元素浓度。这一机制确保 DefectNet 的预测缺陷浓度被约束在初始假定的缺陷集合内，因此，若初始猜测遗漏或不完整，模型可能无法恢复某些掺杂元素。

DefectNet 可解析 6 种共存的取代型缺陷

为了评估 DefectNet 的能力，研究人员设计了系列试验，结果显示：DefectNet 可解析多达 6 种共存的取代型缺陷，浓度低至 0.2%，且无需详细原子结构信息即可处理 PDoS 数据。

DefectNet 在缺陷种类与浓度预测中的应用

研究人员首先在模拟 PDoS 上测试了典型二元（SiC 、 AlAs）和三元（AgGaS₂、 InCuSe₂）半导体。

SiC 与 AlAs 分别因大带隙而在高功率电子器件与异质结构设计中备受重视，下图展示了完美与掺杂晶体的 PDoS 及预测与真实掺杂浓度。即使掺杂水平较低（约 1%），DefectNet 仍能捕捉到微小的振动变化，并可靠地恢复正确的掺杂浓度。

*DefectNet 在典型半导体上的代表性预测（二元半导体 SiC 和 AlAs 的结果）*

接着，研究人员又将 DefectNet 应用于化学更复杂的三元半导体 AgGaS₂ 和 InCuSe₂，结果如下图。 AgGaS₂ 用于红外非线性光学，而 InCuSe₂ 是薄膜光伏的潜在材料。这些材料含有多个不等价原子位点及多样振动模式，但 DefectNet 仍能跟踪 PDoS 的变化并推断掺杂浓度，显示出其在复杂结构和化学体系中的稳健性。

*DefectNet 在典型半导体上的代表性预测（三元半导体 AgGaS₂ 和 InCuSe₂ 的结果）*

为进一步评估泛化能力，研究人员在包含多种共存掺杂的完整缺陷数据集上测试 DefectNet，包括输入中存在但实际不存在的「干扰」缺陷。下图通过比较预测缺陷浓度（彩色点）与真实值（黑点），按预测均方误差（MSE）四分位分组，展示了结果：

分布内情况（In-distribution，上图 a）：母体晶体在训练数据中出现过，但其缺陷信息未知；DefectNet 在广泛缺陷类型与浓度下均表现高保真，即使输入包含干扰缺陷，模型仍能识别真实掺杂并剔除干扰。

分布外情况（Out-of-distribution，上图 b）：母体晶体在训练中未出现，预测准确度略有下降，但 DefectNet 仍能捕捉主要掺杂特征，并为大多数干扰缺陷分配近零浓度，体现出良好的泛化能力。

在实验数据上微调 DefectNet

为了验证 DefectNet 的实际应用价值，研究人员在实验数据上进行了微调和测试。以热电 SiGe 合金为例，研究人员构建了由 100 个非晶 Si 超胞组成的训练数据集，这些超胞通过 Si-GAP-18 数据库的淬火模拟采样，涵盖从低能接近晶态到高度无序的各种结构状态，具体结果如下图所示：

随着无序度增加，PDoS 曲线展宽，60 meV 的光学声子特征峰被抑制（上图 a），为模型微调提供了母体材料。随后，研究人员通过在非晶 Si 超胞中随机替代 Ge 来模拟 SiGe 合金，涵盖从 0% 到 25% 的各种掺杂水平及不同无序度。

微调后，DefectNet 在测试集上达到均方根误差（RMSE）0.019，显示出强大的预测性能（上图 b）。进一步将微调后的模型应用于 Si₁₋ₓGeₓ 合金实验 GPDoS 数据（x = 5% 、 10% 、 20%，上图 c），DefectNet 分别预测 Ge 浓度为 7% 、 13% 和 22%，与实验趋势高度一致（上图 d）。

考虑到在非晶材料中精确量化缺陷的固有难度，这一结果表明 DefectNet 对实验数据具有很强的预测能力。对于 Al 掺杂多能带超导体 MgB₂，微调后的 DefectNet 可重现掺杂浓度高达 25% 的实验趋势。

结语：前景广阔，但挑战重重

尽管该模型前景广阔，但其应用仍存在若干挑战。例如：在极低缺陷浓度下，振动特征微弱且易被噪声掩盖，模型敏感性下降；当前版本仅限于取代型掺杂，若扩展至多种点缺陷类型（如间隙、空位、 Frenkel 对或缺陷簇）将显著扩大应用范围；尽管模拟数据泛化性强，但实验数据上的微调仍不可或缺，实现无需再训练即可直接应用于原始实验光谱的模型仍是远景目标。

展望未来，DefectNet 代表了缺陷科学中朝向统一、数据驱动范式的重要一步，其架构天然兼容多模态光谱输入，并为具有特定缺陷特征的材料逆向设计打开了可能。通过结合物理驱动表示、高通量模拟、可扩展学习和实验微调，DefectNet 为全复杂度真实材料中的自动化、可解释及非破坏性缺陷工程提供了发展路径。

参考文献：
1.https://news.mit.edu/2026/mit-researchers-use-ai-uncover-atomic-defects-materials-0330
2.https://arxiv.org/abs/2506.00725

相关研究成果以「A foundation model for non-destructive defect identification from vibrational spectra」为题，已发表预印本于 arXiv 。

研究亮点：

* 将测量声子态密度（PDoS）的振动光谱与机器学习相结合，为实现体材料中点缺陷的无损表征与定量提供了一条极具潜力的路径

* 引入光谱注意力机制，解决低浓度情况下含缺陷与完美晶体的声子光谱可能几乎无差别的问题

* 引入机器学习原子间势（MLIPs），解决基于密度泛函理论（DFT）的声子模拟计算成本高昂的挑战

论文地址：

https://arxiv.org/abs/2506.00725

查看更多 AI 论文：

https://hyper.ai/cn/papers

数据集：基于 2 千种完美晶体材料构建数据集

研究构建了一个包含 16,000 条掺杂超级细胞（supercells）的数据集，来源于 2,000 种完美晶体材料，涵盖二元、三元、四元及五元半导体，如下图所示：

* 结构弛豫指玻璃态物质内部原子排列随时间或在退火过程中逐渐转变为更稳定结构的过程

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

数据生成（Data Generation）

DefectNet 输入（Input for DefectNet）

模型架构（Model architecture）

DefectNet 模型基于 PyTorch 实现，采用模块化架构，由四个主要部分组成：

输出（Output）

DefectNet 可解析 6 种共存的取代型缺陷

DefectNet 在缺陷种类与浓度预测中的应用

研究人员首先在模拟 PDoS 上测试了典型二元（SiC 、 AlAs）和三元（AgGaS₂、 InCuSe₂）半导体。

在实验数据上微调 DefectNet

结语：前景广阔，但挑战重重

参考文献：
1.https://news.mit.edu/2026/mit-researchers-use-ai-uncover-atomic-defects-materials-0330
2.https://arxiv.org/abs/2506.00725

相关研究成果以「A foundation model for non-destructive defect identification from vibrational spectra」为题，已发表预印本于 arXiv 。

研究亮点：

* 将测量声子态密度（PDoS）的振动光谱与机器学习相结合，为实现体材料中点缺陷的无损表征与定量提供了一条极具潜力的路径

* 引入光谱注意力机制，解决低浓度情况下含缺陷与完美晶体的声子光谱可能几乎无差别的问题

* 引入机器学习原子间势（MLIPs），解决基于密度泛函理论（DFT）的声子模拟计算成本高昂的挑战

论文地址：

https://arxiv.org/abs/2506.00725

查看更多 AI 论文：

https://hyper.ai/cn/papers

数据集：基于 2 千种完美晶体材料构建数据集

研究构建了一个包含 16,000 条掺杂超级细胞（supercells）的数据集，来源于 2,000 种完美晶体材料，涵盖二元、三元、四元及五元半导体，如下图所示：

* 结构弛豫指玻璃态物质内部原子排列随时间或在退火过程中逐渐转变为更稳定结构的过程

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

数据生成（Data Generation）

DefectNet 输入（Input for DefectNet）

模型架构（Model architecture）

DefectNet 模型基于 PyTorch 实现，采用模块化架构，由四个主要部分组成：

输出（Output）

DefectNet 可解析 6 种共存的取代型缺陷

DefectNet 在缺陷种类与浓度预测中的应用

研究人员首先在模拟 PDoS 上测试了典型二元（SiC 、 AlAs）和三元（AgGaS₂、 InCuSe₂）半导体。

在实验数据上微调 DefectNet

结语：前景广阔，但挑战重重

参考文献：
1.https://news.mit.edu/2026/mit-researchers-use-ai-uncover-atomic-defects-materials-0330
2.https://arxiv.org/abs/2506.00725

Command Palette

基于 2 千种半导体材料的模拟光谱数据，MIT 团队提出 DefectNet，可解析 6 种共存的取代型缺陷

数据集：基于 2 千种完美晶体材料构建数据集

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

DefectNet 可解析 6 种共存的取代型缺陷

DefectNet 在缺陷种类与浓度预测中的应用

在实验数据上微调 DefectNet

结语：前景广阔，但挑战重重

Command Palette

基于 2 千种半导体材料的模拟光谱数据，MIT 团队提出 DefectNet，可解析 6 种共存的取代型缺陷

数据集：基于 2 千种完美晶体材料构建数据集

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

DefectNet 可解析 6 种共存的取代型缺陷

DefectNet 在缺陷种类与浓度预测中的应用

在实验数据上微调 DefectNet

结语：前景广阔，但挑战重重

相关报道

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

仅需 3 秒音频实现「配音自由」，Mistral 开源语音大模型 Voxtral-4B-TTS-2603；数据质量新标杆：Sutra 10B Pretraini

高精度重建完全遮挡物体，MIT 团队利用生成式 AI 改进无线视觉系统，最高精度达 85%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

基于 2.5 万临床数据，斯坦福大学发布首个原生 3D 腹部 CT 视觉语言模型，Merlin 在 752 类任务中全面领先

AI 发现 118 颗新系外行星！华威大学团队提出 RAVEN，实现行星情景与每一种假阳性情景的逐一对比

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

溶血性预测准确率提升 350%，港中文/浙大/澳门理工等团队提出通用框架 Bi-TEAM，融合生物学语义与化学精度

Command Palette

基于 2 千种半导体材料的模拟光谱数据，MIT 团队提出 DefectNet，可解析 6 种共存的取代型缺陷

数据集：基于 2 千种完美晶体材料构建数据集

DefectNet：从 PDoS 中无损地直接识别点缺陷的化学种类及浓度

DefectNet 可解析 6 种共存的取代型缺陷

DefectNet 在缺陷种类与浓度预测中的应用

在实验数据上微调 DefectNet

结语：前景广阔，但挑战重重

相关报道

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

仅需 3 秒音频实现「配音自由」，Mistral 开源语音大模型 Voxtral-4B-TTS-2603；数据质量新标杆：Sutra 10B Pretraini

高精度重建完全遮挡物体，MIT 团队利用生成式 AI 改进无线视觉系统，最高精度达 85%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

基于 2.5 万临床数据，斯坦福大学发布首个原生 3D 腹部 CT 视觉语言模型，Merlin 在 752 类任务中全面领先

AI 发现 118 颗新系外行星！华威大学团队提出 RAVEN，实现行星情景与每一种假阳性情景的逐一对比

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

溶血性预测准确率提升 350%，港中文/浙大/澳门理工等团队提出通用框架 Bi-TEAM，融合生物学语义与化学精度

相关报道

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

仅需 3 秒音频实现「配音自由」，Mistral 开源语音大模型 Voxtral-4B-TTS-2603；数据质量新标杆：Sutra 10B Pretraini

高精度重建完全遮挡物体，MIT 团队利用生成式 AI 改进无线视觉系统，最高精度达 85%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

基于 2.5 万临床数据，斯坦福大学发布首个原生 3D 腹部 CT 视觉语言模型，Merlin 在 752 类任务中全面领先

AI 发现 118 颗新系外行星！华威大学团队提出 RAVEN，实现行星情景与每一种假阳性情景的逐一对比

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

溶血性预测准确率提升 350%，港中文/浙大/澳门理工等团队提出通用框架 Bi-TEAM，融合生物学语义与化学精度

相关报道

论文汇总丨超 100 篇 AI for Science 重要成果，一文速览 2025 年技术创新

仅需 3 秒音频实现「配音自由」，Mistral 开源语音大模型 Voxtral-4B-TTS-2603；数据质量新标杆：Sutra 10B Pretraini

高精度重建完全遮挡物体，MIT 团队利用生成式 AI 改进无线视觉系统，最高精度达 85%

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

基于 2.5 万临床数据，斯坦福大学发布首个原生 3D 腹部 CT 视觉语言模型，Merlin 在 752 类任务中全面领先

AI 发现 118 颗新系外行星！华威大学团队提出 RAVEN，实现行星情景与每一种假阳性情景的逐一对比

实现 1.4—3.7 倍推理加速，MIT 提出 DRiffusion 破解扩散模型采样延迟瓶颈

预测成功率超 80%！康奈尔大学提出创新 AI 框架，解码高导电性锂离子电解质的化学机制

溶血性预测准确率提升 350%，港中文/浙大/澳门理工等团队提出通用框架 Bi-TEAM，融合生物学语义与化学精度