「我高兴地在北京市的天安门广场上看红色的国旗升起」

快速阅读一下这个句子，大家可能会发现，只需「我在天安门广场看升旗」几个字，就能概述我们需要的信息，也就是说，无需逐字逐句地阅读，抓住重点即可破译全部信息。那么，科学研究是不是也能如此呢？

受此启发，研究人员将人工智能 (AI) 与显微技术结合，训练 AI 主动识别样本中的关键特征，供研究者分析。不同于传统显微技术中对样本的全点式扫描，AI + 显微技术的方法彻底改变了研究人员获取样本数据的方式，显著加快实验进程，实现了微观层面的「快速阅读」。

作者 | 加零

编辑 | 雪菜、三羊

显微镜的原理是通过扫描样品产生空间分辨信号，收集信号进行分析，从而形成样品图像。随着仪器仪表技术的不断进步，显微镜的扫描速度和分辨率都有了很大提升。

但是，高分辨率的显微扫描实验有一些明显的缺点：产生的数据量庞大，且探针对样品的损伤也很大。以在 ≈10 nm 的分辨率下进行 1mm^3 体积的 X 射线成像为例，传统扫描方式会产生 10^15 体素的数据，并且需要相当大剂量的探针。

同时，样本中的大多区域信息密度低、可以直接忽略，反而是少部分的「边界、缺陷、特殊元素」区域包含丰富的信息量，需要重点研究。

精准定位信息密度大的关键区域，传统方法主要依赖经验丰富的操作员分析数据、指导探针扫描，这极大增加了工作量，拖慢实验进度。

那么，有没有可能引入 AI ，让它帮助研究者识别样本中的研究重点，加速数据采集和分析呢?

在 APS 进行自动暗场扫描显微实验的艺术图示

为此，美国阿贡国家实验室 (Argonne National Laboratory) 的研究人员开发了 FAST (Fast Autonomous Scanning Toolkit)，它是一个快速自动扫描套件，与传统显微镜研究样本的全点式扫描不同，FAST 允许 AI 自动识别扫描的位置，从而高效精准的获取样本信息。目前相关成果已发表于「Nature Communications」。

相关成果已发表于「Advanced Science」

FAST 科研人员在模拟测试 (simulations) 及暗场 X 射线 (dark-field X-ray) 显微镜实验中，对 WSe2 film 进行了 FAST 扫描，结果表明，<25% 的 FAST 扫描就足以准确地成像并分析样本。

论文链接：

https://www.nature.com/articles/s41467-023-40339-1

实验过程

训练数据：利用通用图像训练算法

FAST 所采用的算法不需要利用大型数据集开展训练，AI 可利用通用图像识别感兴趣的区域。

训练数据由 MIT Libraries，USC-SIPI Image Database 和 Scikit-image software package 公开提供的图像生成。

所用的测试图像示例

FAST：快速自主扫描工具套件

FAST 全称 Fast Autonomous Scanning Toolkit，它结合了 SLADS-Net 方法、路径优化技术以及高效且模块化的硬件控制，是一个快速自主扫描工具套件，可用于基于同步加速器的扫描显微镜 (synchrotron-based scanning microscopy) 的实时采样和扫描路径选择。

FAST 工作流程

A：一组准随机 (quasi-random) 初始测量值被传输到边缘设备，依次生成初始样本估计，计算下一个要测量的候选点 (candidate points)，并计算出测量路径。新测量值与现有的测量值结合，计算新估计值，重复该过程直至达到完成标准。

B：候选点运算开始时会检查每个未被测量 point P（半径为 r）的局部邻域，已经测量过的点会高亮，从而生成 6 维特征向量。使用径向基核函数 (RBF) 内核将特征向量转换为 50 维向量，并作为多层神经网络 (NN) 的输入。接下来神经网络 (NN) 会通过测量 point P 对图像预期改进进行预测 (ERD) 。选择 ERD 最高的一组未测量像素，作为下次测量的候选。

FAST 的训练不依赖具体的样本数据，就可以动态测量和重构一个复杂的（非二进制）样本，这与现有的基于 SLADS 的工作流程有所不同。此外，与获取时间 (acquisition time) 相比，其计算成本可以忽略不计，即使运行在低功耗边缘计算设备（放在同步加速器束线）上也是如此，这对于更通用的自主实验技术而言具有显著优势。

这些特性使得 FAST 能够应用于 APS hard X-ray nanoprobe beamline 上现有的高精度纳米级扫描 X 射线显微镜仪器。

性能验证

FAST：优于静态取样方法

为了验证 FAST 的性能，研究人员将其与另外 3 种静态取样技术进行了对比实验。

实验对象：即测试数据集，为一张 600 × 400 像素的暗场图像，代表 24 万个可能的测量位置，覆盖 900 × 600 μm 的物理区域，并包含多片不同厚度的 WSe2 切片；

对比方式：3 种静态采样技术分别为栅格 (RG, Raster grid) 采样、均匀随机 (UR, Uniform random) 采样、低差异 (LDR, Low-discrepancy) 准随机采样；

实验过程：在相同的扫描覆盖率下，生成 FAST 、 RG 、 UR 和 LDR 采样重建图像。

对比一：

FAST 与静态采样重建图像对比

A ：ground truth 图像，颜色刻度代表归一化强度

B-D：10% 扫描覆盖率下 RG 、 LDR 和 FAST 重建图像

结果显示：FAST 采样能够高保真地再现实验对象中边界、气泡和不同厚度水平之间的过渡区域。

对比二：

不同扫描覆盖率下 FAST 与静态采样方法性能对比

A：归一化平方平均数误差 (NRMSE) 随扫描覆盖率的变化，值越低性能越优；

B：结构相似性度量 (SSIM) 随扫描覆盖率的变化，值越高性能越优。

结果显示：FAST 采样效率高，在扫描覆盖率达到 27% 时，实现了稳定重建；静态取样的 3 种方法要达到同样的效果，则需要更长的时间。

对比三：

相同取样条件下，覆盖率 10% 时 FAST 及 2 种静态取样方法的实际测量位置

结果显示，FAST 重建结构相似性高，误差低。

未来可通过在 FAST 方法中使用更复杂的修复技术 (inpainting technique)，来进一步改善结果。

以上 3 组对比结果显示：

FAST 优于静态采样技术。 FAST 会优先选择具有显著异质性的区域进行采样，而非均匀区域。这极大减少了在空白区域无效取样的时间，对稀疏样本特别有效。

FAST：具备高效、精准的暗场图像重建能力

在同步加速器光束线实验中，FAST 进一步展现了卓越性能。

此实验过程完全由 AI 自驱动进行，研究人员除启动 FAST 脚本外没有进行任何干扰。实验样本是变形的 WSe2 薄片，空间分辨率为 100 nm 。

FAST 扫描的演进

A 、 C 、 E ：5% 、 15% 和 20% 扫描覆盖率下 FAST 重建暗场图像；

B 、 D 、 F ：相应的实际测量点；

G ：通过全网格逐点扫描（100% 覆盖率）获得的图像；

A-G：颜色刻度显示了归一化强度；

H：仅显示在 15%-20% 覆盖率之间的采样点。

上图显示，低扫描覆盖率的情况下，FAST 方法优先识别了一些异质性区域，如气泡的边缘；随着扫描覆盖率逐步上升，重建结果越发清晰，在 15%-20% 的扫描覆盖率之间重建图像达到稳定。

20% 扫描覆盖率下，FAST 可清晰、准确地复制全扫描图像中所有主要特征，同时帮助实验节省约 80 分钟 (≈65%) 的时间，大大提高了实验效率。

AI + 显微技术的未来

FAST 流程的优势不仅在提升显微数据采集效率，还在于广泛的应用范围。来自美国阿贡国家实验室的科学家 Tao Zhou 说「从 X 射线显微镜到电子显微镜再到原子探针显微镜，这种技术可以为任何需要二维扫描的显微镜研究赋能」。

未来，AI 技术也将在显微技术领域迎来更深入地应用。通过训练，AI 正逐步接手如自动化图像分析和识别、图像增强和重建、定量分析和疾病诊断等任务。

AI + 显微技术，朝着更清晰、更高效、更精准的未来走去，科学研究的边界也将不断拓宽。

参考链接：

[1]https://www.nature.com/articles/s41467-023-40339-1

[2]https://phys.org/news/2023-10-artificial-intelligence-scientists-self-driving-microscopy.html

[3]A Supervised Learning Approach for Dynamic Sampling

「我高兴地在北京市的天安门广场上看红色的国旗升起」

作者 | 加零

编辑 | 雪菜、三羊

同时，样本中的大多区域信息密度低、可以直接忽略，反而是少部分的「边界、缺陷、特殊元素」区域包含丰富的信息量，需要重点研究。

精准定位信息密度大的关键区域，传统方法主要依赖经验丰富的操作员分析数据、指导探针扫描，这极大增加了工作量，拖慢实验进度。

那么，有没有可能引入 AI ，让它帮助研究者识别样本中的研究重点，加速数据采集和分析呢?

在 APS 进行自动暗场扫描显微实验的艺术图示

相关成果已发表于「Advanced Science」

论文链接：

https://www.nature.com/articles/s41467-023-40339-1

实验过程

训练数据：利用通用图像训练算法

FAST 所采用的算法不需要利用大型数据集开展训练，AI 可利用通用图像识别感兴趣的区域。

训练数据由 MIT Libraries，USC-SIPI Image Database 和 Scikit-image software package 公开提供的图像生成。

所用的测试图像示例

FAST：快速自主扫描工具套件

FAST 工作流程

这些特性使得 FAST 能够应用于 APS hard X-ray nanoprobe beamline 上现有的高精度纳米级扫描 X 射线显微镜仪器。

性能验证

FAST：优于静态取样方法

为了验证 FAST 的性能，研究人员将其与另外 3 种静态取样技术进行了对比实验。

对比方式：3 种静态采样技术分别为栅格 (RG, Raster grid) 采样、均匀随机 (UR, Uniform random) 采样、低差异 (LDR, Low-discrepancy) 准随机采样；

实验过程：在相同的扫描覆盖率下，生成 FAST 、 RG 、 UR 和 LDR 采样重建图像。

对比一：

FAST 与静态采样重建图像对比

A ：ground truth 图像，颜色刻度代表归一化强度

B-D：10% 扫描覆盖率下 RG 、 LDR 和 FAST 重建图像

结果显示：FAST 采样能够高保真地再现实验对象中边界、气泡和不同厚度水平之间的过渡区域。

对比二：

不同扫描覆盖率下 FAST 与静态采样方法性能对比

A：归一化平方平均数误差 (NRMSE) 随扫描覆盖率的变化，值越低性能越优；

B：结构相似性度量 (SSIM) 随扫描覆盖率的变化，值越高性能越优。

结果显示：FAST 采样效率高，在扫描覆盖率达到 27% 时，实现了稳定重建；静态取样的 3 种方法要达到同样的效果，则需要更长的时间。

对比三：

相同取样条件下，覆盖率 10% 时 FAST 及 2 种静态取样方法的实际测量位置

结果显示，FAST 重建结构相似性高，误差低。

未来可通过在 FAST 方法中使用更复杂的修复技术 (inpainting technique)，来进一步改善结果。

以上 3 组对比结果显示：

FAST：具备高效、精准的暗场图像重建能力

在同步加速器光束线实验中，FAST 进一步展现了卓越性能。

此实验过程完全由 AI 自驱动进行，研究人员除启动 FAST 脚本外没有进行任何干扰。实验样本是变形的 WSe2 薄片，空间分辨率为 100 nm 。

FAST 扫描的演进

A 、 C 、 E ：5% 、 15% 和 20% 扫描覆盖率下 FAST 重建暗场图像；

B 、 D 、 F ：相应的实际测量点；

G ：通过全网格逐点扫描（100% 覆盖率）获得的图像；

A-G：颜色刻度显示了归一化强度；

H：仅显示在 15%-20% 覆盖率之间的采样点。

20% 扫描覆盖率下，FAST 可清晰、准确地复制全扫描图像中所有主要特征，同时帮助实验节省约 80 分钟 (≈65%) 的时间，大大提高了实验效率。

AI + 显微技术的未来

AI + 显微技术，朝着更清晰、更高效、更精准的未来走去，科学研究的边界也将不断拓宽。

参考链接：

[1]https://www.nature.com/articles/s41467-023-40339-1

[2]https://phys.org/news/2023-10-artificial-intelligence-scientists-self-driving-microscopy.html

[3]A Supervised Learning Approach for Dynamic Sampling

「我高兴地在北京市的天安门广场上看红色的国旗升起」

作者 | 加零

编辑 | 雪菜、三羊

同时，样本中的大多区域信息密度低、可以直接忽略，反而是少部分的「边界、缺陷、特殊元素」区域包含丰富的信息量，需要重点研究。

精准定位信息密度大的关键区域，传统方法主要依赖经验丰富的操作员分析数据、指导探针扫描，这极大增加了工作量，拖慢实验进度。

那么，有没有可能引入 AI ，让它帮助研究者识别样本中的研究重点，加速数据采集和分析呢?

在 APS 进行自动暗场扫描显微实验的艺术图示

相关成果已发表于「Advanced Science」

论文链接：

https://www.nature.com/articles/s41467-023-40339-1

实验过程

训练数据：利用通用图像训练算法

FAST 所采用的算法不需要利用大型数据集开展训练，AI 可利用通用图像识别感兴趣的区域。

训练数据由 MIT Libraries，USC-SIPI Image Database 和 Scikit-image software package 公开提供的图像生成。

所用的测试图像示例

FAST：快速自主扫描工具套件

FAST 工作流程

这些特性使得 FAST 能够应用于 APS hard X-ray nanoprobe beamline 上现有的高精度纳米级扫描 X 射线显微镜仪器。

性能验证

FAST：优于静态取样方法

为了验证 FAST 的性能，研究人员将其与另外 3 种静态取样技术进行了对比实验。

对比方式：3 种静态采样技术分别为栅格 (RG, Raster grid) 采样、均匀随机 (UR, Uniform random) 采样、低差异 (LDR, Low-discrepancy) 准随机采样；

实验过程：在相同的扫描覆盖率下，生成 FAST 、 RG 、 UR 和 LDR 采样重建图像。

对比一：

FAST 与静态采样重建图像对比

A ：ground truth 图像，颜色刻度代表归一化强度

B-D：10% 扫描覆盖率下 RG 、 LDR 和 FAST 重建图像

结果显示：FAST 采样能够高保真地再现实验对象中边界、气泡和不同厚度水平之间的过渡区域。

对比二：

不同扫描覆盖率下 FAST 与静态采样方法性能对比

A：归一化平方平均数误差 (NRMSE) 随扫描覆盖率的变化，值越低性能越优；

B：结构相似性度量 (SSIM) 随扫描覆盖率的变化，值越高性能越优。

结果显示：FAST 采样效率高，在扫描覆盖率达到 27% 时，实现了稳定重建；静态取样的 3 种方法要达到同样的效果，则需要更长的时间。

对比三：

相同取样条件下，覆盖率 10% 时 FAST 及 2 种静态取样方法的实际测量位置

结果显示，FAST 重建结构相似性高，误差低。

未来可通过在 FAST 方法中使用更复杂的修复技术 (inpainting technique)，来进一步改善结果。

以上 3 组对比结果显示：

FAST：具备高效、精准的暗场图像重建能力

在同步加速器光束线实验中，FAST 进一步展现了卓越性能。

此实验过程完全由 AI 自驱动进行，研究人员除启动 FAST 脚本外没有进行任何干扰。实验样本是变形的 WSe2 薄片，空间分辨率为 100 nm 。

FAST 扫描的演进

A 、 C 、 E ：5% 、 15% 和 20% 扫描覆盖率下 FAST 重建暗场图像；

B 、 D 、 F ：相应的实际测量点；

G ：通过全网格逐点扫描（100% 覆盖率）获得的图像；

A-G：颜色刻度显示了归一化强度；

H：仅显示在 15%-20% 覆盖率之间的采样点。

20% 扫描覆盖率下，FAST 可清晰、准确地复制全扫描图像中所有主要特征，同时帮助实验节省约 80 分钟 (≈65%) 的时间，大大提高了实验效率。

AI + 显微技术的未来

AI + 显微技术，朝着更清晰、更高效、更精准的未来走去，科学研究的边界也将不断拓宽。

参考链接：

[1]https://www.nature.com/articles/s41467-023-40339-1

[2]https://phys.org/news/2023-10-artificial-intelligence-scientists-self-driving-microscopy.html

[3]A Supervised Learning Approach for Dynamic Sampling

Command Palette

美国阿贡国家实验室发布快速自动扫描套件 FAST，助力显微技术「快速阅读」成为可能

实验过程

训练数据：利用通用图像训练算法

FAST：快速自主扫描工具套件

性能验证

FAST：优于静态取样方法

FAST：具备高效、精准的暗场图像重建能力

AI + 显微技术的未来

Command Palette

美国阿贡国家实验室发布快速自动扫描套件 FAST，助力显微技术「快速阅读」成为可能

实验过程

训练数据：利用通用图像训练算法

FAST：快速自主扫描工具套件

性能验证

FAST：优于静态取样方法

FAST：具备高效、精准的暗场图像重建能力

AI + 显微技术的未来

相关报道

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

康奈尔大学开发多智能体平台 EMSeek，仅需 2-5 分钟即可将电子显微镜图像转化为材料学见解

AI 驱动从头设计多样化小分子结合蛋白，韩国团队发现能选择性识别压力激素的蛋白质

基于 Gemini 1.5 长上下文能力，谷歌对话式医疗系统 AMIE 在 100 例多次就诊场景中达到全科医师的推理水平

30 分钟整合 550 篇文献，生物学多智能体 Robin 跑通自主科研闭环，挖掘 dAMD 候选疗法

数据集汇总丨 AI Agent 评测数据集，Microsoft/北大/港大/上海交大等发布 10 个数据集，从长程记忆到真实环境任务执行全覆盖

在线教程丨指令遵循/推理/编码三合一，Mistral Medium 3.5 把 Coding Agent 搬上云端

论文周报 |微软 MAI-Thinking 探索纯 RL 自我进化，AIME 准确率达 97%；无需架构修改，VLM³凭纯文本坐标实现 3D 任务泛化… 速览一周 AI 前沿论文

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

Command Palette

美国阿贡国家实验室发布快速自动扫描套件 FAST，助力显微技术「快速阅读」成为可能

实验过程

训练数据：利用通用图像训练算法

FAST：快速自主扫描工具套件

性能验证

FAST：优于静态取样方法

FAST：具备高效、精准的暗场图像重建能力

AI + 显微技术的未来

相关报道

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

康奈尔大学开发多智能体平台 EMSeek，仅需 2-5 分钟即可将电子显微镜图像转化为材料学见解

AI 驱动从头设计多样化小分子结合蛋白，韩国团队发现能选择性识别压力激素的蛋白质

基于 Gemini 1.5 长上下文能力，谷歌对话式医疗系统 AMIE 在 100 例多次就诊场景中达到全科医师的推理水平

30 分钟整合 550 篇文献，生物学多智能体 Robin 跑通自主科研闭环，挖掘 dAMD 候选疗法

数据集汇总丨 AI Agent 评测数据集，Microsoft/北大/港大/上海交大等发布 10 个数据集，从长程记忆到真实环境任务执行全覆盖

在线教程丨指令遵循/推理/编码三合一，Mistral Medium 3.5 把 Coding Agent 搬上云端

论文周报 |微软 MAI-Thinking 探索纯 RL 自我进化，AIME 准确率达 97%；无需架构修改，VLM³凭纯文本坐标实现 3D 任务泛化… 速览一周 AI 前沿论文

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

相关报道

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

康奈尔大学开发多智能体平台 EMSeek，仅需 2-5 分钟即可将电子显微镜图像转化为材料学见解

AI 驱动从头设计多样化小分子结合蛋白，韩国团队发现能选择性识别压力激素的蛋白质

基于 Gemini 1.5 长上下文能力，谷歌对话式医疗系统 AMIE 在 100 例多次就诊场景中达到全科医师的推理水平

30 分钟整合 550 篇文献，生物学多智能体 Robin 跑通自主科研闭环，挖掘 dAMD 候选疗法

数据集汇总丨 AI Agent 评测数据集，Microsoft/北大/港大/上海交大等发布 10 个数据集，从长程记忆到真实环境任务执行全覆盖

在线教程丨指令遵循/推理/编码三合一，Mistral Medium 3.5 把 Coding Agent 搬上云端

论文周报 |微软 MAI-Thinking 探索纯 RL 自我进化，AIME 准确率达 97%；无需架构修改，VLM³凭纯文本坐标实现 3D 任务泛化… 速览一周 AI 前沿论文

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%

相关报道

零代码自主发现科学图像处理算法，美阿贡国家实验室提出 CVEvolve，具备写代码/结果自查/策略优化等全栈能力

康奈尔大学开发多智能体平台 EMSeek，仅需 2-5 分钟即可将电子显微镜图像转化为材料学见解

AI 驱动从头设计多样化小分子结合蛋白，韩国团队发现能选择性识别压力激素的蛋白质

基于 Gemini 1.5 长上下文能力，谷歌对话式医疗系统 AMIE 在 100 例多次就诊场景中达到全科医师的推理水平

30 分钟整合 550 篇文献，生物学多智能体 Robin 跑通自主科研闭环，挖掘 dAMD 候选疗法

数据集汇总丨 AI Agent 评测数据集，Microsoft/北大/港大/上海交大等发布 10 个数据集，从长程记忆到真实环境任务执行全覆盖

在线教程丨指令遵循/推理/编码三合一，Mistral Medium 3.5 把 Coding Agent 搬上云端

论文周报 |微软 MAI-Thinking 探索纯 RL 自我进化，AIME 准确率达 97%；无需架构修改，VLM³凭纯文本坐标实现 3D 任务泛化… 速览一周 AI 前沿论文

平均 1.8 秒完成预测，MIT 等开发 GPU 功耗估算框架 EnergAIzer，误差约 8%