体系名称

原子数

系综

步长

GPU 型号

性能 (ns/day)

说明

JAC_production

23,558

NVE/NPT

4 fs

RTX 4090

1638 / 1618

小型蛋白体系，性能最高，可达 1600 ns/day 以上

Factor IX_production

90,906

NVE/NPT

2 fs

RTX 4090

466 / 433

大型水盒蛋白体系，测试 PME 通信效率

Cellulose_production

408,609

NVE/NPT

2 fs

RTX 4090

129 / 119

高分子体系，衡量长程相互作用与并行分解性能

STMV_production

1,067,095

NPT

4 fs

RTX 4090

78.9

烟草卫星病毒体系，超大规模并行负载测试

体系名称

原子数

系综

模式

性能 (ns/day)

说明

DHFR (JAC)

23,588

NVE/NPT

Default / Boost

934 / 1059

小型蛋白体系，标准参考点

Factor IX

90,906

NVE/NPT

Default / Boost

365 / 406

中型体系，通信与扩展性平衡测试

Cellulose

408,609

NVE/NPT

Default / Boost

88.9 / 96.2

大型多聚糖体系，GPU 内存与带宽压力场景

STMV

1,067,095

NVE/NPT

Default / Boost

30.4 / 33.5

百万原子病毒体系，极端并行性能评估

体系名称

原子数

模型

性能 (ns/day)

说明

Trp Cage

304

2801

小型蛋白折叠模型，峰值性能达 > 2800 ns/day

Myoglobin

2,492

1725

中型单链蛋白体系，性能稳定

Nucleosome

25,095

48.5

大型染色质单元体系，测试能量守恒与吞吐能力

HyperAI

在 Discord 上讨论

日期

3 个月前

发布 URL

ambermd.org

标签

高性能计算

Amber 全称为 Assisted Model Building with Energy Refinement，即「能量精炼辅助分子建模程序」。

Amber Benchmark 数据集是一组专为高性能计算（HPC）环境设计的性能基准输入与配置文件集合，用于测试与比较 Amber 分子动力学程序在多种硬件和并行架构下的运行效率与可扩展性。

与科学实验数据或模拟结果不同，本数据集包含的是标准化的输入与配置包（benchmark input/configuration packages），用于衡量系统的计算性能（速度、扩展性与效率），而非用于科学分析的模拟输出结果。所有基准体系（如 DHFR 、 Factor IX 、 Cellulose 、 STMV 等）均配有标准化输入文件和参考性能结果，可直接在不同 GPU 或 CPU 平台上重复运行以验证性能。

相关论文成果为「Recent Developments in Amber Biomolecular Simulations」，由 David A. Case 等人于 2025 年发布。该数据集当前版本为「Amber24: pmemd.cuda performance information」。

数据集结构

Amber 官方提供两类互补的基准测试套件：

Walker 基准套件
由 Ross C. Walker 博士创建，是 Amber GPU 模块（pmemd.cuda）最早期的性能评估基准。
自 2010 年起覆盖多版本与 GPU 架构（Fermi → Ampere → Hopper → Blackwell）。
包含多个代表性体系（JAC 、 Factor IX 、 Cellulose 、 STMV 等），用于比较不同 GPU 的运行速度（ns/day）。
Cerutti 基准套件
由 Dave Cerutti 博士设计，采用现代实际模拟设定（Amber18–20–24）。
包含四个周期体系：DHFR 、 Factor IX 、 Cellulose 、 STMV（23K–1.1M 原子）。
支持 NVE/NPT 系综，时间步长 4 fs，截断半径 9 Å。
提供「Default」与「Boost」两种运行模式，后者可提升约 10% 性能。

此外，该数据集还包含隐式溶剂（GB）基准体系，如 Trp Cage 、 Myoglobin 、 Nucleosome，用于非周期性模拟性能评估。

数据集内容示例

Walker 基准套件（传统 GPU 基准）

典型体系与性能示例（单 GPU 运行）

体系名称	原子数	系综	步长	GPU 型号	性能 (ns/day)	说明
JAC_production	23,558	NVE/NPT	4 fs	RTX 4090	1638 / 1618	小型蛋白体系，性能最高，可达 1600 ns/day 以上
Factor IX_production	90,906	NVE/NPT	2 fs	RTX 4090	466 / 433	大型水盒蛋白体系，测试 PME 通信效率
Cellulose_production	408,609	NVE/NPT	2 fs	RTX 4090	129 / 119	高分子体系，衡量长程相互作用与并行分解性能
STMV_production	1,067,095	NPT	4 fs	RTX 4090	78.9	烟草卫星病毒体系，超大规模并行负载测试

在最新的 Blackwell B200 GPU 上，Amber24 的 “Walker” 套件在小型体系中性能已超过 A100/H100，在大型体系上亦保持领先。

Cerutti 基准套件（现代优化基准）

典型体系与性能示例（V100 GPU, Amber 20）

体系名称	原子数	系综	模式	性能 (ns/day)	说明
DHFR (JAC)	23,588	NVE/NPT	Default / Boost	934 / 1059	小型蛋白体系，标准参考点
Factor IX	90,906	NVE/NPT	Default / Boost	365 / 406	中型体系，通信与扩展性平衡测试
Cellulose	408,609	NVE/NPT	Default / Boost	88.9 / 96.2	大型多聚糖体系，GPU 内存与带宽压力场景
STMV	1,067,095	NVE/NPT	Default / Boost	30.4 / 33.5	百万原子病毒体系，极端并行性能评估

Amber 20 引入了 “leaky pair list” 与 “net force correction” 优化算法，在维持能量守恒的同时减少约 3% 计算负担。

隐式溶剂（GB）基准套件

典型体系与性能示例（V100 GPU, Amber 20, 4 fs）

体系名称	原子数	模型	性能 (ns/day)	说明
Trp Cage	304	GB	2801	小型蛋白折叠模型，峰值性能达 > 2800 ns/day
Myoglobin	2,492	GB	1725	中型单链蛋白体系，性能稳定
Nucleosome	25,095	GB	48.5	大型染色质单元体系，测试能量守恒与吞吐能力

GB 模型在去除显式溶剂摩擦后可显著提高采样速率，适用于快速能量面探索。

性能对比与扩展性概览

小型体系（≤ 30 K 原子）：受限于并行任务量，性能主要受 GPU 时钟与内存带宽影响。
中型体系（≈ 100 K 原子）：达到 GPU 利用率峰值，是多数实际生物体系的最佳性能区间。
大型体系（≥ 400 K 原子）：通信与内存开销上升，性能随体系增大逐步下降。
百万原子级体系：Amber 24 在单 B200 GPU 上可稳定保持 > 130 ns/day 性能，显示良好并行伸缩性。

该数据集由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

体系名称

原子数

系综

步长

GPU 型号

性能 (ns/day)

说明

JAC_production

23,558

NVE/NPT

4 fs

RTX 4090

1638 / 1618

小型蛋白体系，性能最高，可达 1600 ns/day 以上

Factor IX_production

90,906

NVE/NPT

2 fs

RTX 4090

466 / 433

大型水盒蛋白体系，测试 PME 通信效率

Cellulose_production

408,609

NVE/NPT

2 fs

RTX 4090

129 / 119

高分子体系，衡量长程相互作用与并行分解性能

STMV_production

1,067,095

NPT

4 fs

RTX 4090

78.9

烟草卫星病毒体系，超大规模并行负载测试

体系名称

原子数

系综

模式

性能 (ns/day)

说明

DHFR (JAC)

23,588

NVE/NPT

Default / Boost

934 / 1059

小型蛋白体系，标准参考点

Factor IX

90,906

NVE/NPT

Default / Boost

365 / 406

中型体系，通信与扩展性平衡测试

Cellulose

408,609

NVE/NPT

Default / Boost

88.9 / 96.2

大型多聚糖体系，GPU 内存与带宽压力场景

STMV

1,067,095

NVE/NPT

Default / Boost

30.4 / 33.5

百万原子病毒体系，极端并行性能评估

体系名称

原子数

模型

性能 (ns/day)

说明

Trp Cage

304

2801

小型蛋白折叠模型，峰值性能达 > 2800 ns/day

Myoglobin

2,492

1725

中型单链蛋白体系，性能稳定

Nucleosome

25,095

48.5

大型染色质单元体系，测试能量守恒与吞吐能力

Command Palette

Amber_Benchmark 分子动力学性能评测数据集

数据集结构

数据集内容示例

性能对比与扩展性概览

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Amber_Benchmark 分子动力学性能评测数据集

数据集结构

数据集内容示例

性能对比与扩展性概览

相关数据集

NAMD_Benchmark 分子动力学性能基准数据集

AutoDock-GPU_Output 对接结果数据集

QEF_Benchmark 电子结构计算基准测试数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

VOccl3D 三维人体遮挡视频数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

VenusBench-GD 跨平台界面理解数据集

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Amber_Benchmark 分子动力学性能评测数据集

数据集结构

数据集内容示例

性能对比与扩展性概览

相关数据集

NAMD_Benchmark 分子动力学性能基准数据集

AutoDock-GPU_Output 对接结果数据集

QEF_Benchmark 电子结构计算基准测试数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

VOccl3D 三维人体遮挡视频数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

VenusBench-GD 跨平台界面理解数据集

用 AI 构建 AI

HyperAI Newsletters

相关数据集

NAMD_Benchmark 分子动力学性能基准数据集

AutoDock-GPU_Output 对接结果数据集

QEF_Benchmark 电子结构计算基准测试数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

VOccl3D 三维人体遮挡视频数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

VenusBench-GD 跨平台界面理解数据集

相关数据集

NAMD_Benchmark 分子动力学性能基准数据集

AutoDock-GPU_Output 对接结果数据集

QEF_Benchmark 电子结构计算基准测试数据集

UNO-Bench 全模态评测基准数据集

HumanSense Benchmark 人体感知基准数据集

VOccl3D 三维人体遮挡视频数据集

OpenGU 图遗忘综合评测数据集

MUVR 多模态非裁剪视频检索基准

VenusBench-GD 跨平台界面理解数据集