Command Palette
Search for a command to run...
Amber_Benchmark 分子动力学性能评测数据集
Amber 全称为 Assisted Model Building with Energy Refinement,即「能量精炼辅助分子建模程序」。
Amber Benchmark 数据集是一组专为高性能计算(HPC)环境设计的性能基准输入与配置文件集合,用于测试与比较 Amber 分子动力学程序在多种硬件和并行架构下的运行效率与可扩展性。
与科学实验数据或模拟结果不同,本数据集包含的是标准化的输入与配置包(benchmark input/configuration packages),用于衡量系统的计算性能(速度、扩展性与效率),而非用于科学分析的模拟输出结果。所有基准体系(如 DHFR 、 Factor IX 、 Cellulose 、 STMV 等)均配有标准化输入文件和参考性能结果,可直接在不同 GPU 或 CPU 平台上重复运行以验证性能。
相关论文成果为「Recent Developments in Amber Biomolecular Simulations」,由 David A. Case 等人于 2025 年发布。该数据集当前版本为「Amber24: pmemd.cuda performance information」。
数据集结构
Amber 官方提供两类互补的基准测试套件:
- Walker 基准套件
- 由 Ross C. Walker 博士创建,是 Amber GPU 模块(pmemd.cuda)最早期的性能评估基准。
- 自 2010 年起覆盖多版本与 GPU 架构(Fermi → Ampere → Hopper → Blackwell)。
- 包含多个代表性体系(JAC 、 Factor IX 、 Cellulose 、 STMV 等),用于比较不同 GPU 的运行速度(ns/day)。
- Cerutti 基准套件
- 由 Dave Cerutti 博士设计,采用现代实际模拟设定(Amber18–20–24)。
- 包含四个周期体系:DHFR 、 Factor IX 、 Cellulose 、 STMV(23K–1.1M 原子)。
- 支持 NVE/NPT 系综,时间步长 4 fs,截断半径 9 Å。
- 提供「Default」与「Boost」两种运行模式,后者可提升约 10% 性能。
此外,该数据集还包含隐式溶剂(GB)基准体系,如 Trp Cage 、 Myoglobin 、 Nucleosome,用于非周期性模拟性能评估。
数据集内容示例
- Walker 基准套件(传统 GPU 基准)
典型体系与性能示例(单 GPU 运行)
| 体系名称 | 原子数 | 系综 | 步长 | GPU 型号 | 性能 (ns/day) | 说明 |
|---|---|---|---|---|---|---|
| JAC_production | 23,558 | NVE/NPT | 4 fs | RTX 4090 | 1638 / 1618 | 小型蛋白体系,性能最高,可达 1600 ns/day 以上 |
| Factor IX_production | 90,906 | NVE/NPT | 2 fs | RTX 4090 | 466 / 433 | 大型水盒蛋白体系,测试 PME 通信效率 |
| Cellulose_production | 408,609 | NVE/NPT | 2 fs | RTX 4090 | 129 / 119 | 高分子体系,衡量长程相互作用与并行分解性能 |
| STMV_production | 1,067,095 | NPT | 4 fs | RTX 4090 | 78.9 | 烟草卫星病毒体系,超大规模并行负载测试 |
- 在最新的 Blackwell B200 GPU 上,Amber24 的 “Walker” 套件在小型体系中性能已超过 A100/H100,在大型体系上亦保持领先。
- Cerutti 基准套件(现代优化基准)
典型体系与性能示例(V100 GPU, Amber 20)
| 体系名称 | 原子数 | 系综 | 模式 | 性能 (ns/day) | 说明 |
|---|---|---|---|---|---|
| DHFR (JAC) | 23,588 | NVE/NPT | Default / Boost | 934 / 1059 | 小型蛋白体系,标准参考点 |
| Factor IX | 90,906 | NVE/NPT | Default / Boost | 365 / 406 | 中型体系,通信与扩展性平衡测试 |
| Cellulose | 408,609 | NVE/NPT | Default / Boost | 88.9 / 96.2 | 大型多聚糖体系,GPU 内存与带宽压力场景 |
| STMV | 1,067,095 | NVE/NPT | Default / Boost | 30.4 / 33.5 | 百万原子病毒体系,极端并行性能评估 |
- Amber 20 引入了 “leaky pair list” 与 “net force correction” 优化算法,在维持能量守恒的同时减少约 3% 计算负担。
- 隐式溶剂(GB)基准套件
典型体系与性能示例(V100 GPU, Amber 20, 4 fs)
| 体系名称 | 原子数 | 模型 | 性能 (ns/day) | 说明 |
|---|---|---|---|---|
| Trp Cage | 304 | GB | 2801 | 小型蛋白折叠模型,峰值性能达 > 2800 ns/day |
| Myoglobin | 2,492 | GB | 1725 | 中型单链蛋白体系,性能稳定 |
| Nucleosome | 25,095 | GB | 48.5 | 大型染色质单元体系,测试能量守恒与吞吐能力 |
- GB 模型在去除显式溶剂摩擦后可显著提高采样速率,适用于快速能量面探索。
性能对比与扩展性概览
- 小型体系(≤ 30 K 原子):受限于并行任务量,性能主要受 GPU 时钟与内存带宽影响。
- 中型体系(≈ 100 K 原子):达到 GPU 利用率峰值,是多数实际生物体系的最佳性能区间。
- 大型体系(≥ 400 K 原子):通信与内存开销上升,性能随体系增大逐步下降。
- 百万原子级体系:Amber 24 在单 B200 GPU 上可稳定保持 > 130 ns/day 性能,显示良好并行伸缩性。