Command Palette

Search for a command to run...

Amber_Benchmark 分子动力学性能评测数据集

日期

3 天前

发布地址

ambermd.org

加入 Discord 社区

Amber 全称为 Assisted Model Building with Energy Refinement,即「能量精炼辅助分子建模程序」。

Amber Benchmark 数据集是一组专为高性能计算(HPC)环境设计的性能基准输入与配置文件集合,用于测试与比较 Amber 分子动力学程序在多种硬件和并行架构下的运行效率与可扩展性。

与科学实验数据或模拟结果不同,本数据集包含的是标准化的输入与配置包(benchmark input/configuration packages),用于衡量系统的计算性能(速度、扩展性与效率),而非用于科学分析的模拟输出结果。所有基准体系(如 DHFR 、 Factor IX 、 Cellulose 、 STMV 等)均配有标准化输入文件和参考性能结果,可直接在不同 GPU 或 CPU 平台上重复运行以验证性能。

相关论文成果为「Recent Developments in Amber Biomolecular Simulations」,由 David A. Case 等人于 2025 年发布。该数据集当前版本为「Amber24: pmemd.cuda performance information」。

数据集结构

Amber 官方提供两类互补的基准测试套件:

  • Walker 基准套件
  • 由 Ross C. Walker 博士创建,是 Amber GPU 模块(pmemd.cuda)最早期的性能评估基准。
  • 自 2010 年起覆盖多版本与 GPU 架构(Fermi → Ampere → Hopper → Blackwell)。
  • 包含多个代表性体系(JAC 、 Factor IX 、 Cellulose 、 STMV 等),用于比较不同 GPU 的运行速度(ns/day)。
  • Cerutti 基准套件
  • 由 Dave Cerutti 博士设计,采用现代实际模拟设定(Amber18–20–24)。
  • 包含四个周期体系:DHFR 、 Factor IX 、 Cellulose 、 STMV(23K–1.1M 原子)。
  • 支持 NVE/NPT 系综,时间步长 4 fs,截断半径 9 Å。
  • 提供「Default」与「Boost」两种运行模式,后者可提升约 10% 性能。

此外,该数据集还包含隐式溶剂(GB)基准体系,如 Trp Cage 、 Myoglobin 、 Nucleosome,用于非周期性模拟性能评估。

数据集内容示例

  • Walker 基准套件(传统 GPU 基准)

典型体系与性能示例(单 GPU 运行)

体系名称原子数系综步长GPU 型号性能 (ns/day)说明
JAC_production23,558NVE/NPT4 fsRTX 40901638 / 1618小型蛋白体系,性能最高,可达 1600 ns/day 以上
Factor IX_production90,906NVE/NPT2 fsRTX 4090466 / 433大型水盒蛋白体系,测试 PME 通信效率
Cellulose_production408,609NVE/NPT2 fsRTX 4090129 / 119高分子体系,衡量长程相互作用与并行分解性能
STMV_production1,067,095NPT4 fsRTX 409078.9烟草卫星病毒体系,超大规模并行负载测试
  • 在最新的 Blackwell B200 GPU 上,Amber24 的 “Walker” 套件在小型体系中性能已超过 A100/H100,在大型体系上亦保持领先。

  • Cerutti 基准套件(现代优化基准)

典型体系与性能示例(V100 GPU, Amber 20)

体系名称原子数系综模式性能 (ns/day)说明
DHFR (JAC)23,588NVE/NPTDefault / Boost934 / 1059小型蛋白体系,标准参考点
Factor IX90,906NVE/NPTDefault / Boost365 / 406中型体系,通信与扩展性平衡测试
Cellulose408,609NVE/NPTDefault / Boost88.9 / 96.2大型多聚糖体系,GPU 内存与带宽压力场景
STMV1,067,095NVE/NPTDefault / Boost30.4 / 33.5百万原子病毒体系,极端并行性能评估
  • Amber 20 引入了 “leaky pair list” 与 “net force correction” 优化算法,在维持能量守恒的同时减少约 3% 计算负担。

  • 隐式溶剂(GB)基准套件

典型体系与性能示例(V100 GPU, Amber 20, 4 fs)

体系名称原子数模型性能 (ns/day)说明
Trp Cage304GB2801小型蛋白折叠模型,峰值性能达 > 2800 ns/day
Myoglobin2,492GB1725中型单链蛋白体系,性能稳定
Nucleosome25,095GB48.5大型染色质单元体系,测试能量守恒与吞吐能力
  • GB 模型在去除显式溶剂摩擦后可显著提高采样速率,适用于快速能量面探索。

性能对比与扩展性概览

  • 小型体系(≤ 30 K 原子):受限于并行任务量,性能主要受 GPU 时钟与内存带宽影响。
  • 中型体系(≈ 100 K 原子):达到 GPU 利用率峰值,是多数实际生物体系的最佳性能区间。
  • 大型体系(≥ 400 K 原子):通信与内存开销上升,性能随体系增大逐步下降。
  • 百万原子级体系:Amber 24 在单 B200 GPU 上可稳定保持 > 130 ns/day 性能,显示良好并行伸缩性。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供