Command Palette
Search for a command to run...
Amber_Benchmark 分子動力学パフォーマンス評価データセット
Amber は、エネルギー改良による支援モデル構築を意味します。
Amberベンチマークデータセットは、ハイパフォーマンスコンピューティング(HPC)環境向けに特別に設計された、パフォーマンスベンチマーク入力と設定ファイルのコレクションです。様々なハードウェアおよび並列アーキテクチャにおけるAmber分子動力学プログラムの効率性とスケーラビリティをテストおよび比較するために使用されます。
このデータセットには、科学的な実験データやシミュレーション結果とは異なり、システムの計算性能(速度、スケーラビリティ、効率)を測定するために使用される標準化された入力および設定パッケージが含まれています。これは、科学的分析のためのシミュレーション出力ではありません。すべてのベンチマーク(DHFR、Factor IX、Cellulose、STMVなど)には、標準化された入力ファイルと参照パフォーマンス結果が付属しており、異なるGPUまたはCPUプラットフォームで直接繰り返し実行してパフォーマンスを検証できます。
関連する論文結果は「アンバー生体分子シミュレーションの最近の進歩「...」というタイトルのデータセットは、2025年にDavid A. Caseらによってリリースされました。このデータセットの現在のバージョンは「...」です。Amber24: pmemd.cuda のパフォーマンス情報”。
データセットの構造
Amber は、2 つの補完的なベンチマーク スイートを提供しています。
- ウォーカーベースラインキット
- これは、Ross C. Walker 博士によって作成され、Amber GPU モジュール (pmemd.cuda) の最も初期のパフォーマンス評価ベンチマークの 1 つでした。
- 2010 年以降、複数のバージョンと GPU アーキテクチャ (Fermi → Ampere → Hopper → Blackwell) をカバーしてきました。
- さまざまな GPU の実行速度 (ns/日) を比較するために、いくつかの代表的なアーキテクチャ (JAC、Factor IX、Cellulose、STMV など) が含まれています。
- Ceruttiベンチマークキット
- Dave Cerutti 博士によって設計され、最新のリアルなシミュレーション設定 (Amber 18–20–24) を使用しています。
- これには、DHFR、因子IX、セルロース、およびSTMV(23K~110万原子)の4つの周期表システムが含まれます。
- 4 fs の時間ステップと 9 Å のカットオフ半径で NVE/NPT アンサンブルをサポートします。
- 「デフォルト」と「ブースト」の 2 つの動作モードがあり、後者ではパフォーマンスが約 10% 向上します。
さらに、データセットには、非周期的シミュレーションのパフォーマンス評価用の、Trp ケージ、ミオグロビン、ヌクレオソームなどの暗黙的溶媒 (GB) ベンチマーク システムも含まれています。
データセットコンテンツの例
- Walker ベンチマーク キット (従来の GPU ベンチマーク)
典型的なアーキテクチャとパフォーマンスの例(単一の GPU で実行)
| システム名 | 原子の数 | シリーズ | 歩幅 | GPUモデル | パフォーマンス(ns/日) | 説明する |
|---|---|---|---|---|---|---|
| JACプロダクション | 23,558 | NVE/NPT | 4fs | RTX4090 | 1638 / 1618 | 小型タンパク質システムは、1600 ns/日を超える最高のパフォーマンスを提供します。 |
| 因子IXの産生 | 90,906 | NVE/NPT | 2 fs | RTX4090 | 466 / 433 | PMEコミュニケーション効率を試験するための大型ウォーターボックスタンパク質システム |
| セルロース生産 | 408,609 | NVE/NPT | 2 fs | RTX4090 | 129 / 119 | 長距離相互作用と並列分解性能を評価するためのポリマーシステム |
| STMV_プロダクション | 1,067,095 | 核不拡散条約 | 4fs | RTX4090 | 78.9 | タバコサテライトウイルスシステム、超大規模並列負荷テスト |
- 最新の Blackwell B200 GPU では、Amber24 の「Walker」スイートが小規模システムでは A100/H100 を上回り、大規模システムでもリードを維持しています。
- Cerutti ベンチマーク スイート (最新の最適化されたベンチマーク)
典型的なアーキテクチャとパフォーマンスの例(V100 GPU、Amber 20)
| システム名 | 原子の数 | シリーズ | モデル | パフォーマンス(ns/日) | 説明する |
|---|---|---|---|---|---|
| DHFR(JAC) | 23,588 | NVE/NPT | デフォルト / ブースト | 934 / 1059 | 小さなタンパク質システム、標準参照点 |
| 第IX因子 | 90,906 | NVE/NPT | デフォルト / ブースト | 365 / 406 | 中規模システム、通信とスケーラビリティのバランステスト |
| セルロース | 408,609 | NVE/NPT | デフォルト / ブースト | 88.9 / 96.2 | 大規模多糖類システム、GPUメモリおよび帯域幅の圧力シナリオ |
| STMV | 1,067,095 | NVE/NPT | デフォルト / ブースト | 30.4 / 33.5 | 百万原子ウイルスシステム、極限並列性能評価 |
- Amber 20 では、「リーキーペアリスト」と「ネットフォース補正」の最適化アルゴリズムが導入され、エネルギー保存を維持しながら計算負荷を約 31 TP3T 削減します。
- 暗黙溶媒(GB)リファレンスキット
典型的なアーキテクチャとパフォーマンスの例 (V100 GPU、Amber 20、4 fs)
| システム名 | 原子の数 | モデル | パフォーマンス(ns/日) | 説明する |
|---|---|---|---|---|
| Trpケージ | 304 | イギリス | 2801 | ピーク性能が2800 ns/日を超える小型タンパク質折り畳みモデル |
| ミオグロビン | 2,492 | イギリス | 1725 | 安定した性能を持つ中型単鎖タンパク質システム |
| ヌクレオソーム | 25,095 | イギリス | 48.5 | エネルギー保存性とスループット能力を試験するための大規模クロマチンユニットシステム |
- GB モデルは、明示的な溶媒摩擦を除去した後、サンプリング レートを大幅に向上させることができるため、迅速なエネルギー表面探索に適しています。
パフォーマンス比較とスケーラビリティの概要
- 小規模システム (≤ 30 K 原子): 並列タスクの量が限られているため、パフォーマンスは主に GPU クロック速度とメモリ帯域幅の影響を受けます。
- 中規模システム (≈ 10 万原子): GPU 使用率のピークに達し、ほとんどの現実世界の生物システムに最適なパフォーマンス範囲を表します。
- 大規模システム (400 K 原子以上): システム サイズが大きくなるにつれて、通信とメモリのオーバーヘッドが増加し、パフォーマンスが徐々に低下します。
- 百万原子規模のシステム: Amber 24 は、単一の B200 GPU で 130 ns/日を超えるパフォーマンスを安定的に維持でき、優れた並列スケーラビリティを実証しています。