Command Palette

Search for a command to run...

Amber_Benchmark 分子動力学パフォーマンス評価データセット

Discordコミュニティに参加

Amber は、エネルギー改良による支援モデル構築を意味します。

Amberベンチマークデータセットは、ハイパフォーマンスコンピューティング(HPC)環境向けに特別に設計された、パフォーマンスベンチマーク入力と設定ファイルのコレクションです。様々なハードウェアおよび並列アーキテクチャにおけるAmber分子動力学プログラムの効率性とスケーラビリティをテストおよび比較するために使用されます。

このデータセットには、科学的な実験データやシミュレーション結果とは異なり、システムの計算性能(速度、スケーラビリティ、効率)を測定するために使用される標準化された入力および設定パッケージが含まれています。これは、科学的分析のためのシミュレーション出力ではありません。すべてのベンチマーク(DHFR、Factor IX、Cellulose、STMVなど)には、標準化された入力ファイルと参照パフォーマンス結果が付属しており、異なるGPUまたはCPUプラットフォームで直接繰り返し実行してパフォーマンスを検証できます。

関連する論文結果は「アンバー生体分子シミュレーションの最近の進歩「...」というタイトルのデータセットは、2025年にDavid A. Caseらによってリリースされました。このデータセットの現在のバージョンは「...」です。Amber24: pmemd.cuda のパフォーマンス情報”。

データセットの構造

Amber は、2 つの補完的なベンチマーク スイートを提供しています。

  • ウォーカーベースラインキット
  • これは、Ross C. Walker 博士によって作成され、Amber GPU モジュール (pmemd.cuda) の最も初期のパフォーマンス評価ベンチマークの 1 つでした。
  • 2010 年以降、複数のバージョンと GPU アーキテクチャ (Fermi → Ampere → Hopper → Blackwell) をカバーしてきました。
  • さまざまな GPU の実行速度 (ns/日) を比較するために、いくつかの代表的なアーキテクチャ (JAC、Factor IX、Cellulose、STMV など) が含まれています。
  • Ceruttiベンチマークキット
  • Dave Cerutti 博士によって設計され、最新のリアルなシミュレーション設定 (Amber 18–20–24) を使用しています。
  • これには、DHFR、因子IX、セルロース、およびSTMV(23K~110万原子)の4つの周期表システムが含まれます。
  • 4 fs の時間ステップと 9 Å のカットオフ半径で NVE/NPT アンサンブルをサポートします。
  • 「デフォルト」と「ブースト」の 2 つの動作モードがあり、後者ではパフォーマンスが約 10% 向上します。

さらに、データセットには、非周期的シミュレーションのパフォーマンス評価用の、Trp ケージ、ミオグロビン、ヌクレオソームなどの暗黙的溶媒 (GB) ベンチマーク システムも含まれています。

データセットコンテンツの例

  • Walker ベンチマーク キット (従来の GPU ベンチマーク)

典型的なアーキテクチャとパフォーマンスの例(単一の GPU で実行)

システム名原子の数シリーズ歩幅GPUモデルパフォーマンス(ns/日)説明する
JACプロダクション23,558NVE/NPT4fsRTX40901638 / 1618小型タンパク質システムは、1600 ns/日を超える最高のパフォーマンスを提供します。
因子IXの産生90,906NVE/NPT2 fsRTX4090466 / 433PMEコミュニケーション効率を試験するための大型ウォーターボックスタンパク質システム
セルロース生産408,609NVE/NPT2 fsRTX4090129 / 119長距離相互作用と並列分解性能を評価するためのポリマーシステム
STMV_プロダクション1,067,095核不拡散条約4fsRTX409078.9タバコサテライトウイルスシステム、超大規模並列負荷テスト
  • 最新の Blackwell B200 GPU では、Amber24 の「Walker」スイートが小規模システムでは A100/H100 を上回り、大規模システムでもリードを維持しています。

  • Cerutti ベンチマーク スイート (最新の最適化されたベンチマーク)

典型的なアーキテクチャとパフォーマンスの例(V100 GPU、Amber 20)

システム名原子の数シリーズモデルパフォーマンス(ns/日)説明する
DHFR(JAC)23,588NVE/NPTデフォルト / ブースト934 / 1059小さなタンパク質システム、標準参照点
第IX因子90,906NVE/NPTデフォルト / ブースト365 / 406中規模システム、通信とスケーラビリティのバランステスト
セルロース408,609NVE/NPTデフォルト / ブースト88.9 / 96.2大規模多糖類システム、GPUメモリおよび帯域幅の圧力シナリオ
STMV1,067,095NVE/NPTデフォルト / ブースト30.4 / 33.5百万原子ウイルスシステム、極限並列性能評価
  • Amber 20 では、「リーキーペアリスト」と「ネットフォース補正」の最適化アルゴリズムが導入され、エネルギー保存を維持しながら計算負荷を約 31 TP3T 削減します。

  • 暗黙溶媒(GB)リファレンスキット

典型的なアーキテクチャとパフォーマンスの例 (V100 GPU、Amber 20、4 fs)

システム名原子の数モデルパフォーマンス(ns/日)説明する
Trpケージ304イギリス2801ピーク性能が2800 ns/日を超える小型タンパク質折り畳みモデル
ミオグロビン2,492イギリス1725安定した性能を持つ中型単鎖タンパク質システム
ヌクレオソーム25,095イギリス48.5エネルギー保存性とスループット能力を試験するための大規模クロマチンユニットシステム
  • GB モデルは、明示的な溶媒摩擦を除去した後、サンプリング レートを大幅に向上させることができるため、迅速なエネルギー表面探索に適しています。

パフォーマンス比較とスケーラビリティの概要

  • 小規模システム (≤ 30 K 原子): 並列タスクの量が限られているため、パフォーマンスは主に GPU クロック速度とメモリ帯域幅の影響を受けます。
  • 中規模システム (≈ 10 万原子): GPU 使用率のピークに達し、ほとんどの現実世界の生物システムに最適なパフォーマンス範囲を表します。
  • 大規模システム (400 K 原子以上): システム サイズが大きくなるにつれて、通信とメモリのオーバーヘッドが増加し、パフォーマンスが徐々に低下します。
  • 百万原子規模のシステム: Amber 24 は、単一の B200 GPU で 130 ns/日を超えるパフォーマンスを安定的に維持でき、優れた並列スケーラビリティを実証しています。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています