HyperAIHyperAI

Command Palette

Search for a command to run...

Amber_Benchmark 分子動力学パフォーマンス評価データセット

Discordで議論

日付

6ヶ月前

公開URL

ambermd.org

Amber は、エネルギー改良による支援モデル構築を意味します。 Amberベンチマークデータセットは、ハイパフォーマンスコンピューティング(HPC)環境向けに特別に設計された、パフォーマンスベンチマーク入力と設定ファイルのコレクションです。様々なハードウェアおよび並列アーキテクチャにおけるAmber分子動力学プログラムの効率性とスケーラビリティをテストおよび比較するために使用されます。 このデータセットには、科学的な実験データやシミュレーション結果とは異なり、システムの計算性能(速度、スケーラビリティ、効率)を測定するために使用される標準化された入力および設定パッケージが含まれています。これは、科学的分析のためのシミュレーション出力ではありません。すべてのベンチマーク(DHFR、Factor IX、Cellulose、STMVなど)には、標準化された入力ファイルと参照パフォーマンス結果が付属しており、異なるGPUまたはCPUプラットフォームで直接繰り返し実行してパフォーマンスを検証できます。 関連する論文結果は「アンバー生体分子シミュレーションの最近の進歩「...」というタイトルのデータセットは、2025年にDavid A. Caseらによってリリースされました。このデータセットの現在のバージョンは「...」です。Amber24: pmemd.cuda のパフォーマンス情報”。

データセットの構造

Amber は、2 つの補完的なベンチマーク スイートを提供しています。

  • ウォーカーベースラインキット
  • これは、Ross C. Walker 博士によって作成され、Amber GPU モジュール (pmemd.cuda) の最も初期のパフォーマンス評価ベンチマークの 1 つでした。
  • 2010 年以降、複数のバージョンと GPU アーキテクチャ (Fermi → Ampere → Hopper → Blackwell) をカバーしてきました。
  • さまざまな GPU の実行速度 (ns/日) を比較するために、いくつかの代表的なアーキテクチャ (JAC、Factor IX、Cellulose、STMV など) が含まれています。
  • Ceruttiベンチマークキット
  • Dave Cerutti 博士によって設計され、最新のリアルなシミュレーション設定 (Amber 18–20–24) を使用しています。
  • これには、DHFR、因子IX、セルロース、およびSTMV(23K~110万原子)の4つの周期表システムが含まれます。
  • 4 fs の時間ステップと 9 Å のカットオフ半径で NVE/NPT アンサンブルをサポートします。
  • 「デフォルト」と「ブースト」の 2 つの動作モードがあり、後者ではパフォーマンスが約 10% 向上します。 さらに、データセットには、非周期的シミュレーションのパフォーマンス評価用の、Trp ケージ、ミオグロビン、ヌクレオソームなどの暗黙的溶媒 (GB) ベンチマーク システムも含まれています。

データセットコンテンツの例

  • Walker ベンチマーク キット (従来の GPU ベンチマーク) 典型的なアーキテクチャとパフォーマンスの例(単一の GPU で実行) | システム名 | 原子の数 | シリーズ | 歩幅 | GPUモデル | パフォーマンス(ns/日) | 説明する | | --- | --- | --- | --- | --- | --- | --- | | JACプロダクション | 23,558 | NVE/NPT | 4fs | RTX4090 | 1638 / 1618 | 小型タンパク質システムは、1600 ns/日を超える最高のパフォーマンスを提供します。 | | 因子IXの産生 | 90,906 | NVE/NPT | 2 fs | RTX4090 | 466 / 433 | PMEコミュニケーション効率を試験するための大型ウォーターボックスタンパク質システム | | セルロース生産 | 408,609 | NVE/NPT | 2 fs | RTX4090 | 129 / 119 | 長距離相互作用と並列分解性能を評価するためのポリマーシステム | | STMV_プロダクション | 1,067,095 | 核不拡散条約 | 4fs | RTX4090 | 78.9 | タバコサテライトウイルスシステム、超大規模並列負荷テスト |
  • 最新の Blackwell B200 GPU では、Amber24 の「Walker」スイートが小規模システムでは A100/H100 を上回り、大規模システムでもリードを維持しています。

  • Cerutti ベンチマーク スイート (最新の最適化されたベンチマーク) 典型的なアーキテクチャとパフォーマンスの例(V100 GPU、Amber 20) | システム名 | 原子の数 | シリーズ | モデル | パフォーマンス(ns/日) | 説明する | | --- | --- | --- | --- | --- | --- | | DHFR(JAC) | 23,588 | NVE/NPT | デフォルト / ブースト | 934 / 1059 | 小さなタンパク質システム、標準参照点 | | 第IX因子 | 90,906 | NVE/NPT | デフォルト / ブースト | 365 / 406 | 中規模システム、通信とスケーラビリティのバランステスト | | セルロース | 408,609 | NVE/NPT | デフォルト / ブースト | 88.9 / 96.2 | 大規模多糖類システム、GPUメモリおよび帯域幅の圧力シナリオ | | STMV | 1,067,095 | NVE/NPT | デフォルト / ブースト | 30.4 / 33.5 | 百万原子ウイルスシステム、極限並列性能評価 |
  • Amber 20 では、「リーキーペアリスト」と「ネットフォース補正」の最適化アルゴリズムが導入され、エネルギー保存を維持しながら計算負荷を約 31 TP3T 削減します。

  • 暗黙溶媒(GB)リファレンスキット 典型的なアーキテクチャとパフォーマンスの例 (V100 GPU、Amber 20、4 fs) | システム名 | 原子の数 | モデル | パフォーマンス(ns/日) | 説明する | | --- | --- | --- | --- | --- | | Trpケージ | 304 | イギリス | 2801 | ピーク性能が2800 ns/日を超える小型タンパク質折り畳みモデル | | ミオグロビン | 2,492 | イギリス | 1725 | 安定した性能を持つ中型単鎖タンパク質システム | | ヌクレオソーム | 25,095 | イギリス | 48.5 | エネルギー保存性とスループット能力を試験するための大規模クロマチンユニットシステム |
  • GB モデルは、明示的な溶媒摩擦を除去した後、サンプリング レートを大幅に向上させることができるため、迅速なエネルギー表面探索に適しています。

パフォーマンス比較とスケーラビリティの概要
  • 小規模システム (≤ 30 K 原子): 並列タスクの量が限られているため、パフォーマンスは主に GPU クロック速度とメモリ帯域幅の影響を受けます。
  • 中規模システム (≈ 10 万原子): GPU 使用率のピークに達し、ほとんどの現実世界の生物システムに最適なパフォーマンス範囲を表します。
  • 大規模システム (400 K 原子以上): システム サイズが大きくなるにつれて、通信とメモリのオーバーヘッドが増加し、パフォーマンスが徐々に低下します。
  • 百万原子規模のシステム: Amber 24 は、単一の B200 GPU で 130 ns/日を超えるパフォーマンスを安定的に維持でき、優れた並列スケーラビリティを実証しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Amber_Benchmark 分子動力学パフォーマンス評価データセット | データセット | HyperAI超神経