日付

8ヶ月前

公開URL

タグ

Amber は、エネルギー改良による支援モデル構築を意味します。 Amberベンチマークデータセットは、ハイパフォーマンスコンピューティング（HPC）環境向けに特別に設計された、パフォーマンスベンチマーク入力と設定ファイルのコレクションです。様々なハードウェアおよび並列アーキテクチャにおけるAmber分子動力学プログラムの効率性とスケーラビリティをテストおよび比較するために使用されます。このデータセットには、科学的な実験データやシミュレーション結果とは異なり、システムの計算性能（速度、スケーラビリティ、効率）を測定するために使用される標準化された入力および設定パッケージが含まれています。これは、科学的分析のためのシミュレーション出力ではありません。すべてのベンチマーク（DHFR、Factor IX、Cellulose、STMVなど）には、標準化された入力ファイルと参照パフォーマンス結果が付属しており、異なるGPUまたはCPUプラットフォームで直接繰り返し実行してパフォーマンスを検証できます。関連する論文結果は「アンバー生体分子シミュレーションの最近の進歩「...」というタイトルのデータセットは、2025年にDavid A. Caseらによってリリースされました。このデータセットの現在のバージョンは「...」です。Amber24: pmemd.cuda のパフォーマンス情報”。

データセットの構造

Amber は、2 つの補完的なベンチマークスイートを提供しています。

ウォーカーベースラインキット
これは、Ross C. Walker 博士によって作成され、Amber GPU モジュール (pmemd.cuda) の最も初期のパフォーマンス評価ベンチマークの 1 つでした。
2010 年以降、複数のバージョンと GPU アーキテクチャ (Fermi → Ampere → Hopper → Blackwell) をカバーしてきました。
さまざまな GPU の実行速度 (ns/日) を比較するために、いくつかの代表的なアーキテクチャ (JAC、Factor IX、Cellulose、STMV など) が含まれています。
Ceruttiベンチマークキット
Dave Cerutti 博士によって設計され、最新のリアルなシミュレーション設定 (Amber 18–20–24) を使用しています。
これには、DHFR、因子IX、セルロース、およびSTMV（23K～110万原子）の4つの周期表システムが含まれます。
4 fs の時間ステップと 9 Å のカットオフ半径で NVE/NPT アンサンブルをサポートします。
「デフォルト」と「ブースト」の 2 つの動作モードがあり、後者ではパフォーマンスが約 10% 向上します。さらに、データセットには、非周期的シミュレーションのパフォーマンス評価用の、Trp ケージ、ミオグロビン、ヌクレオソームなどの暗黙的溶媒 (GB) ベンチマークシステムも含まれています。

データセットコンテンツの例

Walker ベンチマークキット (従来の GPU ベンチマーク) 典型的なアーキテクチャとパフォーマンスの例（単一の GPU で実行） | システム名 | 原子の数 | シリーズ | 歩幅 | GPUモデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | --- | --- | | JACプロダクション | 23,558 | NVE/NPT | 4fs | RTX4090 | 1638 / 1618 | 小型タンパク質システムは、1600 ns/日を超える最高のパフォーマンスを提供します。 | | 因子IXの産生 | 90,906 | NVE/NPT | 2 fs | RTX4090 | 466 / 433 | PMEコミュニケーション効率を試験するための大型ウォーターボックスタンパク質システム | | セルロース生産 | 408,609 | NVE/NPT | 2 fs | RTX4090 | 129 / 119 | 長距離相互作用と並列分解性能を評価するためのポリマーシステム | | STMV_プロダクション | 1,067,095 | 核不拡散条約 | 4fs | RTX4090 | 78.9 | タバコサテライトウイルスシステム、超大規模並列負荷テスト |
最新の Blackwell B200 GPU では、Amber24 の「Walker」スイートが小規模システムでは A100/H100 を上回り、大規模システムでもリードを維持しています。

Cerutti ベンチマークスイート (最新の最適化されたベンチマーク) 典型的なアーキテクチャとパフォーマンスの例（V100 GPU、Amber 20） | システム名 | 原子の数 | シリーズ | モデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | --- | | DHFR（JAC） | 23,588 | NVE/NPT | デフォルト / ブースト | 934 / 1059 | 小さなタンパク質システム、標準参照点 | | 第IX因子 | 90,906 | NVE/NPT | デフォルト / ブースト | 365 / 406 | 中規模システム、通信とスケーラビリティのバランステスト | | セルロース | 408,609 | NVE/NPT | デフォルト / ブースト | 88.9 / 96.2 | 大規模多糖類システム、GPUメモリおよび帯域幅の圧力シナリオ | | STMV | 1,067,095 | NVE/NPT | デフォルト / ブースト | 30.4 / 33.5 | 百万原子ウイルスシステム、極限並列性能評価 |
Amber 20 では、「リーキーペアリスト」と「ネットフォース補正」の最適化アルゴリズムが導入され、エネルギー保存を維持しながら計算負荷を約 31 TP3T 削減します。

暗黙溶媒（GB）リファレンスキット典型的なアーキテクチャとパフォーマンスの例 (V100 GPU、Amber 20、4 fs) | システム名 | 原子の数 | モデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | | Trpケージ | 304 | イギリス | 2801 | ピーク性能が2800 ns/日を超える小型タンパク質折り畳みモデル | | ミオグロビン | 2,492 | イギリス | 1725 | 安定した性能を持つ中型単鎖タンパク質システム | | ヌクレオソーム | 25,095 | イギリス | 48.5 | エネルギー保存性とスループット能力を試験するための大規模クロマチンユニットシステム |
GB モデルは、明示的な溶媒摩擦を除去した後、サンプリングレートを大幅に向上させることができるため、迅速なエネルギー表面探索に適しています。

パフォーマンス比較とスケーラビリティの概要

小規模システム (≤ 30 K 原子): 並列タスクの量が限られているため、パフォーマンスは主に GPU クロック速度とメモリ帯域幅の影響を受けます。
中規模システム (≈ 10 万原子): GPU 使用率のピークに達し、ほとんどの現実世界の生物システムに最適なパフォーマンス範囲を表します。
大規模システム (400 K 原子以上): システムサイズが大きくなるにつれて、通信とメモリのオーバーヘッドが増加し、パフォーマンスが徐々に低下します。
百万原子規模のシステム: Amber 24 は、単一の B200 GPU で 130 ns/日を超えるパフォーマンスを安定的に維持でき、優れた並列スケーラビリティを実証しています。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

Discordで議論

日付

8ヶ月前

公開URL

ambermd.org

タグ

高性能計算

データセットの構造

Amber は、2 つの補完的なベンチマークスイートを提供しています。

ウォーカーベースラインキット
これは、Ross C. Walker 博士によって作成され、Amber GPU モジュール (pmemd.cuda) の最も初期のパフォーマンス評価ベンチマークの 1 つでした。
2010 年以降、複数のバージョンと GPU アーキテクチャ (Fermi → Ampere → Hopper → Blackwell) をカバーしてきました。
さまざまな GPU の実行速度 (ns/日) を比較するために、いくつかの代表的なアーキテクチャ (JAC、Factor IX、Cellulose、STMV など) が含まれています。
Ceruttiベンチマークキット
Dave Cerutti 博士によって設計され、最新のリアルなシミュレーション設定 (Amber 18–20–24) を使用しています。
これには、DHFR、因子IX、セルロース、およびSTMV（23K～110万原子）の4つの周期表システムが含まれます。
4 fs の時間ステップと 9 Å のカットオフ半径で NVE/NPT アンサンブルをサポートします。
「デフォルト」と「ブースト」の 2 つの動作モードがあり、後者ではパフォーマンスが約 10% 向上します。さらに、データセットには、非周期的シミュレーションのパフォーマンス評価用の、Trp ケージ、ミオグロビン、ヌクレオソームなどの暗黙的溶媒 (GB) ベンチマークシステムも含まれています。

データセットコンテンツの例

Walker ベンチマークキット (従来の GPU ベンチマーク) 典型的なアーキテクチャとパフォーマンスの例（単一の GPU で実行） | システム名 | 原子の数 | シリーズ | 歩幅 | GPUモデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | --- | --- | | JACプロダクション | 23,558 | NVE/NPT | 4fs | RTX4090 | 1638 / 1618 | 小型タンパク質システムは、1600 ns/日を超える最高のパフォーマンスを提供します。 | | 因子IXの産生 | 90,906 | NVE/NPT | 2 fs | RTX4090 | 466 / 433 | PMEコミュニケーション効率を試験するための大型ウォーターボックスタンパク質システム | | セルロース生産 | 408,609 | NVE/NPT | 2 fs | RTX4090 | 129 / 119 | 長距離相互作用と並列分解性能を評価するためのポリマーシステム | | STMV_プロダクション | 1,067,095 | 核不拡散条約 | 4fs | RTX4090 | 78.9 | タバコサテライトウイルスシステム、超大規模並列負荷テスト |
最新の Blackwell B200 GPU では、Amber24 の「Walker」スイートが小規模システムでは A100/H100 を上回り、大規模システムでもリードを維持しています。

Cerutti ベンチマークスイート (最新の最適化されたベンチマーク) 典型的なアーキテクチャとパフォーマンスの例（V100 GPU、Amber 20） | システム名 | 原子の数 | シリーズ | モデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | --- | | DHFR（JAC） | 23,588 | NVE/NPT | デフォルト / ブースト | 934 / 1059 | 小さなタンパク質システム、標準参照点 | | 第IX因子 | 90,906 | NVE/NPT | デフォルト / ブースト | 365 / 406 | 中規模システム、通信とスケーラビリティのバランステスト | | セルロース | 408,609 | NVE/NPT | デフォルト / ブースト | 88.9 / 96.2 | 大規模多糖類システム、GPUメモリおよび帯域幅の圧力シナリオ | | STMV | 1,067,095 | NVE/NPT | デフォルト / ブースト | 30.4 / 33.5 | 百万原子ウイルスシステム、極限並列性能評価 |
Amber 20 では、「リーキーペアリスト」と「ネットフォース補正」の最適化アルゴリズムが導入され、エネルギー保存を維持しながら計算負荷を約 31 TP3T 削減します。

暗黙溶媒（GB）リファレンスキット典型的なアーキテクチャとパフォーマンスの例 (V100 GPU、Amber 20、4 fs) | システム名 | 原子の数 | モデル | パフォーマンス（ns/日） | 説明する | | --- | --- | --- | --- | --- | | Trpケージ | 304 | イギリス | 2801 | ピーク性能が2800 ns/日を超える小型タンパク質折り畳みモデル | | ミオグロビン | 2,492 | イギリス | 1725 | 安定した性能を持つ中型単鎖タンパク質システム | | ヌクレオソーム | 25,095 | イギリス | 48.5 | エネルギー保存性とスループット能力を試験するための大規模クロマチンユニットシステム |
GB モデルは、明示的な溶媒摩擦を除去した後、サンプリングレートを大幅に向上させることができるため、迅速なエネルギー表面探索に適しています。

パフォーマンス比較とスケーラビリティの概要

小規模システム (≤ 30 K 原子): 並列タスクの量が限られているため、パフォーマンスは主に GPU クロック速度とメモリ帯域幅の影響を受けます。
中規模システム (≈ 10 万原子): GPU 使用率のピークに達し、ほとんどの現実世界の生物システムに最適なパフォーマンス範囲を表します。
大規模システム (400 K 原子以上): システムサイズが大きくなるにつれて、通信とメモリのオーバーヘッドが増加し、パフォーマンスが徐々に低下します。
百万原子規模のシステム: Amber 24 は、単一の B200 GPU で 130 ns/日を超えるパフォーマンスを安定的に維持でき、優れた並列スケーラビリティを実証しています。

DRACOクロスドメイン深層研究ベンチマークデータセット

2ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

AIでAIを構築

HyperAI Newsletters

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

Command Palette

Amber_Benchmark 分子動力学パフォーマンス評価データセット

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

AIでAIを構築

HyperAI Newsletters

Command Palette

Amber_Benchmark 分子動力学パフォーマンス評価データセット

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

Amber_Benchmark 分子動力学パフォーマンス評価データセット

データセットの構造

データセットコンテンツの例

パフォーマンス比較とスケーラビリティの概要

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

MCIFマルチモーダルクロスランゲージ指導データセット