Command Palette

Search for a command to run...

NWChem_Benchmark パフォーマンスベンチマークデータセット

日付

3日前

公開URL

github.com

ライセンス

その他

NWChemベンチマークデータセットは、高性能コンピューティング(HPC)環境におけるNWChem量子化学および分子シミュレーションソフトウェア向けに特別に設計された標準的なパフォーマンステストシナリオのセットです。NWChem高性能計算化学ソフトウェアによって生成されたこのデータセットは、生体分子、ナノ構造、固体材料の量子および古典ハイブリッド計算データをカバーしています。基底状態および励起状態の特性を含み、ガウス関数と平面波の両方の計算手法を採用し、単一ノードから数千プロセッサまでの高い並列スケーラビリティを誇ります。また、分子特性と相対論的効果の解析もサポートしています。

「NWChem:過去、現在、そして未来」と題された関連研究論文は、パシフィック・ノースウエスト国立研究所がローレンス・バークレー国立研究所、国立計算科学センター、その他の機関と共同で2020年に発表しました。

データセットの構造

このデータセットの基本構造は次のとおりです。

  • 入力スクリプトと出力結果: 各ベンチマーク シナリオには、再現可能な計算入力ファイル (.nw) と対応する出力ログ/タイミング データ (ウォール クロック、CPU 時間、スピードアップを含む) が付属しています。
  • 並列アーキテクチャ: パフォーマンスのスケーラビリティを分析するための、プロセッサ数と並列モード (MPI + OpenMP または純粋な MPI) が異なるランタイム構成が含まれています。
  • 複数の化学的方法: 分子動力学 (MD)、自己無撞着場 (SCF)、密度汎関数理論 (DFT)、および 2 次摂動論 (MP2) などの計算モジュールが含まれます。
  • 参照オペレーティング環境の説明: コンピューティングに使用するスーパーコンピューティング プラットフォーム (IBM SP2、Cray T3E-900 など)、ノード数、コア数、ウォールタイムなどを指定します。
  • 画像とパフォーマンス曲線: 各シーンには、高速化率、CPU 時間、ディスク使用量などのメトリックを示すパフォーマンス グラフ (.gif、.jpg) が付属しています。
  • ダウンロードと入力再現例: 対応する入力ファイル (had_md.nw、siosi3.nw、h2o7.nw など) をダウンロードすることで、すべてのベンチマーク タスクを再現できます。

データセットコンテンツの例

以下に代表的なベンチマーク内容を示します。

  • 液体水システム(分子動力学)
    分子動力学シミュレーションは、カットオフ半径 1.8 nm の SPC/E 水モデルを使用して、5184、17496、41472、および 82000 個の原子を持つシステムで実行され、IBM SP2 で実行されました。
    シミュレーションは液体水システムの並列スケーラビリティを示し、良好なスケーラビリティを実現するには各プロセッサが約 100 個の原子を処理する必要があることを示しています。
    結果は、大規模な並列コンピューティングの効率を上げるには、適切な計算負荷を維持することが重要であることを示しています。
  • Na⁺/K⁺クラウンエーテル錯体の自由エネルギー計算:
    6382 個の原子を含むシステムを IBM SP2 および Cray T3E-900 で実行し、水溶液中および 18-クラウン-6 クラウンエーテルとの複合状態における Na⁺ イオンと K⁺ イオンの相対自由エネルギーを計算しました。
    複合自由エネルギー差は、多構成熱力学積分法 (MCTI) を使用して約 6 ± 4 kJ/mol と計算され (別の計算では 5 ± 5 kJ/mol となり、実験値の 7 kJ/mol と一致しました。
    結果は、さまざまなプラットフォーム上のシステムの実行時間と並列パフォーマンスを示しています。
  • ハロアルカン脱ハロゲン化酵素の模倣:
    システムには 41,259 個の原子が含まれており、Ewald (PME) 補正と 1.0 nm のカットオフ半径を備えた AMBER 力場を採用しています。
    水溶液中の酵素の分子動力学シミュレーションは IBM SP 上で実行され、64³ グリッドを使用して長距離静電エネルギーと力の補正が実行されました。
    結果は、良好な並列加速動作を示しており、直接実行できる入力ファイル (had_md.nw、had.top.gz、had_md.rst.gz) が提供されています。
  • 1,2-ジクロロエタンの液滴:
    100,369 個の原子を含むシステムを使用して、汚染物質の液滴の挙動をシミュレートしました。
    ポールセンクロロアルカン力場パラメータとカットオフ半径 2.4 nm の SPC/E 水モデルを使用して、実験はそれぞれ IBM SP と Cray T3E-900 で実行されました。
    シミュレーションでは、さまざまなプラットフォーム上の 1,2-ジクロロエタン液滴のパフォーマンス比較とスケーラビリティを示します。

液体オクタノール:
シミュレーション システムには 216,000 個の原子が含まれており、AMBER 力場と SPC/E 水モデルを採用しており、カットオフ半径は 2.4 nm です。
Cray T3E-900 上で実行し、大規模並列条件下での液体オクタノール システムの線形加速と優れたスケーラビリティが実証されました。

  • SCFパフォーマンステスト:
    プロセッサ ノードの数が増えると CPU の速度とディスク使用量がどのように増加するかを調べるために、IBM SP (150 MHz ノード) で半直接分散データ フロー コンピューティング (DDSCF) を実行しました。
    結果は、ディスク使用量が利用可能なリソースに比例して増加することを示しており、分散環境における SCF モジュールのスケーラビリティを検証しています。
  • DFTベンチマーク(SIOSI3/6/7):
    密度汎関数理論モジュールのスケーラビリティを評価するために、3 つのゼオライトフラグメント システム (それぞれ 347、1687、および 3554 の基底関数を含む) に対して LDA 計算が実行されました。
    再現可能な実験のために、計算を完全にメモリ内 (インコア) で実行する必要がある入力ファイル (siosi3.nw、siosi6.nw、siosi7.nw) を提供します。
    出力ファイルでキーワード「in-core」を検索することでメモリ使用量を確認でき、計算結果は良好なマルチプロセッサ並列加速を示しています。
  • MP2勾配計算:
    異なるプロセッサ数での CPU 時間の分布を解析するために、(H₂O)₇ 分子とカリウムクラウンエーテル系に対して MP2 勾配計算が実行されました。
    計算は IBM SP (120 MHz ノード) で実行され、各部分の計算時間の割合が示されています。
    さらなるパフォーマンス テスト用に、再現可能な入力ファイル h2o7.nw が提供されています。

使用上のヒント

  • パフォーマンスを比較する場合は、公平な比較を確実にするために、ノード/コアの数、ウォールタイム、並列構成 (MPI×OpenMP) を記録してください。
  • 実行する前に、各ベンチマーク シナリオに対応する入力ファイルと README ドキュメントを参照して、入力が一貫しており、パラメーターが完全であることを確認してください。
  • ベンチマークは次の用途に使用できます。
  • 新しいハードウェア プラットフォームの検証: GPU、ハイブリッド システム、アクセラレータなどの環境での NWChem パフォーマンス評価。
  • 並列最適化の評価: さまざまなコンパイル オプション、MPI 通信モデル、およびメモリ スケジューリングのパフォーマンスへの影響。
  • ソフトウェアの比較研究: 同様のシステムにおける他の量子化学プログラム (Gaussian、CP2K、ORCA など) とのパフォーマンス比較。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています