Command Palette
Search for a command to run...
NWChem_Benchmark パフォーマンスベンチマークデータセット
NWChemベンチマークデータセットは、高性能コンピューティング(HPC)環境におけるNWChem量子化学および分子シミュレーションソフトウェア向けに特別に設計された標準的なパフォーマンステストシナリオのセットです。NWChem高性能計算化学ソフトウェアによって生成されたこのデータセットは、生体分子、ナノ構造、固体材料の量子および古典ハイブリッド計算データをカバーしています。基底状態および励起状態の特性を含み、ガウス関数と平面波の両方の計算手法を採用し、単一ノードから数千プロセッサまでの高い並列スケーラビリティを誇ります。また、分子特性と相対論的効果の解析もサポートしています。
「NWChem:過去、現在、そして未来」と題された関連研究論文は、パシフィック・ノースウエスト国立研究所がローレンス・バークレー国立研究所、国立計算科学センター、その他の機関と共同で2020年に発表しました。
データセットの構造
このデータセットの基本構造は次のとおりです。
- 入力スクリプトと出力結果: 各ベンチマーク シナリオには、再現可能な計算入力ファイル (.nw) と対応する出力ログ/タイミング データ (ウォール クロック、CPU 時間、スピードアップを含む) が付属しています。
- 並列アーキテクチャ: パフォーマンスのスケーラビリティを分析するための、プロセッサ数と並列モード (MPI + OpenMP または純粋な MPI) が異なるランタイム構成が含まれています。
- 複数の化学的方法: 分子動力学 (MD)、自己無撞着場 (SCF)、密度汎関数理論 (DFT)、および 2 次摂動論 (MP2) などの計算モジュールが含まれます。
- 参照オペレーティング環境の説明: コンピューティングに使用するスーパーコンピューティング プラットフォーム (IBM SP2、Cray T3E-900 など)、ノード数、コア数、ウォールタイムなどを指定します。
- 画像とパフォーマンス曲線: 各シーンには、高速化率、CPU 時間、ディスク使用量などのメトリックを示すパフォーマンス グラフ (.gif、.jpg) が付属しています。
- ダウンロードと入力再現例: 対応する入力ファイル (had_md.nw、siosi3.nw、h2o7.nw など) をダウンロードすることで、すべてのベンチマーク タスクを再現できます。
データセットコンテンツの例
以下に代表的なベンチマーク内容を示します。
- 液体水システム(分子動力学)
分子動力学シミュレーションは、カットオフ半径 1.8 nm の SPC/E 水モデルを使用して、5184、17496、41472、および 82000 個の原子を持つシステムで実行され、IBM SP2 で実行されました。
シミュレーションは液体水システムの並列スケーラビリティを示し、良好なスケーラビリティを実現するには各プロセッサが約 100 個の原子を処理する必要があることを示しています。
結果は、大規模な並列コンピューティングの効率を上げるには、適切な計算負荷を維持することが重要であることを示しています。 - Na⁺/K⁺クラウンエーテル錯体の自由エネルギー計算:
6382 個の原子を含むシステムを IBM SP2 および Cray T3E-900 で実行し、水溶液中および 18-クラウン-6 クラウンエーテルとの複合状態における Na⁺ イオンと K⁺ イオンの相対自由エネルギーを計算しました。
複合自由エネルギー差は、多構成熱力学積分法 (MCTI) を使用して約 6 ± 4 kJ/mol と計算され (別の計算では 5 ± 5 kJ/mol となり、実験値の 7 kJ/mol と一致しました。
結果は、さまざまなプラットフォーム上のシステムの実行時間と並列パフォーマンスを示しています。 - ハロアルカン脱ハロゲン化酵素の模倣:
システムには 41,259 個の原子が含まれており、Ewald (PME) 補正と 1.0 nm のカットオフ半径を備えた AMBER 力場を採用しています。
水溶液中の酵素の分子動力学シミュレーションは IBM SP 上で実行され、64³ グリッドを使用して長距離静電エネルギーと力の補正が実行されました。
結果は、良好な並列加速動作を示しており、直接実行できる入力ファイル (had_md.nw、had.top.gz、had_md.rst.gz) が提供されています。 - 1,2-ジクロロエタンの液滴:
100,369 個の原子を含むシステムを使用して、汚染物質の液滴の挙動をシミュレートしました。
ポールセンクロロアルカン力場パラメータとカットオフ半径 2.4 nm の SPC/E 水モデルを使用して、実験はそれぞれ IBM SP と Cray T3E-900 で実行されました。
シミュレーションでは、さまざまなプラットフォーム上の 1,2-ジクロロエタン液滴のパフォーマンス比較とスケーラビリティを示します。
液体オクタノール:
シミュレーション システムには 216,000 個の原子が含まれており、AMBER 力場と SPC/E 水モデルを採用しており、カットオフ半径は 2.4 nm です。
Cray T3E-900 上で実行し、大規模並列条件下での液体オクタノール システムの線形加速と優れたスケーラビリティが実証されました。
- SCFパフォーマンステスト:
プロセッサ ノードの数が増えると CPU の速度とディスク使用量がどのように増加するかを調べるために、IBM SP (150 MHz ノード) で半直接分散データ フロー コンピューティング (DDSCF) を実行しました。
結果は、ディスク使用量が利用可能なリソースに比例して増加することを示しており、分散環境における SCF モジュールのスケーラビリティを検証しています。 - DFTベンチマーク(SIOSI3/6/7):
密度汎関数理論モジュールのスケーラビリティを評価するために、3 つのゼオライトフラグメント システム (それぞれ 347、1687、および 3554 の基底関数を含む) に対して LDA 計算が実行されました。
再現可能な実験のために、計算を完全にメモリ内 (インコア) で実行する必要がある入力ファイル (siosi3.nw、siosi6.nw、siosi7.nw) を提供します。
出力ファイルでキーワード「in-core」を検索することでメモリ使用量を確認でき、計算結果は良好なマルチプロセッサ並列加速を示しています。 - MP2勾配計算:
異なるプロセッサ数での CPU 時間の分布を解析するために、(H₂O)₇ 分子とカリウムクラウンエーテル系に対して MP2 勾配計算が実行されました。
計算は IBM SP (120 MHz ノード) で実行され、各部分の計算時間の割合が示されています。
さらなるパフォーマンス テスト用に、再現可能な入力ファイル h2o7.nw が提供されています。
使用上のヒント
- パフォーマンスを比較する場合は、公平な比較を確実にするために、ノード/コアの数、ウォールタイム、並列構成 (MPI×OpenMP) を記録してください。
- 実行する前に、各ベンチマーク シナリオに対応する入力ファイルと README ドキュメントを参照して、入力が一貫しており、パラメーターが完全であることを確認してください。
- ベンチマークは次の用途に使用できます。
- 新しいハードウェア プラットフォームの検証: GPU、ハイブリッド システム、アクセラレータなどの環境での NWChem パフォーマンス評価。
- 並列最適化の評価: さまざまなコンパイル オプション、MPI 通信モデル、およびメモリ スケジューリングのパフォーマンスへの影響。
- ソフトウェアの比較研究: 同様のシステムにおける他の量子化学プログラム (Gaussian、CP2K、ORCA など) とのパフォーマンス比較。