Command Palette
Search for a command to run...
NWChem_Benchmark 性能基准测试数据集
NWChem 基准测试数据集是一组专门为高性能计算(HPC)环境下量子化学与分子模拟软件 NWChem 提供的标准性能测试场景。本数据集基于 NWChem 高性能计算化学软件生成,涵盖生物分子、纳米结构与固态材料的量子及经典混合计算数据,包含基态与激发态性质,采用高斯基函数与平面波两种计算方法,具备从单节点到数千处理器的高并行扩展能力,并支持分子性质与相对论效应的分析。
相关论文成果为「NWChem: Past, present, and future」,由美国西北太平洋国家实验室联合美国劳伦斯伯克利国家实验室、 National Center for Computational Sciences 等机构于 2020 年发布。
数据集结构
该数据集基本结构包括:
- 输入脚本与输出结果: 每个基准场景都附有可复现的计算输入文件(.nw)与相应的输出日志/计时数据(含 wall clock 、 CPU 时间、加速比)。
- 并行体系: 包含不同处理器数量、并行方式(MPI + OpenMP 或纯 MPI)的运行配置,用于分析性能扩展性。
- 多种化学方法: 涉及分子动力学 (MD) 、自洽场 (SCF) 、密度泛函理论 (DFT) 、二阶微扰理论 (MP2) 等计算模块。
- 参考运行环境说明: 指出计算所用超算平台(如 IBM SP2 、 Cray T3E-900)、节点数、核心数、墙时 (wall-time) 等。
- 图像与性能曲线: 每个场景附带性能图 (.gif, .jpg),展示加速比、 CPU 时间、磁盘占用等指标。
- 下载与输入复现实例: 所有 benchmark 任务均可通过下载相应输入文件重现实验(如 had_md.nw, siosi3.nw, h2o7.nw 等)。
数据集内容示例
以下为部分典型基准内容:
- 液态水体系 (Molecular Dynamics):
对 5184 、 17496 、 41472 与 82000 个原子体系进行了分子动力学模拟,采用 SPC/E 水模型与 1.8 nm 截断半径,在 IBM SP2 上运行。
模拟展示了液态水体系的并行扩展性,表明要获得良好的可扩展性,每个处理器需承担约 100 个原子。
结果反映出在大规模并行计算中维持合理的计算负载对效率至关重要。 - Na⁺/K⁺ 冠醚复合物自由能计算:
含 6382 个原子的体系在 IBM SP2 与 Cray T3E-900 上运行,用于计算 Na⁺ 与 K⁺ 离子在水溶液及其与 18-crown-6 冠醚复合状态下的相对自由能。
采用多组态热力学积分(MCTI)方法计算得到复合自由能差约 6 ± 4 kJ/mol(另一计算为 5 ± 5 kJ/mol),与实验值 7 kJ/mol 一致。
结果展示了该体系在不同平台上的运行时间与并行性能表现。 - Haloalkane Dehalogenase 酶模拟:
系统包含 41,259 个原子,采用 AMBER 力场与粒子网格 Ewald (PME) 修正,截断半径 1.0 nm 。
在 IBM SP 上进行了该酶在水溶液中的分子动力学模拟,计算中使用 64³ 网格进行长程静电能与力修正。
结果显示良好的并行加速行为,并提供了可直接运行的输入文件(had_md.nw 、 had.top.gz 、 had_md.rst.gz)。 - 1,2-二氯乙烷液滴:
含 100,369 个原子的体系,用于模拟污染物液滴行为。
采用 Paulsen 氯代烷力场参数与 SPC/E 水模型,截断半径 2.4 nm,分别在 IBM SP 与 Cray T3E-900 上运行。
模拟展示了 1,2-二氯乙烷液滴在不同平台下的性能比较与扩展性。
液态辛醇 (Octanol):
模拟体系含 216,000 个原子,采用 AMBER 力场与 SPC/E 水模型,截断半径 2.4 nm 。
在 Cray T3E-900 上运行,展示了液态辛醇体系在大规模并行条件下的线性加速性与良好扩展性。
- SCF 性能测试:
在 IBM SP(150 MHz 节点)上进行了半直接分布式数据 SCF (DDSCF) 计算,考察随处理器节点数增加时的 CPU 加速比与磁盘使用情况。
结果表明,磁盘占用与可用资源成正比增长,验证了 SCF 模块在分布式环境下的扩展性能。 - DFT 基准 (SIOSI3/6/7):
对三个沸石片段体系(分别含 347 、 1687 和 3554 个基组函数)进行了 LDA 计算,以评估密度泛函理论模块的扩展性。
提供可复现实验的输入文件(siosi3.nw 、 siosi6.nw 、 siosi7.nw),要求计算完全在内存中执行(in-core)。
在输出文件中可通过搜索 “in-core” 关键字验证内存占用情况,计算结果显示良好的多处理器并行加速。 - MP2 梯度计算:
针对 (H₂O)₇ 分子与钾冠醚体系进行了 MP2 梯度计算,分析不同处理器数量下的 CPU 时间分布。
计算在 IBM SP(120 MHz 节点)上完成,展示了各部分计算时间的比例关系。
提供可复现输入文件 h2o7.nw,用于进一步性能测试。
使用提示
- 若用于性能对比,请记录节点/核心数、墙时 (wall-time) 、并行配置 (MPI×OpenMP),以保证公平比较。
- 在运行前请参考每个基准场景对应的输入文件与 README 文档,以确保输入一致、参数完整。
- 基准可用于:
- 新硬件平台验证:GPU 、混合体系、加速器等环境下的 NWChem 性能测评。
- 并行优化评估:不同编译选项、 MPI 通信模型、内存调度的性能影响。
- 软件对比研究:与其他量子化学程序(如 Gaussian 、 CP2K 、 ORCA)在相似体系上的性能对比。