Command Palette
Search for a command to run...
NWChem_Benchmark 성능 벤치마크 데이터 세트
NWChem 벤치마크 데이터셋은 고성능 컴퓨팅(HPC) 환경에서 NWChem 양자 화학 및 분자 시뮬레이션 소프트웨어를 위해 특별히 설계된 표준 성능 테스트 시나리오 세트입니다. NWChem 고성능 계산 화학 소프트웨어로 생성된 이 데이터셋은 생체 분자, 나노 구조 및 고체 물질에 대한 양자 및 고전 하이브리드 계산 데이터를 포괄합니다. 기저 상태 및 여기 상태 특성을 포함하고, 가우시안 함수와 평면파 계산 방법을 모두 사용하며, 단일 노드에서 수천 개의 프로세서까지 높은 병렬 확장성을 자랑합니다. 또한 분자 특성 및 상대론적 효과 분석을 지원합니다.
"NWChem: 과거, 현재, 미래"라는 제목의 관련 연구 논문은 2020년에 태평양 북서부 국립 연구소에서 로렌스 버클리 국립 연구소, 국립 계산 과학 센터 및 기타 기관과 협력하여 출판되었습니다.
데이터 세트 구조
이 데이터 세트의 기본 구조는 다음과 같습니다.
- 입력 스크립트 및 출력 결과: 각 벤치마크 시나리오에는 재현 가능한 계산 입력 파일(.nw)과 해당 출력 로그/타이밍 데이터(벽시계, CPU 시간, 속도 향상 포함)가 함께 제공됩니다.
- 병렬 아키텍처: 성능 확장성을 분석하기 위해 다양한 수의 프로세서와 병렬 모드(MPI + OpenMP 또는 순수 MPI)를 갖춘 런타임 구성이 포함됩니다.
- 다양한 화학적 방법: 분자 동역학(MD), 자기 일관성 장(SCF), 밀도 함수 이론(DFT), 2차 섭동 이론(MP2)과 같은 계산 모듈이 포함됩니다.
- 참조 운영 환경 설명: 컴퓨팅에 사용되는 슈퍼컴퓨팅 플랫폼(예: IBM SP2, Cray T3E-900), 노드 수, 코어 수, 실제 사용 시간 등을 지정합니다.
- 이미지와 성능 곡선: 각 장면에는 속도 향상 비율, CPU 시간, 디스크 사용량 등의 측정 항목을 보여주는 성능 그래프(.gif, .jpg)가 함께 제공됩니다.
- 다운로드 및 입력 재생 예시: 모든 벤치마크 작업은 해당 입력 파일(had_md.nw, siosi3.nw, h2o7.nw 등)을 다운로드하여 재생산할 수 있습니다.
데이터 세트 콘텐츠 예시
다음은 몇 가지 일반적인 벤치마크 내용입니다.
- 액체 물 시스템(분자 동역학):
SPC/E 물 모델을 사용하여 5184, 17496, 41472, 82000개의 원자를 갖는 시스템에 대한 분자 동역학 시뮬레이션을 수행하였고, IBM SP2에서 이를 실행하였습니다.
시뮬레이션은 액체 물 시스템의 병렬 확장성을 보여주며, 각 프로세서가 좋은 확장성을 달성하기 위해 약 100개의 원자를 처리해야 함을 보여줍니다.
연구 결과에 따르면, 합리적인 계산 부하를 유지하는 것이 대규모 병렬 컴퓨팅의 효율성을 높이는 데 매우 중요합니다. - Na⁺/K⁺ 크라운 에테르 복합체 자유 에너지 계산:
6382개의 원자를 포함하는 시스템을 IBM SP2와 Cray T3E-900에서 실행하여 수용액과 18-크라운-6 크라운 에테르와의 복합체에서 Na⁺ 및 K⁺ 이온의 상대적 자유 에너지를 계산했습니다.
다중 구성 열역학적 적분(MCTI) 방법을 사용하여 합성 자유 에너지 차이는 약 6 ± 4 kJ/mol로 계산되었으며(다른 계산에서는 5 ± 5 kJ/mol이 나왔습니다), 이는 실험값인 7 kJ/mol과 일치합니다.
결과는 다양한 플랫폼에서 시스템의 런타임 및 병렬 성능을 보여줍니다. - 할로알칸 탈할로게나제 효소 모방:
이 시스템은 41,259개의 원자를 포함하고 있으며 Ewald(PME) 보정과 1.0nm의 차단 반경을 갖춘 AMBER 힘장을 사용합니다.
IBM SP에서 수용액 속 효소의 분자 동역학 시뮬레이션을 수행하였고, 64³ 그리드를 사용하여 장거리 정전기 에너지와 힘 보정을 수행했습니다.
결과는 우수한 병렬 가속 동작을 보여주며 직접 실행할 수 있는 입력 파일(had_md.nw, had.top.gz, had_md.rst.gz)을 제공합니다. - 1,2-디클로로에탄 물방울:
100,369개의 원자를 포함하는 시스템을 사용하여 오염 물질 물방울의 행동을 시뮬레이션했습니다.
Paulsen 클로로알칸 힘장 매개변수와 SPC/E 물 모델을 사용하고 차단 반경이 2.4nm인 이 실험은 각각 IBM SP와 Cray T3E-900에서 실행되었습니다.
시뮬레이션은 다양한 플랫폼에서 1,2-디클로로에탄 물방울의 성능 비교와 확장성을 보여줍니다.
액체 옥탄올:
시뮬레이션 시스템은 216,000개의 원자를 포함하고 있으며, AMBER 힘장과 SPC/E 물 모델을 사용하며, 차단 반경은 2.4nm입니다.
Cray T3E-900에서 실행된 실험에서, 대규모 병렬 조건에서 액체 옥탄올 시스템의 선형 가속도와 우수한 확장성이 입증되었습니다.
- SCF 성능 테스트:
프로세서 노드 수가 증가함에 따라 CPU 속도 향상과 디스크 사용량이 어떻게 달라지는지 살펴보기 위해 IBM SP(150MHz 노드)에서 반직접 분산 데이터 흐름 컴퓨팅(DDSCF)을 수행했습니다.
결과는 디스크 사용량이 사용 가능한 리소스에 비례하여 증가함을 보여주며, 이는 분산 환경에서 SCF 모듈의 확장성을 검증합니다. - DFT 벤치마크(SIOSI3/6/7):
밀도 함수 이론 모듈의 확장성을 평가하기 위해 세 개의 제올라이트 조각 시스템(각각 347, 1687, 3554개의 기저 함수 포함)에 대한 LDA 계산을 수행했습니다.
재현 가능한 실험을 위해 입력 파일(siosi3.nw, siosi6.nw, siosi7.nw)을 제공하며, 계산이 전적으로 메모리(인코어)에서 수행되어야 합니다.
출력 파일에서 키워드 "in-core"를 검색하면 메모리 사용량을 확인할 수 있으며, 계산 결과는 멀티프로세서 병렬 가속이 우수함을 보여줍니다. - MP2 기울기 계산:
(H₂O)₇ 분자와 칼륨 크라운 에테르 시스템에서 MP2 기울기 계산을 수행하여 다양한 수의 프로세서에서 CPU 시간 분포를 분석했습니다.
계산은 IBM SP(120MHz 노드)에서 수행되었으며, 각 부분의 계산 시간 비율을 보여줍니다.
추가적인 성능 테스트를 위해 재현 가능한 입력 파일 h2o7.nw가 제공됩니다.
사용 팁
- 공정한 비교를 위해 성능 비교를 위해 노드/코어 수, 실제 실행 시간, 병렬 구성(MPI×OpenMP)을 기록해 주세요.
- 실행하기 전에 각 벤치마크 시나리오에 해당하는 입력 파일과 README 문서를 참조하여 입력이 일관성 있고 매개변수가 완전한지 확인하세요.
- 벤치마크는 다음 용도로 사용할 수 있습니다.
- 새로운 하드웨어 플랫폼 검증: GPU, 하이브리드 시스템, 가속기 등의 환경에서 NWChem 성능 평가.
- 병렬 최적화 평가: 다양한 컴파일 옵션, MPI 통신 모델 및 메모리 스케줄링이 성능에 미치는 영향.
- 소프트웨어 비교 연구: 유사한 시스템에서 다른 양자화학 프로그램(예: Gaussian, CP2K, ORCA)과의 성능 비교.