Command Palette

Search for a command to run...

Amber_Benchmark 분자 동역학 성능 평가 데이터 세트

날짜

3일 전

발행 주소

ambermd.org

Discord 커뮤니티 참여

앰버는 에너지 개선을 통한 지원 모델 구축을 의미합니다.

Amber Benchmark 데이터 세트는 고성능 컴퓨팅(HPC) 환경을 위해 특별히 설계된 성능 벤치마크 입력 및 구성 파일의 모음입니다. 다양한 하드웨어 및 병렬 아키텍처에서 Amber Molecular Dynamics 프로그램의 효율성과 확장성을 테스트하고 비교하는 데 사용됩니다.

과학적 실험 데이터나 시뮬레이션 결과와 달리, 이 데이터셋은 과학적 분석을 위한 시뮬레이션 출력이 아닌, 시스템의 계산 성능(속도, 확장성 및 효율성)을 측정하는 데 사용되는 표준화된 입력 및 구성 패키지를 포함합니다. 모든 벤치마크(예: DHFR, Factor IX, Cellulose, STMV 등)에는 표준화된 입력 파일과 참조 성능 결과가 포함되어 있으며, 이를 다양한 GPU 또는 CPU 플랫폼에서 직접 반복적으로 실행하여 성능을 검증할 수 있습니다.

관련 논문 결과는 다음과 같습니다.Amber 생체 분자 시뮬레이션의 최근 개발"..."이라는 제목의 이 데이터 세트는 David A. Case 외 연구진에 의해 2025년에 공개되었습니다. 이 데이터 세트의 현재 버전은 "..."입니다.Amber24: pmemd.cuda 성능 정보".

데이터 세트 구조

Amber는 두 가지 상호 보완적인 벤치마크 제품군을 제공합니다.

  • 워커 베이스라인 키트
  • Ross C. Walker 박사가 만든 이 벤치마크는 Amber GPU 모듈(pmemd.cuda)을 위한 가장 초기의 성능 평가 벤치마크 중 하나였습니다.
  • 2010년 이후로 여러 버전과 GPU 아키텍처(Fermi → Ampere → Hopper → Blackwell)가 포함되었습니다.
  • 여기에는 여러 대표적인 아키텍처(JAC, Factor IX, Cellulose, STMV 등)가 포함되어 있어 다양한 GPU의 실행 속도(ns/day)를 비교합니다.
  • Cerutti 벤치마크 키트
  • 데이브 세루티 박사가 설계한 이 게임은 현대적이고 현실적인 시뮬레이션 설정(앰버 18~20~24)을 사용합니다.
  • 여기에는 DHFR, Factor IX, Cellulose, STMV(23K–1.1M 원자)의 4가지 주기적 시스템이 포함됩니다.
  • 4fs의 시간 단계와 9Å의 차단 반경을 갖춘 NVE/NPT 앙상블을 지원합니다.
  • 이 제품은 "기본"과 "부스트"의 두 가지 작동 모드를 제공하는데, "부스트"는 성능을 약 10%까지 향상시킵니다.

또한, 데이터 세트에는 비주기적 시뮬레이션 성능 평가를 위한 Trp Cage, Myoglobin, Nucleosome과 같은 암묵적 용매(GB) 벤치마크 시스템도 포함되어 있습니다.

데이터 세트 콘텐츠 예시

  • Walker 벤치마크 키트(기존 GPU 벤치마크)

일반적인 아키텍처 및 성능 예(단일 GPU에서 실행)

시스템 이름원자의 수시리즈걸음 길이GPU 모델성능(ns/일)설명하다
JAC_생산23,558NVE/NPT4초RTX 40901638 / 1618소형 단백질 시스템은 1600ns/일을 초과하는 가장 높은 성능을 제공합니다.
요인 IX_생산90,906NVE/NPT2fsRTX 4090466 / 433PME 통신 효율성 테스트를 위한 대형 워터박스 단백질 시스템
셀룰로오스 생산408,609NVE/NPT2fsRTX 4090129 / 119장거리 상호작용 및 병렬 분해 성능을 평가하기 위한 폴리머 시스템
STMV_제작1,067,095핵무기금지조약(NPT)4초RTX 409078.9담배 위성 바이러스 시스템, 초대형 병렬 부하 테스트
  • 최신 Blackwell B200 GPU에서 Amber24의 "Walker" 제품군은 소형 시스템에서 A100/H100보다 우수한 성능을 보이며, 대형 시스템에서도 선두를 유지하고 있습니다.

  • Cerutti Benchmarking Suite(최신 최적화 벤치마킹)

일반적인 아키텍처 및 성능 예(V100 GPU, Amber 20)

시스템 이름원자의 수시리즈모델성능(ns/일)설명하다
DHFR(JAC)23,588NVE/NPT기본 / 부스트934 / 1059소형 단백질 시스템, 표준 기준점
인자 IX90,906NVE/NPT기본 / 부스트365 / 406중형 시스템, 통신 및 확장성 균형 테스트
셀룰로오스408,609NVE/NPT기본 / 부스트88.9 / 96.2대규모 폴리사카라이드 시스템, GPU 메모리 및 대역폭 압력 시나리오
STMV1,067,095NVE/NPT기본 / 부스트30.4 / 33.5백만 원자 바이러스 시스템, 극한 병렬 성능 평가
  • Amber 20은 에너지 보존을 유지하면서 계산 부담을 약 31 TP3T만큼 줄이는 "누출 쌍 목록" 및 "순 힘 보정" 최적화 알고리즘을 소개합니다.

  • 암묵적 용매(GB) 참조 키트

일반적인 아키텍처 및 성능 예(V100 GPU, Amber 20, 4fs)

시스템 이름원자의 수모델성능(ns/일)설명하다
Trp 케이지304영국2801최대 성능이 2800ns/일 이상인 소형 단백질 접힘 모델
미오글로빈2,492영국1725안정적인 성능을 갖춘 중형 단일 사슬 단백질 시스템
뉴클레오솜25,095영국48.5에너지 보존 및 처리량 용량 테스트를 위한 대형 크로마틴 단위 시스템
  • GB 모델은 명시적인 용매 마찰을 제거한 후 샘플링 속도를 크게 개선할 수 있어 빠른 에너지 표면 탐사에 적합합니다.

성능 비교 및 확장성 개요

  • 소규모 시스템(≤ 30 K 원자): 병렬 작업의 양이 제한적이기 때문에 성능은 주로 GPU 클럭 속도와 메모리 대역폭의 영향을 받습니다.
  • 중간 규모의 시스템(≈ 100 K 원자): 대부분의 실제 생물학적 시스템에 적합한 최적의 성능 범위를 나타내는 최대 GPU 활용도에 도달합니다.
  • 대형 시스템(≥ 400 K 원자): 통신 및 메모리 오버헤드가 증가하고, 시스템 크기가 커질수록 성능이 점차 감소합니다.
  • 백만 개 원자 규모의 시스템: Amber 24는 단일 B200 GPU에서 130ns/일 이상의 성능을 안정적으로 유지하여 우수한 병렬 확장성을 보여줍니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp