Command Palette
Search for a command to run...
Ensemble De Données d'évaluation Des Performances De Dynamique Moléculaire Amber_Benchmark
Amber signifie « Construction de modèles assistée avec raffinement énergétique ».
Le jeu de données Amber Benchmark est un ensemble de données d'entrée et de fichiers de configuration conçus spécifiquement pour les environnements de calcul haute performance (HPC). Il sert à tester et à comparer l'efficacité et l'évolutivité du programme Amber Molecular Dynamics sur diverses architectures matérielles et parallèles.
Contrairement aux données expérimentales scientifiques ou aux résultats de simulation, cet ensemble de données contient des packages d'entrée et de configuration standardisés permettant de mesurer les performances de calcul (vitesse, évolutivité et efficacité) d'un système, et non des résultats de simulation destinés à l'analyse scientifique. Tous les benchmarks (tels que DHFR, Facteur IX, Cellulose, STMV, etc.) sont fournis avec des fichiers d'entrée standardisés et des résultats de performance de référence, qui peuvent être exécutés directement et à plusieurs reprises sur différentes plateformes GPU ou CPU afin de vérifier les performances.
Les résultats pertinents de l'article sontDéveloppements récents dans les simulations biomoléculaires d'AmberL'ensemble de données, intitulé "...", a été publié en 2025 par David A. Case et al. La version actuelle de cet ensemble de données est "...".Amber24 : Informations sur les performances de pmemd.cuda".
Structure du jeu de données
Amber propose deux suites de benchmarks complémentaires :
- Kit de base Walker
- Créé par le Dr Ross C. Walker, il s'agissait de l'un des premiers benchmarks d'évaluation des performances pour le module GPU Amber (pmemd.cuda).
- Depuis 2010, il a couvert de multiples versions et architectures GPU (Fermi → Ampere → Hopper → Blackwell).
- Il comprend plusieurs architectures représentatives (JAC, Factor IX, Cellulose, STMV, etc.) pour comparer la vitesse d'exécution (ns/jour) de différents GPU.
- Kit de référence Cerutti
- Conçu par le Dr Dave Cerutti, il utilise des paramètres de simulation modernes et réalistes (Amber 18–20–24).
- Il comprend quatre systèmes périodiques : DHFR, facteur IX, cellulose et STMV (23K–1,1M atomes).
- Prend en charge les ensembles NVE/NPT avec un pas de temps de 4 fs et un rayon de coupure de 9 Å.
- Il offre deux modes de fonctionnement : « Par défaut » et « Boost », ce dernier améliorant les performances d'environ 10%.
En outre, l'ensemble de données comprend également des systèmes de référence à solvant implicite (GB), tels que Trp Cage, Myoglobine et Nucleosome, pour l'évaluation des performances de simulation non périodique.
Exemple de contenu d'un jeu de données
- Kit de test Walker (test GPU traditionnel)
Exemples typiques d'architecture et de performances (fonctionnant sur un seul GPU)
| Nom du système | nombre d'atomes | Série | longueur de pas | Modèle GPU | Performance (ns/jour) | illustrer |
|---|---|---|---|---|---|---|
| Production JAC | 23,558 | NVE/NPT | 4 fs | RTX 4090 | 1638 / 1618 | Les systèmes à petites protéines offrent les performances les plus élevées, dépassant 1600 ns/jour. |
| Production du facteur IX | 90,906 | NVE/NPT | 2 fs | RTX 4090 | 466 / 433 | Système protéique à grande échelle en milieu aqueux pour tester l'efficacité de la communication PME |
| Production de cellulose | 408,609 | NVE/NPT | 2 fs | RTX 4090 | 129 / 119 | Systèmes polymères pour l'évaluation des interactions à longue portée et des performances de décomposition parallèle |
| Production STMV | 1,067,095 | NPT | 4 fs | RTX 4090 | 78.9 | Système de virus satellite du tabac, tests de charge parallèle à très grande échelle |
- Sur les GPU Blackwell B200 les plus récents, la suite « Walker » d'Amber24 surpasse les A100/H100 dans les petits systèmes et conserve son avance dans les grands systèmes.
- Suite logicielle d'analyse comparative Cerutti (Analyse comparative optimisée moderne)
Exemples typiques d'architecture et de performances (GPU V100, Amber 20)
| Nom du système | nombre d'atomes | Série | modèle | Performance (ns/jour) | illustrer |
|---|---|---|---|---|---|
| DHFR (JAC) | 23,588 | NVE/NPT | Par défaut / Boost | 934 / 1059 | Systèmes protéiques de petite taille, points de référence standard |
| Facteur IX | 90,906 | NVE/NPT | Par défaut / Boost | 365 / 406 | Système de taille moyenne, test d'équilibre entre communication et évolutivité |
| Cellulose | 408,609 | NVE/NPT | Par défaut / Boost | 88.9 / 96.2 | Systèmes polysaccharidiques à grande échelle, scénarios de pression sur la mémoire GPU et la bande passante |
| STMV | 1,067,095 | NVE/NPT | Par défaut / Boost | 30.4 / 33.5 | Système de virus à un million d'atomes, évaluation des performances parallèles extrêmes |
- Amber 20 introduit les algorithmes d'optimisation « liste de paires fuyantes » et « correction de force nette », qui réduisent la charge de calcul d'environ 31 TP3T tout en maintenant la conservation de l'énergie.
- Kit de référence pour solvants implicites (GB)
Exemple typique d'architecture et de performances (GPU V100, Amber 20, 4 fs)
| Nom du système | nombre d'atomes | Modèle | Performance (ns/jour) | illustrer |
|---|---|---|---|---|
| Cage à trp | 304 | GB | 2801 | Un petit modèle de repliement de protéines avec une performance de pointe de >2800 ns/jour |
| Myoglobine | 2,492 | GB | 1725 | Système protéique monocaténaire de taille moyenne aux performances stables |
| Nucléosome | 25,095 | GB | 48.5 | Système à grande échelle d'unités de chromatine pour tester la conservation de l'énergie et la capacité de débit |
- Le modèle GB peut améliorer considérablement le taux d'échantillonnage après suppression du frottement explicite du solvant, ce qui le rend adapté à l'exploration rapide des surfaces énergétiques.
Comparaison des performances et aperçu de l'évolutivité
- Systèmes de petite taille (≤ 30 K atomes) : les performances sont principalement affectées par la fréquence d'horloge du GPU et la bande passante de la mémoire en raison du nombre limité de tâches parallèles.
- Systèmes de taille moyenne (≈ 100 K atomes) : atteignent une utilisation maximale du GPU, représentant la plage de performances optimale pour la plupart des systèmes biologiques du monde réel.
- Systèmes de grande taille (≥ 400 K atomes) : la surcharge de communication et de mémoire augmente et les performances diminuent progressivement à mesure que la taille du système augmente.
- Système à l'échelle du million d'atomes : Amber 24 peut maintenir de manière stable une performance de >130 ns/jour sur un seul GPU B200, démontrant une bonne évolutivité parallèle.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.