Command Palette
Search for a command to run...
Ensemble De Données De Référence De Performance NWChem_Benchmark
Le jeu de données de référence NWChem est un ensemble de scénarios de tests de performance standard conçus spécifiquement pour le logiciel de chimie quantique et de simulation moléculaire NWChem dans des environnements de calcul haute performance (HPC). Généré par le logiciel de chimie computationnelle haute performance NWChem, ce jeu de données couvre des données de calcul hybrides quantiques et classiques pour les biomolécules, les nanostructures et les matériaux solides. Il inclut les propriétés des états fondamentaux et excités, utilise des méthodes de calcul par fonctions gaussiennes et par ondes planes, et offre une scalabilité parallèle élevée, d'un seul nœud à des milliers de processeurs. Il permet également l'analyse des propriétés moléculaires et des effets relativistes.
L’article de recherche pertinent, intitulé « NWChem : passé, présent et futur », a été publié en 2020 par le Pacific Northwest National Laboratory en collaboration avec le Lawrence Berkeley National Laboratory, le National Center for Computational Sciences et d’autres institutions.
Structure du jeu de données
La structure de base de cet ensemble de données comprend :
- Scripts d'entrée et résultats de sortie : Chaque scénario de test est accompagné d'un fichier d'entrée de calcul reproductible (.nw) et de journaux de sortie/données de chronométrage correspondants (y compris l'horloge système, le temps CPU et l'accélération).
- Architecture parallèle : Inclut des configurations d’exécution avec différents nombres de processeurs et modes parallèles (MPI + OpenMP ou MPI pur) pour analyser l’évolutivité des performances.
- Méthodes chimiques multiples : Implique des modules de calcul tels que la dynamique moléculaire (MD), le champ auto-cohérent (SCF), la théorie fonctionnelle de la densité (DFT) et la théorie des perturbations du second ordre (MP2).
- Description de l'environnement d'exploitation de référence : Spécifiez la plateforme de supercalcul utilisée pour le calcul (telle que IBM SP2, Cray T3E-900), le nombre de nœuds, le nombre de cœurs, le temps d'exécution, etc.
- Images et courbes de performance : Chaque scène est accompagnée d’un graphique de performance (.gif, .jpg) affichant des indicateurs tels que le taux d’accélération, le temps CPU et l’utilisation du disque.
- Téléchargement et exemples de reproduction : Toutes les tâches de référence peuvent être reproduites en téléchargeant les fichiers d’entrée correspondants (tels que had_md.nw, siosi3.nw, h2o7.nw, etc.).
Exemple de contenu d'un jeu de données
Voici quelques exemples de contenus de référence typiques :
- Systèmes d'eau liquide (Dynamique moléculaire) :
Des simulations de dynamique moléculaire ont été réalisées sur des systèmes comportant 5184, 17496, 41472 et 82000 atomes, en utilisant le modèle d'eau SPC/E avec un rayon de coupure de 1,8 nm, et exécutées sur un IBM SP2.
La simulation démontre l'évolutivité parallèle du système d'eau liquide, montrant que chaque processeur doit traiter environ 100 atomes pour obtenir une bonne évolutivité.
Les résultats montrent que le maintien d'une charge de calcul raisonnable est crucial pour l'efficacité du calcul massivement parallèle. - Calcul de l'énergie libre du complexe éther couronne Na⁺/K⁺ :
Le système contenant 6382 atomes a été exécuté sur IBM SP2 et Cray T3E-900 pour calculer les énergies libres relatives des ions Na⁺ et K⁺ en solution aqueuse et dans leur complexe avec l'éther couronne 18-couronne-6.
La différence d'énergie libre composite a été calculée à environ 6 ± 4 kJ/mol en utilisant la méthode d'intégration thermodynamique multiconfigurationnelle (MCTI) (un autre calcul a donné 5 ± 5 kJ/mol), ce qui est cohérent avec la valeur expérimentale de 7 kJ/mol.
Les résultats démontrent les performances d'exécution et de fonctionnement en parallèle du système sur différentes plateformes. - Mimétisme enzymatique de l'haloalcane déshalogénase :
Le système contient 41 259 atomes et utilise un champ de force AMBER avec correction Ewald (PME) et un rayon de coupure de 1,0 nm.
Des simulations de dynamique moléculaire de l'enzyme en solution aqueuse ont été réalisées sur un IBM SP, avec des corrections d'énergie et de force électrostatiques à longue portée effectuées à l'aide d'une grille de 64³.
Les résultats montrent un bon comportement d'accélération parallèle et fournissent des fichiers d'entrée qui peuvent être exécutés directement (had_md.nw, had.top.gz, had_md.rst.gz). - Gouttelettes de 1,2-dichloroéthane :
Un système contenant 100 369 atomes a été utilisé pour simuler le comportement des gouttelettes polluantes.
En utilisant les paramètres du champ de force des chloroalcanes de Paulsen et le modèle d'eau SPC/E, avec un rayon de coupure de 2,4 nm, l'expérience a été exécutée respectivement sur IBM SP et Cray T3E-900.
Les simulations démontrent la comparaison des performances et l'évolutivité des gouttelettes de 1,2-dichloroéthane sur différentes plateformes.
octanol liquide :
Le système de simulation contient 216 000 atomes, utilise le champ de force AMBER et le modèle d'eau SPC/E, et possède un rayon de coupure de 2,4 nm.
L'accélération linéaire et la bonne évolutivité du système d'octanol liquide dans des conditions parallèles à grande échelle ont été démontrées en fonctionnant sur un Cray T3E-900.
- Tests de performance SCF :
Le calcul de flux de données distribué semi-direct (DDSCF) a été effectué sur un IBM SP (nœud de 150 MHz) pour examiner l'accélération du processeur et l'utilisation du disque à mesure que le nombre de nœuds de processeur augmente.
Les résultats montrent que l'utilisation du disque augmente proportionnellement aux ressources disponibles, ce qui confirme l'évolutivité du module SCF dans un environnement distribué. - Benchmark DFT (SIOSI3/6/7) :
Des calculs LDA ont été effectués sur trois systèmes de fragments de zéolite (contenant respectivement 347, 1687 et 3554 fonctions de base) pour évaluer l'évolutivité du module de théorie fonctionnelle de la densité.
Fournir des fichiers d'entrée (siosi3.nw, siosi6.nw, siosi7.nw) pour des expériences reproductibles, nécessitant que les calculs soient effectués entièrement en mémoire (dans le cœur).
L'utilisation de la mémoire peut être vérifiée en recherchant le mot-clé « in-core » dans le fichier de sortie, et les résultats du calcul montrent une bonne accélération parallèle multiprocesseur. - Calcul du gradient MP2 :
Des calculs de gradient MP2 ont été effectués sur la molécule (H₂O)₇ et le système d'éther couronne de potassium pour analyser la distribution du temps CPU sous différents nombres de processeurs.
Les calculs ont été effectués sur un IBM SP (nœud de 120 MHz), démontrant la proportion du temps de calcul pour chaque partie.
Un fichier d'entrée reproductible, h2o7.nw, est fourni pour des tests de performance supplémentaires.
Conseils d'utilisation
- Pour les comparaisons de performances, veuillez enregistrer le nombre de nœuds/cœurs, le temps d'exécution et la configuration parallèle (MPI×OpenMP) afin de garantir une comparaison équitable.
- Avant l'exécution, veuillez vous référer au fichier d'entrée et au document README correspondant à chaque scénario de test de performance afin de vous assurer que les données d'entrée sont cohérentes et que les paramètres sont complets.
- Ce référentiel peut être utilisé pour :
- Validation d'une nouvelle plateforme matérielle : évaluation des performances de NWChem dans des environnements tels que les GPU, les systèmes hybrides et les accélérateurs.
- Évaluation de l'optimisation parallèle : impact sur les performances des différentes options de compilation, du modèle de communication MPI et de la planification de la mémoire.
- Étude comparative du logiciel : comparaison des performances avec d’autres programmes de chimie quantique (tels que Gaussian, CP2K, ORCA) sur des systèmes similaires.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.