HyperAIHyperAI

Command Palette

Search for a command to run...

NWChem_Benchmark Leistungsbenchmark-Datensatz

Datum

vor 3 Tagen

Veröffentlichungs-URL

github.com

Lizenz

Andere

Der NWChem-Benchmark-Datensatz ist eine Sammlung standardisierter Leistungstestszenarien, die speziell für die Quantenchemie- und Molekülsimulationssoftware NWChem in Hochleistungsrechnerumgebungen (HPC) entwickelt wurden. Dieser von der NWChem-Software generierte Datensatz umfasst hybride Quanten- und klassische Berechnungsdaten für Biomoleküle, Nanostrukturen und Festkörpermaterialien. Er beinhaltet Eigenschaften im Grundzustand und angeregten Zustand, verwendet sowohl Gauß-Funktions- als auch Planewellen-Berechnungsmethoden und zeichnet sich durch hohe Parallelisierbarkeit von einzelnen Knoten bis hin zu Tausenden von Prozessoren aus. Darüber hinaus unterstützt er die Analyse molekularer Eigenschaften und relativistischer Effekte.

Die entsprechende Forschungsarbeit mit dem Titel „NWChem: Vergangenheit, Gegenwart und Zukunft“ wurde im Jahr 2020 vom Pacific Northwest National Laboratory in Zusammenarbeit mit dem Lawrence Berkeley National Laboratory, dem National Center for Computational Sciences und anderen Institutionen veröffentlicht.

Datensatzstruktur

Die grundlegende Struktur dieses Datensatzes umfasst:

  • Eingabeskripte und Ausgaberesultate: Jedes Benchmark-Szenario enthält eine reproduzierbare Eingabedatei für die Berechnung (.nw) sowie entsprechende Ausgabeprotokolle/Zeitmessdaten (einschließlich Wanduhrzeit, CPU-Zeit, Beschleunigung).
  • Parallelarchitektur: Beinhaltet Laufzeitkonfigurationen mit unterschiedlicher Anzahl von Prozessoren und parallelen Modi (MPI + OpenMP oder reines MPI) zur Analyse der Skalierbarkeit der Leistung.
  • Mehrere chemische Methoden: Umfasst Rechenmodule wie Molekulardynamik (MD), selbstkonsistentes Feld (SCF), Dichtefunktionaltheorie (DFT) und Störungstheorie zweiter Ordnung (MP2).
  • Beschreibung der Referenzbetriebsumgebung: Geben Sie die für die Berechnungen verwendete Supercomputing-Plattform (z. B. IBM SP2, Cray T3E-900), die Anzahl der Knoten, die Anzahl der Kerne, die Laufzeit usw. an.
  • Bilder und Leistungskurven: Jeder Szene ist ein Leistungsdiagramm (.gif, .jpg) beigefügt, das Kennzahlen wie Beschleunigung, CPU-Zeit und Festplattennutzung anzeigt.
  • Beispiele zum Herunterladen und Eingeben: Alle Benchmark-Aufgaben können durch Herunterladen der entsprechenden Eingabedateien (z. B. had_md.nw, siosi3.nw, h2o7.nw usw.) reproduziert werden.

Beispiel für den Inhalt eines Datensatzes

Im Folgenden sind einige typische Benchmark-Inhalte aufgeführt:

  • Flüssigwassersysteme (Molekulardynamik):
    Molekulardynamiksimulationen wurden an Systemen mit 5184, 17496, 41472 und 82000 Atomen unter Verwendung des SPC/E-Wassermodells mit einem Cutoff-Radius von 1,8 nm durchgeführt und auf einem IBM SP2 ausgeführt.
    Die Simulation demonstriert die parallele Skalierbarkeit des Flüssigwassersystems und zeigt, dass jeder Prozessor ungefähr 100 Atome verarbeiten muss, um eine gute Skalierbarkeit zu erreichen.
    Die Ergebnisse zeigen, dass die Aufrechterhaltung einer angemessenen Rechenlast für die Effizienz beim massiv parallelen Rechnen von entscheidender Bedeutung ist.
  • Berechnung der freien Energie des Na⁺/K⁺-Kronetherkomplexes:
    Das System mit 6382 Atomen wurde auf IBM SP2 und Cray T3E-900 ausgeführt, um die relativen freien Energien von Na⁺- und K⁺-Ionen in wässriger Lösung und in ihrem Komplex mit 18-Krone-6-Kronenether zu berechnen.
    Die Differenz der zusammengesetzten freien Energie wurde mit Hilfe der Multikonfigurations-Thermodynamischen Integrationsmethode (MCTI) auf etwa 6 ± 4 kJ/mol berechnet (eine andere Berechnung ergab 5 ± 5 kJ/mol), was mit dem experimentellen Wert von 7 kJ/mol übereinstimmt.
    Die Ergebnisse demonstrieren die Laufzeit- und Parallelleistung des Systems auf verschiedenen Plattformen.
  • Nachahmung des Haloalkan-Dehalogenase-Enzyms:
    Das System enthält 41.259 Atome und verwendet ein AMBER-Kraftfeld mit Ewald-Korrektur (PME) und einem Abschneideradius von 1,0 nm.
    Molekulardynamiksimulationen des Enzyms in wässriger Lösung wurden auf einem IBM SP durchgeführt, wobei Korrekturen der elektrostatischen Energie und Kräfte über große Entfernungen mithilfe eines 64³-Gitters vorgenommen wurden.
    Die Ergebnisse zeigen ein gutes paralleles Beschleunigungsverhalten und liefern Eingabedateien, die direkt ausgeführt werden können (had_md.nw, had.top.gz, had_md.rst.gz).
  • 1,2-Dichlorethan-Tröpfchen:
    Zur Simulation des Verhaltens von Schadstofftröpfchen wurde ein System mit 100.369 Atomen verwendet.
    Unter Verwendung der Paulsen-Chloralkan-Kraftfeldparameter und des SPC/E-Wassermodells mit einem Abschneideradius von 2,4 nm wurde das Experiment auf IBM SP bzw. Cray T3E-900 durchgeführt.
    Simulationen demonstrieren den Leistungsvergleich und die Skalierbarkeit von 1,2-Dichlorethan-Tröpfchen auf verschiedenen Plattformen.

Flüssiges Octanol:
Das Simulationssystem umfasst 216.000 Atome, verwendet das AMBER-Kraftfeld und das SPC/E-Wassermodell und hat einen Abschneideradius von 2,4 nm.
Anhand eines Cray T3E-900 wurde die lineare Beschleunigung und die gute Skalierbarkeit des Flüssigoctanolsystems unter großtechnischen Parallelbedingungen demonstriert.

  • SCF-Leistungstests:
    Zur Untersuchung der CPU-Beschleunigung und der Festplattennutzung bei zunehmender Anzahl von Prozessorknoten wurde eine semi-direkte verteilte Datenflussberechnung (DDSCF) auf einem IBM SP (150 MHz Knoten) durchgeführt.
    Die Ergebnisse zeigen, dass die Festplattennutzung proportional zu den verfügbaren Ressourcen zunimmt, was die Skalierbarkeit des SCF-Moduls in einer verteilten Umgebung bestätigt.
  • DFT-Benchmark (SIOSI3/6/7):
    Zur Bewertung der Skalierbarkeit des Dichtefunktionaltheorie-Moduls wurden LDA-Rechnungen an drei Zeolithfragmentsystemen (mit 347, 1687 bzw. 3554 Basisfunktionen) durchgeführt.
    Für reproduzierbare Experimente, bei denen die Berechnungen vollständig im Speicher (im Kern) durchgeführt werden müssen, stellen Sie Eingabedateien (siosi3.nw, siosi6.nw, siosi7.nw) bereit.
    Die Speichernutzung kann durch Suche nach dem Schlüsselwort „in-core“ in der Ausgabedatei überprüft werden, und die Berechnungsergebnisse zeigen eine gute Multiprozessor-Parallelbeschleunigung.
  • MP2-Gradientenberechnung:
    Um die CPU-Zeitverteilung bei unterschiedlicher Anzahl von Prozessoren zu analysieren, wurden MP2-Gradientenberechnungen am (H₂O)₇-Molekül und am Kaliumkronenether-System durchgeführt.
    Die Berechnungen wurden auf einem IBM SP (120 MHz Knoten) durchgeführt, wobei der Anteil der Rechenzeit für jeden Teil dargestellt wurde.
    Für weitere Leistungstests wird eine reproduzierbare Eingabedatei, h2o7.nw, bereitgestellt.

Anwendungstipps

  • Um einen fairen Vergleich der Leistungsfähigkeit zu gewährleisten, erfassen Sie bitte die Anzahl der Knoten/Kerne, die Laufzeit und die parallele Konfiguration (MPI×OpenMP).
  • Bitte konsultieren Sie vor dem Ausführen die Eingabedatei und das README-Dokument, die zu jedem Benchmark-Szenario gehören, um sicherzustellen, dass die Eingabe konsistent und die Parameter vollständig sind.
  • Der Benchmark kann verwendet werden für:
  • Validierung neuer Hardwareplattformen: Leistungsbewertung von NWChem in Umgebungen wie GPUs, Hybridsystemen und Beschleunigern.
  • Bewertung der Paralleloptimierung: Auswirkungen verschiedener Kompilierungsoptionen, des MPI-Kommunikationsmodells und der Speicherplanung auf die Leistung.
  • Vergleichende Studie der Software: Leistungsvergleich mit anderen Quantenchemieprogrammen (wie Gaussian, CP2K, ORCA) auf ähnlichen Systemen.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp