OQM9HK: Ein großflächiges Graphen-Datensatz für maschinelles Lernen in der Materialwissenschaft

Wir stellen einen großskaligen Datensatz quantenmechanisch berechneter Eigenschaften kristalliner Materialien für das Graph-Darstellungslernen vor, der etwa 900.000 Einträge umfasst (OQM9HK). Dieser Datensatz basiert auf der Open Quantum Materials Database (OQMD) v1.5, die über eine Million Einträge enthält, und ist die Fortsetzung der OQMD v1.2-Datenbank mit etwa 600.000 Einträgen (OQM6HK). Wir entwickeln einen Graphenerzeugungsalgorithmus, der einen binär kantenbeschrifteten (BEL) Graphen zur Darstellung kristalliner Materialien erzeugt. Der BEL-Graph besitzt eine höhere Repräsentationskraft für Kristallstrukturen im Vergleich zu kantenunbeschrifteten Graphen. Bei Aufgaben der Materialeigenschaftsvorhersage erzielen kristalline Graphen-Neuronale Netze, die auf dem BEL-Graph-Datensatz trainiert wurden, bessere Ergebnisse als solche, die auf anderen Graph-Datensätzen trainiert wurden. Der OQM9HK-Graph-Datensatz ist über die Zenodo-Repository-Adresse verfügbar: https://doi.org/10.5281/zenodo.7124330