Transferierbares mehrstufiges Aufmerksamkeits-Neuronales Netzwerk zur präzisen Vorhersage quantenchemischer Eigenschaften mittels Multi-Task-Learning
Die Entwicklung effizienter Modelle zur Vorhersage spezifischer Eigenschaften mittels maschinellem Lernen ist von großer Bedeutung für die Innovation in Chemie und Materialwissenschaft. Die Vorhersage elektronischer Struktur-Eigenschaften wie der Energien von HOMO (Highest Occupied Molecular Orbital) und LUMO (Lowest Unoccupied Molecular Orbital) sowie der HOMO-LUMO-Lücke von kleinen Molekülen auf größere Moleküle hin bleibt jedoch eine Herausforderung. In dieser Arbeit entwickeln wir eine mehrstufige Aufmerksamkeitsstrategie, die es ermöglicht, chemisch interpretierbare Einsichten in ein mehrfach aufgabenorientiertes Lernmodell mit bis zu 110.000 Datensätzen aus dem QM9-Datensatz zu integrieren, wobei eine zufällige Aufteilung der Daten zur Evaluierung verwendet wird. Die hohe Übertragbarkeit zur Vorhersage größerer Moleküle außerhalb des Trainingsdatensatzes wird sowohl für QM9 als auch für den Alchemy-Datensatz nachgewiesen. Mit unserem speziell entwickelten, interpretierbaren mehrstufigen Aufmerksamkeits-Neuralnetzwerk, DeepMoleNet, gelingt eine effiziente und genaue Vorhersage von 12 Eigenschaften – darunter Dipolmoment, HOMO-Energie und Gibbs-Freie Energie – im Bereich der chemischen Genauigkeit. Besonders hervorzuheben ist, dass das vorgestellte mehrfach aufgabenorientierte Deep-Learning-Modell die atomzentrierten Symmetriefunktionen (ACSFs) nicht als Eingabedaten, sondern als eine der Vorhersageziele verwendet, was von der herkömmlichen Vorgehensweise abweicht. Das vorgeschlagene mehrstufige Aufmerksamkeits-Neuralnetzwerk eignet sich für die hochdurchsatzfähige Screening-Untersuchung zahlreicher chemischer Spezies und beschleunigt somit die rationelle Entwicklung von Arzneimitteln, Materialien und chemischen Reaktionen.