HyperAIHyperAI
vor 9 Tagen

ChemRL-GEM: Geometrieverstärkte Lernung molekularer Darstellungen für die Eigenschaftsvorhersage

Xiaomin Fang, Lihang Liu, Jieqiong Lei, Donglong He, Shanzhuo Zhang, Jingbo Zhou, Fan Wang, Hua Wu, Haifeng Wang
ChemRL-GEM: Geometrieverstärkte Lernung molekularer Darstellungen für die Eigenschaftsvorhersage
Abstract

Effektive Lernmethoden für molekulare Darstellungen sind von entscheidender Bedeutung, um die Vorhersage molekularer Eigenschaften zu erleichtern, einer grundlegenden Aufgabe in der Pharmazeutika- und Materialforschung. In jüngster Zeit haben Graph Neural Networks (GNNs) erhebliches Potenzial gezeigt, bei der Lernung molekularer Darstellungen eingesetzt zu werden. Darüber hinaus haben mehrere neuere Studien erfolgreich selbstüberwachte Lernansätze zur Vortrainierung von GNNs eingesetzt, um das Problem unzureichend gelabelter Moleküle zu überwinden. Allerdings berücksichtigen bestehende GNNs und Vortrainingsstrategien Moleküle in der Regel lediglich als topologische Graphdaten und nutzen die räumliche Geometrie der Moleküle nicht ausreichend. Dabei ist die dreidimensionale (3D) räumliche Struktur eines Moleküls – auch als molekulare Geometrie bekannt – eine der entscheidenden Faktoren für die Bestimmung seiner physikalischen, chemischen und biologischen Eigenschaften. Um diesem Problem zu begegnen, schlagen wir eine neuartige Methode zur geometrieerweiterten molekularen Darstellungslernung (Geometry Enhanced Molecular representation learning, GEM) für die chemische Darstellungslernung (ChemRL) vor. Zunächst entwerfen wir eine geometriebasierte GNN-Architektur, die gleichzeitig Atome, Bindungen und Bindungswinkel innerhalb eines Moleküls modelliert. Konkret entwickeln wir zwei Graphen für jedes Molekül: Der erste kodiert die Beziehungen zwischen Atomen und Bindungen, der zweite die Beziehungen zwischen Bindungswinkeln. Darüber hinaus schlagen wir mehrere neuartige selbstüberwachte Lernstrategien auf Geometrieebene vor, die auf der entwickelten GNN-Architektur basieren und räumliches Wissen durch Ausnutzung der lokalen und globalen 3D-Struktur des Moleküls erlernen. Wir vergleichen ChemRL-GEM mit verschiedenen State-of-the-Art (SOTA)-Baselines anhand verschiedener molekularer Benchmark-Datensätze und zeigen, dass ChemRL-GEM sowohl in Regressions- als auch in Klassifikationsaufgaben signifikant alle Baselines übertrifft. Beispielsweise ergibt sich im Durchschnitt eine Verbesserung um 8,8 % gegenüber den SOTA-Baselines bei Regressionsaufgaben, was die Überlegenheit des vorgeschlagenen Ansatzes eindrucksvoll belegt.