HyperAIHyperAI
vor 4 Monaten

G2GT: Retrosynthesevorhersage mit Graph-to-Graph-Aufmerksamkeitsnetzwerk und Selbsttrainierung

Zaiyun Lin; Shiqiu Yin; Lei Shi; Wenbiao Zhou; YingSheng Zhang
G2GT: Retrosynthesevorhersage mit Graph-to-Graph-Aufmerksamkeitsnetzwerk und Selbsttrainierung
Abstract

Die retrosyntheseprädiktion ist eine der grundlegenden Herausforderungen in der organischen Chemie und verwandten Bereichen. Das Ziel besteht darin, Reaktionsmoleküle zu identifizieren, die Produktmoleküle synthetisieren können. Um diese Aufgabe zu lösen, schlagen wir ein neues Graph-to-Graph-Transformationmodell (G2GT) vor, bei dem der Graphencoder und der Graphdecoder auf der Standard-Transformer-Struktur basieren. Wir zeigen außerdem, dass das Selbsttraining, eine leistungsstarke Datenverstärkungsmethode, die unlabeled Molekulardaten nutzt, die Leistung des Modells erheblich verbessern kann. Inspiriert durch den Reaktionstypenlabel und das Ensemble-Lernen, haben wir eine neuartige schwache Ensemblemethode vorgeschlagen, um die Vielfalt zu erhöhen. Wir kombinierten Strahlensuche (beam search), Nukleussampling und Top-k-Samplingmethoden, um die Inferenzvielfalt weiter zu verbessern, und schlugen einen einfachen Rangieralgorithmus vor, um die endgültigen Top-10-Ergebnisse abzurufen. Wir erzielten neue Stand-of-the-Art-Ergebnisse sowohl im USPTO-50K-Datensatz mit einer Top-1-Akkuratesse von 54 % als auch im größeren Datensatz USPTO-full mit einer Top-1-Akkuratesse von 50 % und wettbewerbsfähigen Top-10-Ergebnissen.