Node-Aligned Graph-to-Graph (NAG2G): Erhöhung von templatefreien Deep-Learning-Ansätzen in der einstufigen Retrosynthese

Einstufige Retrosynthese (SSR) in der organischen Chemie profitiert zunehmend von tiefen Lernverfahren (DL) im computergestützten Synthesedesign. Obwohl vordiplomatische DL-Modelle flexibel und vielversprechend für die Retrosynthesevorhersage sind, ignorieren sie oft wichtige 2D-molekulare Informationen und haben Schwierigkeiten mit der Atomausrichtung bei der Knotenerzeugung, was zu einer geringeren Leistung im Vergleich zu vorlagenbasierten und halbvorlagenbasierten Methoden führt. Um diese Probleme zu lösen, stellen wir Node-Aligned Graph-to-Graph (NAG2G), ein auf Transformer basierendes vordiplomatisches DL-Modell, vor. NAG2G kombiniert 2D-molekulare Graphen und 3D-Konformationen, um umfassende molekulare Details beizubehalten, und integriert die Abbildung von Produkt- zu Reaktantenatomen durch Knotenausrichtung, die den Ablauf des schrittweisen Graphenausgabe-Prozesses in autoregressiver Weise bestimmt. Durch strenges Benchmarking und detaillierte Fallstudien konnten wir nachweisen, dass NAG2G sich durch seine bemerkenswerte Vorhersagegenauigkeit auf den umfangreichen Datensätzen USPTO-50k und USPTO-FULL hervorhebt. Darüber hinaus wird die praktische Nutzbarkeit des Modells durch die erfolgreiche Vorhersage von Synthesewegen für mehrere Arzneistoffkandidaten unterstrichen. Dies beweist nicht nur die Robustheit von NAG2G, sondern auch dessen Potenzial zur Revolutionierung der Vorhersage komplexer chemischer Syntheseprozesse für zukünftige Aufgaben des synthetischen Routenentwurfs.