Prädiktion tiefer retrosynthetischer Reaktionen unter Verwendung lokaler Reaktivität und globaler Aufmerksamkeit
Als ein grundlegendes Problem der Chemie zielt die Retro-Synthese darauf ab, Reaktionswege und Zwischenstufen für eine Zielverbindung zu entwerfen. Das Ziel der künstlichen Intelligenz (KI)-unterstützten Retro-Synthese besteht darin, diesen Prozess zu automatisieren, indem aus vorherigen chemischen Reaktionen gelernt wird, um neue Vorhersagen zu treffen. Obwohl mehrere Modelle ihr Potenzial für die automatisierte Retro-Synthese bereits gezeigt haben, besteht weiterhin ein erheblicher Bedarf, die Vorhersagegenauigkeit auf ein praktikableres Niveau zu steigern. Hier stellen wir einen lokal basierten Retro-Syntheserahmen namens LocalRetro vor, der von der chemischen Intuition ausgeht, dass sich Moleküle während chemischer Reaktionen hauptsächlich lokal verändern. Dies unterscheidet sich von fast allen bestehenden Ansätzen zur Retro-Synthese, die Reaktanten auf Grundlage der globalen Molekülstrukturen vorschlagen, oft mit feinen Details, die nicht direkt mit der Reaktion verbunden sind. Der lokale Ansatz führt zu lokalen Reaktionsvorlagen, die Atom- und Bindungsumstellungen beinhalten. Da auch entfernte funktionelle Gruppen als sekundärer Faktor die gesamte Reaktionsroute beeinflussen können, wird das vorgeschlagene lokal kodierte Retro-Synthesemodel durch eine globale Aufmerksamkeitsmechanismus weiter verfeinert, um nichtlokale Effekte chemischer Reaktionen zu berücksichtigen. Unser Modell erreicht eine vielversprechende Round-Trip-Genauigkeit von 89,5 % bei Top-1- und 99,2 % bei Top-5-Vorhersagen für die USPTO-50K-Datenbank mit insgesamt 50.016 Reaktionen. Wir demonstrieren zudem die Gültigkeit von LocalRetro an einem großen Datensatz mit 479.035 Reaktionen (UTPTO-MIT), wobei vergleichbare Round-Trip-Genauigkeiten von 87,0 % (Top-1) und 97,4 % (Top-5) erzielt werden. Die praktische Anwendbarkeit des Modells wird durch die korrekte Vorhersage der Synthesewege von fünf Arzneimittelkandidaten aus verschiedenen Literaturquellen belegt.