Node-Aligned Graph-to-Graph (NAG2G) : Amélioration des approches d'apprentissage profond sans modèle en rétro-synthèse en une seule étape

La rétro-synthèse en une étape (SSR) en chimie organique bénéficie de plus en plus des techniques d'apprentissage profond (DL) dans la conception assistée par ordinateur de synthèses. Bien que les modèles DL sans modèle soient flexibles et prometteurs pour la prédiction de rétro-synthèse, ils ignorent souvent des informations moléculaires 2D essentielles et ont du mal à aligner les atomes pour la génération de nœuds, ce qui entraîne une performance inférieure par rapport aux méthodes basées sur des modèles et semi-basées sur des modèles. Pour remédier à ces problèmes, nous présentons Node-Aligned Graph-to-Graph (NAG2G), un modèle DL sans modèle basé sur les transformateurs. NAG2G combine des graphes moléculaires 2D et des conformation 3D pour conserver des détails moléculaires complets et intègre le couplage atome-par-atome entre produit et réactif grâce à l'alignement de nœuds, qui détermine l'ordre du processus de sortie graphique nœud par nœud de manière auto-régressive. Grâce à des évaluations rigoureuses et à des études de cas détaillées, nous avons montré que NAG2G se distingue par sa précision prédictive remarquable sur les vastes ensembles de données USPTO-50k et USPTO-FULL. De plus, l'utilité pratique du modèle est soulignée par sa prédiction réussie de voies de synthèse pour plusieurs molécules candidates à des médicaments. Cela non seulement prouve la robustesse de NAG2G, mais aussi son potentiel pour révolutionner la prédiction de processus complexes de synthèse chimique dans les tâches futures de conception de routes synthétiques.