Command Palette
Search for a command to run...
SemiRetro : Un cadre semi-structuré améliore la prédiction de la rétro-synthèse profonde
SemiRetro : Un cadre semi-structuré améliore la prédiction de la rétro-synthèse profonde
Zhangyang Gao Cheng Tan Lirong Wu Stan Z. Li
Résumé
Récemment, les méthodes d’apprentissage de graphes moléculaires basées sur des modèles (TB) et sans modèles (TF) ont montré des résultats prometteurs pour la rétro-synthèse. Les approches TB offrent une plus grande précision grâce à l’utilisation de modèles de réaction pré-encodés, tandis que les méthodes TF sont plus évolutives en décomposant la rétro-synthèse en sous-problèmes, à savoir l’identification du centre et la complétion du synthon. Pour combiner les avantages des deux approches, nous proposons de fractionner un modèle complet en plusieurs semi-modèles, puis de les intégrer dans un cadre TF à deux étapes. Étant donné que de nombreux semi-modèles sont redondants, cette stratégie permet de réduire la redondance des modèles tout en préservant les connaissances chimiques essentielles, facilitant ainsi la complétion des synthons. Nous appelons cette méthode SemiRetro, introduisons une nouvelle couche de réseau de neurones graphiques (DRGAT) pour améliorer l’identification du centre, et proposons un nouveau module d’autocorrection pour renforcer la classification des semi-modèles. Les résultats expérimentaux montrent que SemiRetro surpasse significativement à la fois les méthodes TB et TF existantes. En termes d’évolutivité, SemiRetro couvre 98,9 % des données avec seulement 150 semi-modèles, contre 11 647 modèles requis par le modèle basé sur les modèles GLN pour couvrir 93,3 % des données. En précision au top-1, SemiRetro dépasse G2G sans modèle de manière respectivement de 4,8 % (classes connues) et de 6,0 % (classes inconnues). En outre, SemiRetro présente une meilleure efficacité d’entraînement par rapport aux méthodes existantes.