HyperAIHyperAI
il y a 2 mois

Modèle de transformation de graphe en séquence invariant par permutation pour la rétro-synthèse sans modèle et la prédiction des réactions

Zhengkai Tu; Connor W. Coley
Modèle de transformation de graphe en séquence invariant par permutation pour la rétro-synthèse sans modèle et la prédiction des réactions
Résumé

La planification de synthèse et la prédiction des résultats de réaction sont deux problèmes fondamentaux en chimie organique assistée par ordinateur pour lesquels une variété d'approches guidées par les données ont émergé. Les approches basées sur le langage naturel qui modélisent chaque problème comme une traduction SMILES-to-SMILES conduisent à une formulation simple de bout en bout, réduisent le besoin de prétraitement des données et permettent l'utilisation d'architectures de modèles de traduction bien optimisées. Cependant, les représentations SMILES ne sont pas un moyen efficace pour capturer des informations sur les structures moléculaires, comme le montre le succès de l'augmentation SMILES pour améliorer les performances empiriques.Dans ce contexte, nous décrivons un nouveau modèle Graph2SMILES qui combine la puissance des modèles Transformer pour la génération de texte avec l'invariance aux permutations des encodeurs de graphes moléculaires, atténuant ainsi le besoin d'augmentation des données d'entrée. En tant qu'architecture de bout en bout, Graph2SMILES peut être utilisé comme remplacement direct du Transformer dans toute tâche impliquant des transformations molécule(s)-vers-molécule(s). Dans notre encodeur, un réseau neuronal à passage de messages dirigé augmenté par l'attention (D-MPNN) capture les environnements chimiques locaux, tandis que l'encodeur d'attention globale permet des interactions à longue portée et intermoléculaires, renforcées par un plongement positionnel sensible au graphe.Graph2SMILES améliore la précision en tête 1 des modèles basés sur Transformer de $1{,}7\%$ et $1{,}9\%$ pour la prédiction des résultats de réaction sur les jeux de données USPTO_480k et USPTO_STEREO respectivement, et de $9{,}8\%$ pour la rétro-synthèse en une étape sur le jeu de données USPTO_50k.

Modèle de transformation de graphe en séquence invariant par permutation pour la rétro-synthèse sans modèle et la prédiction des réactions | Articles de recherche récents | HyperAI