HyperAIHyperAI
il y a 2 mois

Modèles de transformers NLP augmentés de pointe pour la rétro-synthèse directe et en une seule étape

Igor V. Tetko; Pavel Karpov; Ruud Van Deursen; Guillaume Godin
Modèles de transformers NLP augmentés de pointe pour la rétro-synthèse directe et en une seule étape
Résumé

Nous avons étudié l'effet de différents scénarios d'entraînement sur la prédiction de la (rétro)synthèse de composés chimiques en utilisant une représentation textuelle des réactions chimiques (SMILES) et l'architecture de réseau neuronal Transformer du traitement du langage naturel. Nous avons démontré que l'augmentation de données, méthode puissante utilisée dans le traitement d'images, éliminait l'effet de mémorisation des données par les réseaux neuronaux et améliorait leur performance pour la prédiction de nouvelles séquences. Cet effet a été observé lorsque l'augmentation était appliquée simultanément aux données d'entrée et aux données cibles. La précision top-5 pour la prédiction du plus grand fragment (permettant ainsi d'identifier la transformation principale pour la rétro-synthèse classique) du jeu de test USPTO-50k était de 84,8 % et a été atteinte grâce à une combinaison d'augmentation SMILES et d'un algorithme de recherche en faisceau. La même approche a fourni des résultats nettement meilleurs pour la prédiction des réactions directes à partir du jeu de test USPTO-MIT en une étape. Notre modèle a atteint une précision top-1 de 90,6 % et une précision top-5 de 96,1 % pour son ensemble mixte difficile, ainsi qu'une précision top-5 de 97 % pour l'ensemble USPTO-MIT séparé. Il a également considérablement amélioré les résultats pour la rétro-synthèse en une étape du jeu de test USPTO-complet, tant pour la précision top-1 que pour la précision top-10. La fréquence d'apparition des SMILES générés le plus abondamment était bien corrélée avec le résultat de la prédiction et peut être utilisée comme mesure de la qualité de la prédiction des réactions.

Modèles de transformers NLP augmentés de pointe pour la rétro-synthèse directe et en une seule étape | Articles de recherche récents | HyperAI