HyperAIHyperAI

Command Palette

Search for a command to run...

Modèles de transformers NLP augmentés de pointe pour la rétro-synthèse directe et en une seule étape

Igor V. Tetko* Pavel Karpov Guillaume Godin Ruud Van Deursen

Résumé

Nous avons étudié l'effet de différents scénarios d'entraînement sur la prédiction de la (rétro)synthèse de composés chimiques en utilisant une représentation textuelle des réactions chimiques (SMILES) et l'architecture de réseau neuronal Transformer du traitement du langage naturel. Nous avons démontré que l'augmentation de données, méthode puissante utilisée dans le traitement d'images, éliminait l'effet de mémorisation des données par les réseaux neuronaux et améliorait leur performance pour la prédiction de nouvelles séquences. Cet effet a été observé lorsque l'augmentation était appliquée simultanément aux données d'entrée et aux données cibles. La précision top-5 pour la prédiction du plus grand fragment (permettant ainsi d'identifier la transformation principale pour la rétro-synthèse classique) du jeu de test USPTO-50k était de 84,8 % et a été atteinte grâce à une combinaison d'augmentation SMILES et d'un algorithme de recherche en faisceau. La même approche a fourni des résultats nettement meilleurs pour la prédiction des réactions directes à partir du jeu de test USPTO-MIT en une étape. Notre modèle a atteint une précision top-1 de 90,6 % et une précision top-5 de 96,1 % pour son ensemble mixte difficile, ainsi qu'une précision top-5 de 97 % pour l'ensemble USPTO-MIT séparé. Il a également considérablement amélioré les résultats pour la rétro-synthèse en une étape du jeu de test USPTO-complet, tant pour la précision top-1 que pour la précision top-10. La fréquence d'apparition des SMILES générés le plus abondamment était bien corrélée avec le résultat de la prédiction et peut être utilisée comme mesure de la qualité de la prédiction des réactions.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Modèles de transformers NLP augmentés de pointe pour la rétro-synthèse directe et en une seule étape | Articles | HyperAI