RetroComposer : Création de modèles pour la prédiction rétrosynthétique basée sur des modèles

L'objectif principal de la rétro-synthèse est de décomposer de manière récursive les molécules souhaitées en blocs de construction disponibles. Les méthodes actuelles de rétro-synthèse basées sur des modèles suivent un stéréotype de sélection de modèles et sont limitées par le nombre restreint de modèles d'entraînement, ce qui les empêche de découvrir des réactions nouvelles. Pour surmonter cette limitation, nous proposons un cadre innovant de prédiction de rétro-synthèse capable de composer des modèles nouveaux au-delà des modèles d'entraînement. À notre connaissance, c'est la première méthode qui utilise l'apprentissage automatique pour composer des modèles de réaction pour la prédiction de rétro-synthèse. De plus, nous proposons un modèle efficace d'évaluation des candidats réactifs qui peut capturer les transformations au niveau atomique, ce qui aide notre méthode à surpasser les méthodes précédentes sur le jeu de données USPTO-50K. Les résultats expérimentaux montrent que notre méthode peut produire des modèles nouveaux pour 15 réactions du jeu de données USPTO-50K test qui ne sont pas couvertes par les modèles d'entraînement. Nous avons rendu publique notre implémentation source.