HyperAIHyperAI
Back to Headlines

ReaSyn : une IA générative qui raisonne comme un chimiste pour concevoir des molécules synthétisables

il y a un mois

Un défi récurrent dans la conception moléculaire, qu’il s’agisse de médicaments, de produits chimiques ou de matériaux, réside dans la création de molécules synthétisables. L’évaluation de la synthétisabilité exige généralement la cartographie d’un chemin de synthèse — une séquence de réactions chimiques permettant de transformer des précurseurs en molécule cible. Ce post présente ReaSyn, un modèle génératif développé par NVIDIA pour prédire ces voies de synthèse, en surmontant les limites des approches existantes. En chimie, comme dans les modèles de langage, le raisonnement par chaîne de pensée (chain-of-thought, CoT) joue un rôle clé. Les grands modèles de langage (LLM) améliorent leur précision en générant des étapes intermédiaires de raisonnement avant d’arriver à une réponse finale. De même, la prédiction de voies de synthèse repose sur une succession de transformations chimiques. ReaSyn introduit une nouvelle approche fondée sur une notation de chaîne de réaction (chain-of-reaction, CoR), inspirée du CoT, combinée à une stratégie de recherche à temps d’exécution. Dans ReaSyn, une voie de synthèse est représentée comme une séquence linéaire où chaque étape inclut les réactifs, la règle de réaction et le produit. Les molécules sont encodées en SMILES, avec des jetons spéciaux pour marquer leurs limites, tandis que chaque réaction est identifiée par un jeton unique. Cette structure, inspirée du raisonnement pas à pas des chimistes, permet une supervision intermédiaire à chaque étape, renforçant l’apprentissage des règles chimiques et la fiabilité des prédictions multi-étapes. ReaSyn fonctionne comme un modèle génératif autoregressif : il construit progressivement une voie de synthèse à partir de blocs de base simples jusqu’à la molécule cible. Cette approche permet non seulement de reconstruire des voies pour des molécules déjà synthétisables, mais aussi de projeter des molécules non synthétisables vers des analogues réalisables, ouvrant ainsi la voie à des optimisations pratiques. Pour améliorer la génération, ReaSyn intègre des stratégies de raisonnement issues des LLM, notamment l’apprentissage par renforcement (RL) basé sur les résultats et la recherche à temps d’exécution. L’optimisation par RL (GRPO) récompense uniquement le produit final selon sa similarité avec la molécule cible, encourageant l’exploration de multiples chemins possibles. Par ailleurs, la recherche en faisceau (beam search) guide la génération en évaluant les séquences via une fonction de récompense, adaptée selon les objectifs : similarité moléculaire pour la rétro-synthèse, ou propriété chimique souhaitée pour l’optimisation ciblée. Les résultats montrent que ReaSyn excelle dans plusieurs tâches : une réussite de 76,8 % en rétro-synthèse sur des données Enamine, contre 25,2 % pour SynNet, et 41,2 % sur ZINC250k. En optimisation moléculaire ciblée, ReaSyn combiné à Graph GA atteint un score moyen de 0,638, surpassant les méthodes existantes. Il permet aussi une expansion de hits synthétisables en explorant le voisinage moléculaire, offrant ainsi une richesse de variantes réalisables. En résumé, ReaSyn représente une avancée majeure en chimie générative, intégrant des mécanismes de raisonnement avancés pour naviguer efficacement dans l’espace chimique synthétisable. Il s’impose comme un outil puissant pour l’innovation dans la découverte de médicaments, en combinant précision, diversité et faisabilité. Son code est disponible sur GitHub, et son article est publié sur arXiv.

Related Links

ReaSyn : une IA générative qui raisonne comme un chimiste pour concevoir des molécules synthétisables | Dernières nouvelles | HyperAI