Un nouvel outil d’intelligence artificielle déchiffre le code des peptides bouclés pour accélérer la découverte de nouveaux médicaments
Les peptides lasso, des molécules naturelles produites par des bactéries, présentent une structure en nœud coulissant unique qui leur confère une grande stabilité et des activités biologiques diverses, notamment antibactériennes, antivirales et anticancéreuses. Leur potentiel thérapeutique dans le traitement du cancer et des maladies infectieuses a attiré l’attention des chercheurs. Pour exploiter pleinement ce potentiel, une équipe du Carl R. Woese Institute for Genomic Biology a développé LassoESM, un modèle de langage à grande échelle spécifiquement conçu pour prédire les propriétés des peptides lasso. Ce modèle repose sur l’architecture ESM-2, pré-entraîné sur des données de peptides lasso via une approche d’adaptation de domaine basée sur le modèle de prédiction de mots masqués. Contrairement aux modèles généraux comme AlphaFold, qui échouent à prédire la structure des peptides lasso en raison de leur architecture atypique, LassoESM a été spécifiquement formé sur des séquences de peptides lasso, permettant de capter des caractéristiques moléculaires précises souvent ignorées par les modèles génériques. Le projet, mené par Doug Mitchell (Vanderbilt Institute for Chemical Biology) et Diwakar Shukla (Université d’Illinois Urbana-Champaign), a combiné des données expérimentales rigoureusement validées par bioinformatique avec des méthodes d’apprentissage profond. Les chercheurs ont identifié des milliers de séquences de peptides lasso, puis ont entraîné LassoESM à reconnaître les motifs spécifiques liés à la formation du nœud, un processus médié par une cyclase lasso, une protéine de reconnaissance de RiPP (RiPP recognition element) et une protéase leader. LassoESM a permis de réaliser plusieurs tâches clés : prédire la tolérance des cyclases lasso à des substrats non cognatifs, identifier des paires compatibles entre cyclases et peptides, et évaluer l’activité d’inhibition de la RNA polymérase (RNAP), avec des valeurs d’enrichissement significatives. Ces prédictions, réalisées même avec des données expérimentales limitées, démontrent la puissance du modèle pour accélérer la conception rationnelle de peptides lasso fonctionnels. Selon Xuenan Mi, doctorante dans l’équipe de Shukla, « LassoESM permet une prédiction précise de diverses propriétés des peptides lasso, offrant un outil puissant pour le développement de thérapeutiques et d’applications industrielles ». Les chercheurs prévoient d’étendre le modèle à d’autres classes de peptides naturels et de l’utiliser pour concevoir des peptides lasso ciblant des protéines spécifiques. Ce travail illustre l’importance de l’interdisciplinarité et de l’accès à des ressources informatiques avancées, rendues possibles grâce au soutien du Carl R. Woese Institute for Genomic Biology. Il ouvre la voie à une ingénierie de peptides plus efficace, combinant intelligence artificielle et biologie synthétique pour des applications médicales innovantes.
