HyperAIHyperAI
Back to Headlines

MIT dévoile les secrets des modèles linguistiques de protéines grâce à une nouvelle méthode d’interprétabilité

il y a 2 jours

Depuis quelques années, les modèles basés sur les grands modèles linguistiques (LLM) ont révolutionné la prédiction de la structure et de la fonction des protéines, offrant des outils précieux pour la découverte de médicaments ou la conception d’anticorps thérapeutiques. Cependant, malgré leur précision, ces modèles restent des « boîtes noires » : leurs décisions sont difficiles à interpréter, et on ignore quelles caractéristiques des protéines influencent leurs prédictions. Une équipe du MIT, dirigée par Bonnie Berger, professeure de mathématiques et chef du groupe Computation and Biology au laboratoire d’informatique et d’intelligence artificielle du MIT (CSAIL), a développé une méthode innovante pour percer ce mystère. En collaboration avec Onkar Gujral, étudiant au doctorat, Mihir Bafna et le professeur Eric Alm, les chercheurs ont appliqué pour la première fois une technique appelée autoencodeur éparse aux modèles linguistiques de protéines. Ce dispositif permet de décomposer les représentations internes des protéines dans un réseau neuronal, en élargissant le nombre de « nœuds » actifs — passant de 480 à 20 000 — tout en imposant une contrainte de rareté. Cette expansion force l’information à se répartir plus clairement, permettant à chaque nœud de représenter une caractéristique spécifique, comme une fonction biologique ou une localisation cellulaire. Grâce à une IA assistante, Claude, les chercheurs ont ensuite analysé des milliers de représentations éparse pour associer chaque nœud à des attributs biologiques connus : famille de protéines, rôle moléculaire, localisation dans la cellule, etc. Cette approche a permis d’obtenir des descriptions explicites en langage naturel, par exemple : « Ce nœud détecte les protéines impliquées dans le transport transmembranaire d’ions ou d’acides aminés, particulièrement situées dans la membrane plasmique ». Ces résultats montrent que les modèles captent des caractéristiques biologiques fondamentales, notamment des processus métaboliques et biosynthétiques. Cette interprétabilité ouvre la voie à une utilisation plus ciblée des modèles : les chercheurs pourront choisir ou ajuster des modèles selon les caractéristiques biologiques qu’ils souhaitent explorer. Elle pourrait aussi révéler de nouvelles connaissances biologiques, en permettant aux biologistes d’extraire des insights inédits des représentations apprises par les modèles. « Lorsque les modèles deviendront plus puissants, il se peut qu’on découvre davantage de biologie que ce que nous savons déjà », estime Gujral. Cette étude, publiée dans les Proceedings of the National Academy of Sciences, est financée par les Institutes of Health (NIH) et marque une avancée majeure vers une intelligence artificielle plus transparente et utile en biologie. En évaluation, les experts soulignent que cette méthode pourrait transformer la manière dont les modèles d’intelligence artificielle sont utilisés en recherche biomédicale. Elle répond à un besoin croissant d’explicabilité, essentiel pour la confiance scientifique et l’application clinique. Les entreprises comme DeepMind (AlphaFold), Meta (ESM2) ou Anthropic (Claude), qui développent des modèles de protéines, pourraient intégrer ces approches pour améliorer la fiabilité et la transparence de leurs outils. Cette avancée ouvre la voie à une nouvelle ère de biologie prédictive, où l’IA ne se contente pas de prédire, mais aide à comprendre.

Related Links