DeepAFM décrypte le mouvement des protéines avec 93,4 % de précision
Une équipe de chercheurs japonais a développé DeepAFM, une méthode d'apprentissage profond capable de décoder le mouvement des protéines à partir d'images bruitées avec une précision de 93,4 %. Cette avancée majeure, publiée dans le Journal of Chemical Information and Modeling, résout un problème persistant en biologie structurale : l'analyse de la dynamique des protéines dans leur environnement naturel. Alors que l'intelligence artificielle a révolutionné la prédiction des structures protéiques statiques avec des outils comme AlphaFold en 2018, comprendre comment ces protéines bougent et changent de forme en temps réel reste un défi. La technique conventionnelle, la microscopie à force atomique à haute vitesse (HS-AFM), permet de visualiser ces mouvements au niveau de la molécule unique. Cependant, les images obtenues sont souvent altérées par un bruit important et des distorsions liées au processus de numérisation ligne par ligne, rendant l'identification précise des formes protéiques difficile. Takaharu Mori, professeur associé à l'Université de science de Tokyo, et son équipe ont créé DeepAFM pour surmonter ces limites. Contrairement aux méthodes traditionnelles qui peuvent capturer des artefacts dus au bruit, le nouveau système utilise l'apprentissage profond pour éliminer le bruit et identifier simultanément les conformations protéiques. Pour former le modèle, les chercheurs ont généré un ensemble de données de millions d'images synthétiques de HS-AFM, basées sur des simulations de dynamique moléculaire. Ces images incluaient des variations réalistes de bruit et de distorsion, couvrant des millions de formes possibles pour la protéine SecA, qui oscille entre des états fermés et largement ouverts. Les tests ont démontré l'efficacité de DeepAFM. Sur un million d'images de test, le modèle a identifié avec précision l'état de conformation exact de la protéine parmi 19 possibilités avec une fiabilité de 93,4 %. La qualité des images débruitées s'est avérée excellente, avec une erreur moyenne de seulement 0,1 nanomètre par rapport à la vérité terrain. L'outil s'est également montré capable de classifier les états fonctionnels avec une précision accrue lorsqu'une marge d'erreur tolérée est appliquée. Lorsque DeepAFM a été appliqué à des données expérimentales réelles, les inférences sur les états conformationnels ont correspondu aux mesures expérimentales indépendantes, validant ainsi son utilité pratique. Le professeur Mori souligne que cette approche fournit une nouvelle stratégie assistée par l'apprentissage profond pour analyser les données de HS-AFM, facilitant grandement l'étude de la dynamique protéique. De plus, la méthode présente une grande polyvalence grâce à l'apprentissage par transfert, permettant d'adapter les connaissances acquises sur un système protéique à d'autres molécules biologiques sans nécessiter un entraînement complet à partir de zéro. Cette recherche fait partie d'un effort plus large pour faire avancer l'analyse scientifique par intelligence artificielle, en préparation pour des plateformes de calcul de nouvelle génération comme Fugaku NEXT, un supercalculateur développé conjointement par le Centre de science computationnelle du RIKEN, Fujitsu et NVIDIA, dont les opérations sont prévues vers 2030. La collaboration entre l'Université de science de Tokyo, l'Université de Nagoya et l'Institut des sciences et technologies de Nara a permis cette percée significative. DeepAFM ouvre ainsi une voie prometteuse pour décrypter les mécanismes complexes du vivant, où la précision du mouvement est aussi importante que la structure statique.
