Un Modèle Génératif à Tous les Atomes pour la Conception de Complexes Protéiques

Les protéines existent généralement sous forme de complexes, interagissant avec d'autres protéines ou biomolécules pour accomplir leurs rôles biologiques spécifiques. Les recherches sur la modélisation des protéines à chaîne unique ont été largement et profondément explorées, avec des avancées notables dans des modèles tels que la série ESM et AlphaFold2. Malgré ces progrès, l'étude et la modélisation des protéines à chaînes multiples restent largement inexplorées, bien qu'elles soient essentielles pour comprendre les fonctions biologiques. Reconnaissant l'importance de ces interactions, nous présentons APM (All-Atom Protein generative Model), un modèle spécialement conçu pour la modélisation des protéines à chaînes multiples. En intégrant des informations au niveau atomique et en exploitant des données sur les protéines à chaînes multiples, APM est capable de modéliser précisément les interactions inter-chaînes et de concevoir des complexes de protéines dotés de capacités de liaison à partir de zéro. Il effectue également des tâches de pliage et de dépliage inverse pour les protéines à chaînes multiples. De plus, APM montre une grande polyvalence dans les applications en aval : il améliore ses performances grâce au réglage fin supervisé (SFT) tout en supportant l'échantillonnage zéro-shot dans certaines tâches, obtenant ainsi des résultats d'avant-garde. Nous avons publié notre code sur https://github.com/bytedance/apm.