PeSTo : apprentissage profond géométrique sans paramètre pour une prédiction précise des interfaces de liaison protéique

Les protéines constituent des blocs de construction moléculaires essentiels à la vie, assurant la majeure partie des fonctions biologiques grâce à leurs interactions moléculaires spécifiques. Toutefois, la prédiction de leurs interfaces de liaison demeure un défi. Dans cette étude, nous présentons un modèle géométrique basé sur un transformateur agissant directement sur les coordonnées atomiques, étiquetées uniquement par les noms des éléments. Le modèle obtenu, nommé Protein Structure Transformer (PeSTo), dépasse l’état de l’art actuel en prédiction des interfaces protéine-protéine, tout en étant capable de prédire et de distinguer avec une grande confiance les interfaces impliquant des acides nucléiques, des lipides, des ions ou des petites molécules. Grâce à son faible coût computationnel, PeSTo permet le traitement de grandes volumes de données structurales, telles que les ensembles de dynamique moléculaire, permettant ainsi la découverte d’interfaces souvent invisibles dans les structures expérimentales statiques. En outre, l’expansion du répertoire des plis protéiques (foldome) issue des prédictions de structures de novo peut être aisément analysée, ouvrant de nouvelles perspectives pour explorer des aspects biologiques encore inexplorés.