HyperAIHyperAI
il y a 17 jours

PANDA : Prédiction de la variation de l'affinité de liaison des protéines suite aux mutations à l'aide d'informations séquentielles

Wajid Arshad Abbasi, Syed Ali Abbas, Saiqa Andleeb
PANDA : Prédiction de la variation de l'affinité de liaison des protéines suite aux mutations à l'aide d'informations séquentielles
Résumé

Déterminer avec précision les modifications de l'affinité de liaison des protéines induites par des mutations est essentiel pour la découverte et la conception de nouvelles thérapeutiques, ainsi que pour soutenir les études de mutagénèse. L’évaluation des changements d’affinité de liaison suite à des mutations nécessite des expériences laborieuses, complexes, coûteuses et longues, auxquelles des méthodes computationnelles peuvent apporter un soutien. La plupart des techniques de prédiction computationnelle actuelles exigent la connaissance des structures protéiques, ce qui limite leur application aux complexes protéiques dont la structure est connue. Dans ce travail, nous explorons la prédiction basée sur les séquences de l’évolution de l’affinité de liaison des protéines suite à des mutations. Nous avons utilisé des informations de séquence protéique plutôt que des structures protéiques, combinées à des techniques d’apprentissage automatique, afin de prédire avec précision les changements d’affinité de liaison induits par des mutations. Le prédicteur novateur basé sur les séquences que nous proposons, appelé PANDA, atteint une précision supérieure à celle des méthodes existantes sur le même jeu de validation, ainsi que sur un jeu de test indépendant externe. Sur ce jeu de test externe, notre méthode atteint un coefficient de corrélation de Pearson maximal de 0,52, contre 0,59 pour la méthode existante de pointe basée sur les structures protéiques, MutaBind. Ainsi, notre approche fondée sur les séquences protéiques pour prédire les changements d’affinité de liaison suite à des mutations présente une large applicabilité et des performances comparables à celles des méthodes existantes basées sur les structures protéiques. Une implémentation en ligne via un serveur web basé sur le cloud ainsi que le code Python de PANDA sont disponibles à l’adresse suivante : https://sites.google.com/view/wajidarshad/software et https://github.com/wajidarshad/panda.