HyperAI
il y a 3 jours

PLAME : Utilisation des Modèles de Langue Préentraînés pour Générer des Alignements Multiples de Protéines Améliorés

Hanqun Cao, Xinyi Zhou, Zijun Gao, Chenyu Wang, Xin Gao, Zhi Zhang, et al
PLAME : Utilisation des Modèles de Langue Préentraînés pour Générer des Alignements Multiples de Protéines Améliorés
Résumé

La prédiction de la structure des protéines est essentielle pour la découverte de médicaments et la compréhension des fonctions biologiques. Bien que les récentes avancées comme AlphaFold aient atteint une précision remarquable, la plupart des modèles de pliage dépendent fortement des alignements multiples de séquences (AMS) pour améliorer les performances de prédiction. Cette dépendance limite leur efficacité sur les protéines à faible homologie et les protéines orphelines, où l'information AMS est rare ou inexistante. Pour remédier à cette limitation, nous proposons PLAME, un nouveau modèle de conception d'AMS qui utilise des plongements évolutifs issus de modèles linguistiques préformés pour les protéines. Contrairement aux méthodes existantes, PLAME introduit des représentations préformées pour enrichir l'information évolutionnaire et emploie une perte conservation-diversité pour améliorer la qualité de génération. De plus, nous proposons une nouvelle méthode de sélection d'AMS pour filtrer efficacement les AMS de haute qualité et améliorer les performances du pliage. Nous proposons également un métrique d'évaluation de la qualité des séquences qui offre une perspective orthogonale pour évaluer la qualité des AMS. Sur le banc d'essai AlphaFold2 concernant les protéines à faible homologie et les protéines orphelines, PLAME atteint des performances de pointe en matière d'amélioration du pliage et d'évaluation de la qualité des séquences, avec des améliorations constantes démontrées sur AlphaFold3. Les études par ablation valident l'efficacité de la méthode de sélection d'AMS, tandis que des études de cas approfondies sur divers types de protéines fournissent des informations sur la relation entre la qualité des prédictions d'AlphaFold et les caractéristiques des AMS. De plus, nous montrons que PLAME peut servir d'adaptateur permettant d'atteindre une précision au niveau d'AlphaFold2 avec la vitesse d'inférence d'ESMFold.