HyperAIHyperAI
il y a 16 jours

LEP-AD : Embedding linguistique des protéines et attention aux médicaments prédisent les interactions médicament-cibles

{Jesper Tegnér, Narsis A. Kiani, Robert Hoehndorf, David Gomez Cabrero, Sumeer Ahmad Khan, Anuj Daga}
Résumé

La prédiction des interactions médicament-cible représente un défi majeur dans le développement de médicaments et l’optimisation des candidats. Les avancées récentes incluent l’entraînement d’algorithmes pour apprendre les interactions médicament-cible à partir de données expérimentales et de simulations moléculaires. Dans cette étude, nous utilisons des modèles d’Evolutionary Scale Modeling (ESM-2) afin de construire un modèle linguistique de protéines basé sur l’architecture Transformer pour la prédiction des interactions médicament-cible. Notre architecture, LEP-AD, combine un modèle ESM-2 pré-entraîné et un modèle Transformer-GCN pour prédire les valeurs d’affinité de liaison. Nous rapportons des résultats de pointe, supérieurs à ceux des méthodes concurrentes telles que SimBoost, DeepCPI, Attention-DTA, GraphDTA, et d’autres, sur plusieurs jeux de données, notamment Davis, KIBA, DTC, Metz, ToxCast et STITCH. Enfin, nous observons qu’un modèle pré-entraîné utilisant des embeddings de protéines (LEP-AD) surpassent les performances d’un modèle utilisant une représentation 3D explicite des protéines (par exemple, LEP-AD supervisé par AlphaFold). Le modèle LEP-AD montre une amélioration de performance favorable avec la taille des données d’entraînement. Le code est disponible à l’adresse suivante : https://github.com/adaga06/LEP-AD