DeepAffinity : Apprentissage profond interprétable de l’affinité composé-protéine par des réseaux neuronaux récurrents et convolutifs unifiés

Motivation : La découverte de médicaments nécessite une quantification rapide des interactions composé-protéine (CPI). Cependant, il manque des méthodes capables de prédire l'affinité composé-protéine à partir des séquences seules avec une grande applicabilité, précision et interprétabilité.Résultats : Nous présentons une intégration fluide des connaissances du domaine et des approches basées sur l'apprentissage. À partir de nouvelles représentations de séquences protéiques annotées structurellement, un modèle d'apprentissage profond semi-supervisé qui unifie les réseaux neuronaux récurrents et convolutifs a été proposé pour exploiter à la fois les données non étiquetées et étiquetées, afin de coder conjointement les représentations moléculaires et de prédire les affinités. Nos représentations et modèles surpassent les options conventionnelles en atteignant une erreur relative dans l'IC$_{50}$ inférieure à 5 fois pour les cas de test et inférieure à 20 fois pour les classes protéiques non incluses dans l'entraînement. Les performances pour de nouvelles classes protéiques avec peu de données étiquetées sont encore améliorées grâce au transfert d'apprentissage. De plus, des mécanismes d'attention distincts et conjoints ont été développés et intégrés à notre modèle pour augmenter son interprétabilité, comme illustré dans des études de cas prédisant et expliquant les interactions cibles-drug sélectives. Enfin, des représentations alternatives utilisant des séquences protéiques ou des graphes composés ainsi qu'un modèle RNN/GCNN-CNN unifié utilisant le CNN sur graphe (GCNN) sont également explorées pour révéler les défis algorithmiques à venir.Disponibilité : Les données et les codes sources sont disponibles sur https://github.com/Shen-Lab/DeepAffinity.Informations supplémentaires : Des données supplémentaires sont disponibles sur http://shen-lab.github.io/deep-affinity-bioinf18-supp-rev.pdf.