Vers un Meilleur Modèle avec le Transformateur Dual pour la Prédiction de la Réponse aux Médicaments

Les méthodes basées sur les GNN (Graph Neural Networks) ont obtenu d’excellents résultats ces dernières années en tant que tâche principale dans les tâches de prédiction de la réponse aux médicaments. Les méthodes GNN traditionnelles n’utilisent que les atomes d’une molécule de médicament comme nœuds pour obtenir la représentation du graphe moléculaire par le passage d’information entre les nœuds, tandis que la méthode utilisant le transformer ne peut extraire que des informations sur les nœuds. Cependant, la liaison covalente et la chiralité d’une molécule de médicament ont une grande influence sur ses propriétés pharmacologiques, et ces informations sont implicites dans les liaisons chimiques formées par les arêtes entre les atomes. De plus, les méthodes CNN (Convolutional Neural Networks) utilisées pour modéliser les séquences génomiques des lignées cellulaires ne peuvent percevoir que des informations locales plutôt que globales sur la séquence.Pour résoudre ces problèmes, nous proposons une structure de double transformer décorrélée avec intégration des arêtes pour la prédiction de la réponse aux médicaments (TransEDRP), qui est utilisée pour représenter respectivement le génome des lignées cellulaires et le médicament. Pour la branche du médicament, nous avons codé l’information sur les liaisons chimiques au sein de la molécule sous forme d’embedding des arêtes dans le graphe moléculaire, et extrait l’information structurale et biochimique globale de la molécule de médicament à l’aide d’un graph transformer. Pour la branche génomique des lignées cellulaires, nous utilisons un mécanisme d’attention multi-têtes pour représenter globalement la séquence génomique.Enfin, les branches du médicament et du génome sont fusionnées pour prédire les valeurs IC50 à travers une couche transformer et une couche entièrement connectée, ces deux branches étant de modalités différentes. Des expériences approfondies ont montré que notre méthode est supérieure à l’approche actuelle dominante dans tous les indicateurs d’évaluation.