TrimNet : apprentissage de la représentation moléculaire à partir de messages triplet pour la biomédecine
Motivation : Les méthodes computationnelles accélèrent la découverte de médicaments et jouent un rôle crucial en biomédecine, notamment dans la prédiction des propriétés moléculaires et l’identification des interactions composé-protéine. Un défi majeur réside dans l’apprentissage de représentations moléculaires utiles. Au cours des premières années, les propriétés moléculaires étaient principalement calculées à l’aide de méthodes de mécanique quantique ou prédites par des méthodes classiques d’apprentissage automatique, nécessitant des connaissances spécialisées et s’avérant souvent très laborieuses. À l’heure actuelle, les réseaux de neurones sur graphes ont suscité un intérêt croissant en raison de leur capacité puissante à extraire des représentations à partir de données structurées en graphe. Toutefois, les méthodes actuelles basées sur les graphes présentent certaines limitations à surmonter, telles qu’un nombre important de paramètres et une extraction insuffisante des informations relatives aux liaisons chimiques.Résultats : Dans cette étude, nous proposons une approche fondée sur les graphes, intégrant un mécanisme novateur de message triplet, pour apprendre efficacement des représentations moléculaires, nommée TrimNet (Triplet Message Networks). Nous démontrons que TrimNet permet de réaliser avec précision plusieurs tâches d’apprentissage de représentations moléculaires tout en réduisant de manière significative le nombre de paramètres, notamment la prédiction des propriétés quantiques, de la bioactivité, de la physiologie, ainsi que des interactions composé-protéine (CPI). Sur divers jeux de données, TrimNet surpasser largement la méthode précédente de l’état de l’art. En plus d’un nombre réduit de paramètres et d’une haute précision de prédiction, TrimNet parvient à se concentrer sur les atomes essentiels aux propriétés cibles, offrant ainsi une interprétation claire des tâches de prédiction. Ces avantages établissent TrimNet comme un outil computationnel puissant et utile pour résoudre le problème difficile de l’apprentissage de représentations moléculaires.