Apprentissage de Représentations de Niveau Graphique pour la Découverte de Médicaments

La prédiction des influences macroscopiques des médicaments sur le corps humain, telles que l'efficacité et la toxicité, est un problème central dans la découverte de médicaments basée sur les petites molécules. Les molécules peuvent être représentées sous forme de graphe non orienté, et nous pouvons utiliser des réseaux de convolution de graphe pour prédire leurs propriétés moléculaires. Cependant, les réseaux de convolution de graphe et autres réseaux neuronaux de graphe se concentrent principalement sur l'apprentissage de représentations au niveau des nœuds plutôt que sur celui du graphe. Les travaux antérieurs ont simplement additionné tous les vecteurs caractéristiques des nœuds du graphe pour obtenir le vecteur caractéristique du graphe destiné à la prédiction des médicaments. Dans cet article, nous introduisons un nœud super-fictif qui est connecté à tous les nœuds du graphe par une arête dirigée, en tant que représentation du graphe, et modifions l'opération de graphe pour aider ce nœud super-fictif à apprendre une représentation au niveau du graphe. Ainsi, nous pouvons traiter la classification et la régression au niveau du graphe de la même manière que celles au niveau des nœuds. De plus, nous appliquons une perte focale pour aborder l'imbalance des classes dans les jeux de données pharmaceutiques. Les expériences menées sur MoleculeNet montrent que notre méthode peut améliorer efficacement les performances de prédiction des propriétés moléculaires.