Fusion synergique des caractéristiques graphiques et des caractéristiques Transformer pour une prédiction améliorée des propriétés moléculaires

La prédiction des propriétés moléculaires constitue une tâche fondamentale dans la découverte de médicaments assistée par calcul. Bien que les avancées récentes des réseaux de neurones graphes (GNN) et des Transformers aient montré une efficacité et un potentiel prometteurs, elles sont confrontées à certaines limites : l’attention auto-associative des Transformers ne prend pas explicitement en compte la structure moléculaire sous-jacente, tandis que la représentation des caractéristiques fournie uniquement par les GNN ne suffit pas à capter les interactions et les caractéristiques fines et cachées qui distinguent les molécules similaires. Pour surmonter ces limites, nous proposons SYN-FUSION, une approche novatrice qui combine de manière synergique des caractéristiques pré-entraînées issues des GNN et des Transformers. Cette méthode permet d’obtenir une représentation moléculaire complète, intégrant à la fois la structure globale de la molécule et les caractéristiques individuelles des atomes. Les résultats expérimentaux sur les benchmarks MoleculeNet démontrent une performance supérieure, dépassant les modèles précédents sur 5 des 7 jeux de données de classification et sur 4 des 6 jeux de données de régression. La performance de SYN-FUSION a été comparée à celle d'autres modèles Graph-Transformer entraînés conjointement à partir d'une combinaison de caractéristiques graphes et de caractéristiques Transformer, et il s'avère que notre approche atteint un niveau de performance équivalent à ces modèles. Une analyse approfondie du modèle fusionné appris, portant sur des aspects tels que la fonction de perte, l'espace latent et la répartition des poids, valide également l'efficacité de SYN-FUSION. Enfin, une étude d'ablation concluante démontre que la synergie réalisée par SYN-FUSION dépasse de manière significative les performances de ses composants individuels ainsi que celles de leur ensemble, offrant ainsi une amélioration substantielle dans la prédiction des propriétés moléculaires.