Rationalisation de graphes par des augmentations basées sur l’environnement

La justification (rationale) est définie comme un sous-ensemble des caractéristiques d'entrée qui explique le mieux ou soutient le mieux la prédiction effectuée par les modèles d'apprentissage automatique. L'identification de la justification a permis d'améliorer la généralisabilité et l'interprétabilité des réseaux neuronaux sur des données visuelles et linguistiques. Dans les applications sur graphes, telles que la prédiction des propriétés de molécules ou de polymères, l'identification de structures de sous-graphes représentatifs, appelées rationales de graphe, joue un rôle essentiel dans la performance des réseaux neuronaux sur graphe. Les méthodes existantes basées sur le pooling de graphe et/ou l'intervention sur la distribution souffrent d’un manque d’exemples permettant d’apprendre à identifier les rationales de graphe optimales. Dans ce travail, nous introduisons une nouvelle opération d’augmentation appelée remplacement d’environnement, qui crée automatiquement des exemples de données virtuelles afin d’améliorer l’identification des rationales. Nous proposons un cadre efficace qui réalise une séparation entre justification et environnement, ainsi qu’un apprentissage de représentation sur les exemples réels et augmentés dans des espaces latents, afin d’éviter la complexité élevée associée au décodage et au codage explicites des graphes. En comparaison avec des techniques récentes, les expériences menées sur sept jeux de données réels de molécules et quatre jeux de données de polymères démontrent l’efficacité et l’efficience du cadre proposé pour la rationalisation de graphe basée sur l’augmentation.