Modèles d'embedding de graphes conceptuels pour une précision et une interprétabilité améliorées
Dans les domaines exigeant une haute responsabilité, il est essentiel de comprendre comment les modèles d’apprentissage profond prennent leurs décisions lors de l’analyse des causes derrière une classification d’images. Des méthodes d’interprétation fondées sur les concepts ont récemment été introduites afin de révéler les mécanismes internes des modèles d’apprentissage profond à l’aide de concepts de haut niveau. Toutefois, ces méthodes sont limitées par un compromis entre précision et interprétabilité. Par exemple, dans des environnements réels, contrairement aux jeux de données d’entraînement soigneusement structurés, la prédiction précise des concepts attendus devient un défi en raison des diverses distorsions et complexités introduites par des objets variés. Pour surmonter ce compromis, nous proposons des modèles d’embedding de graphe de concepts (CGEM), qui captent les dépendances et structures complexes entre concepts grâce à l’apprentissage de directions mutuelles. Le réseau de neurones convolutionnel de graphe de concepts (Concept GCN), une tâche descendante de CGEM, se distingue des méthodes précédentes en ne déterminant pas uniquement la présence de concepts, mais en effectuant une classification finale fondée sur les relations entre concepts apprises via l’embedding de graphe. Ce processus confère au modèle une grande résilience, même en présence de concepts erronés. En outre, nous utilisons un GCN bipartite déformable pour le codage des concepts centrés sur les objets dans les phases initiales, ce qui améliore l’homogénéité des concepts. Les résultats expérimentaux montrent que, grâce au codage conceptuel déformable, le CGEM atténue efficacement le compromis entre précision de la tâche et interprétabilité. De plus, il a été confirmé que cette approche permet au modèle d’améliorer à la fois la résilience et l’interprétabilité, tout en maintenant une robustesse face à diverses distorsions de concepts présentes dans des environnements réels et à des interventions erronées sur les concepts. Notre code est disponible à l’adresse suivante : https://github.com/jumpsnack/cgem.