Score-CAM : Explications visuelles pondérées par le score pour les réseaux de neurones convolutifs

Récemment, l'attention s'est portée de plus en plus sur les mécanismes internes des réseaux de neurones convolutifs et sur les raisons pour lesquelles le réseau prend certaines décisions. Dans cet article, nous développons une nouvelle méthode d'explication visuelle post hoc appelée Score-CAM, basée sur la cartographie d'activation de classe. Contrairement aux approches précédentes basées sur la cartographie d'activation de classe, Score-CAM élimine la dépendance aux gradients en obtenant le poids de chaque carte d'activation par son score de passage en avant sur la classe cible, le résultat final étant obtenu par une combinaison linéaire des poids et des cartes d'activation. Nous montrons que Score-CAM offre de meilleures performances visuelles et une meilleure équité pour interpréter le processus de prise de décision. Notre approche surpassent les méthodes précédentes tant dans les tâches de reconnaissance que dans celles de localisation, elle passe également le test de validité. Nous soulignons également son application comme outil de débogage. Le code officiel a été publié.