HyperAIHyperAI
il y a 2 mois

Moins c'est plus : Moins de régions interprétables grâce à la sélection de sous-ensembles sous-modulaires

Chen, Ruoyu ; Zhang, Hua ; Liang, Siyuan ; Li, Jingzhi ; Cao, Xiaochun
Moins c'est plus : Moins de régions interprétables grâce à la sélection de sous-ensembles sous-modulaires
Résumé

Les algorithmes d'attribution d'images visent à identifier les régions importantes qui sont fortement pertinentes pour les décisions du modèle. Bien que les solutions d'attribution existantes puissent attribuer efficacement de l'importance aux éléments cibles, elles font toujours face aux défis suivants : 1) les méthodes d'attribution actuelles génèrent des régions petites et inexactes, ce qui induit en erreur la direction de l'attribution correcte, et 2) le modèle ne peut pas produire de bons résultats d'attribution pour les échantillons avec des prédictions incorrectes. Pour relever ces défis, cet article reformule le problème d'attribution d'images comme un problème de sélection de sous-ensembles sous-modulaire, dans le but d'améliorer l'interprétabilité du modèle en utilisant moins de régions. Afin de remédier au manque d'attention portée aux régions locales, nous construisons une nouvelle fonction sous-modulaire pour découvrir des régions interprétatives plus précises et plus petites. Pour renforcer l'effet d'attribution sur tous les échantillons, nous imposons également quatre contraintes différentes sur la sélection des sous-régions, à savoir les scores de confiance, d'efficacité, de cohérence et de collaboration, afin d'évaluer l'importance des différents sous-ensembles. De plus, notre analyse théorique confirme que la fonction proposée est en effet sous-modulaire. Des expériences approfondies montrent que la méthode proposée surpasse les méthodes SOTA (State-of-the-Art) sur deux jeux de données faciales (Celeb-A et VGG-Face2) et un jeu de données fine-grained (CUB-200-2011). Pour les échantillons prédits correctement, la méthode proposée améliore les scores de Suppression (Deletion) et d’Insertion avec une moyenne respective de 4,9 % et 2,5 % par rapport à HSIC-Attribution. Pour les échantillons prédits incorrectement, notre méthode réalise des gains respectifs de 81,0 % et 18,4 % par rapport à l'algorithme HSIC-Attribution en termes de confiance moyenne la plus élevée et de score d’Insertion. Le code est disponible sur https://github.com/RuoyuChen10/SMDL-Attribution.