HyperAIHyperAI
il y a 2 mois

Attribution axiomatique pour les réseaux profonds

Sundararajan, Mukund ; Taly, Ankur ; Yan, Qiqi
Attribution axiomatique pour les réseaux profonds
Résumé

Nous étudions le problème de l'attribution de la prédiction d'un réseau profond à ses caractéristiques d'entrée, un sujet qui a déjà été abordé par plusieurs travaux antérieurs. Nous identifions deux axiomes fondamentaux que les méthodes d'attribution devraient satisfaire : la Sensibilité et l'Invariance de mise en œuvre. Nous montrons que ces axiomes ne sont pas respectés par la plupart des méthodes d'attribution connues, ce que nous considérons comme une faiblesse fondamentale de ces méthodes. Guidés par ces axiomes, nous concevons une nouvelle méthode d'attribution appelée Integrated Gradients (Intégration des gradients). Notre méthode ne nécessite aucune modification du réseau original et est extrêmement simple à mettre en œuvre ; elle n'exige qu'un nombre limité d'appels à l'opérateur de gradient standard. Nous appliquons cette méthode à quelques modèles d'images, à quelques modèles de texte et à un modèle chimique, démontrant ainsi sa capacité à déboguer les réseaux, à extraire des règles d'un réseau et à permettre aux utilisateurs d'interagir avec les modèles de manière plus efficace.