LINe : Détection des données hors distribution en exploitant les neurones importants

Il est essentiel de quantifier l’incertitude des échantillons d’entrée, en particulier dans des domaines critiques comme la conduite autonome et la santé, où des erreurs de prédiction sur des données hors distribution (OOD, out-of-distribution) peuvent entraîner des conséquences graves. Le problème de détection OOD découle fondamentalement du fait que le modèle ne peut pas exprimer ce dont il n’a pas connaissance. Les approches post-hoc de détection OOD sont largement explorées, car elles n’exigent pas de réentraînement supplémentaire, qui pourrait dégrader les performances du modèle et augmenter les coûts d’entraînement. Dans cette étude, en s’appuyant sur la perspective des neurones des couches profondes du modèle, qui représentent des caractéristiques de haut niveau, nous introduisons une nouvelle dimension pour analyser les différences dans les sorties du modèle entre les données in-distribution et les données OOD. Nous proposons une méthode originale, appelée Leveraging Important Neurons (LINe), pour la détection OOD post-hoc.La suppression de neurones basée sur la valeur de Shapley réduit l’impact des sorties bruitées en ne sélectionnant que les neurones à forte contribution pour la prédiction de classes spécifiques, tout en masquant les autres. Le clipping d’activation fixe toutes les valeurs au-dessus d’un seuil prédéfini à une même valeur, permettant à LINe de traiter toutes les caractéristiques spécifiques à une classe de manière équitable, et de se concentrer uniquement sur la différence du nombre de caractéristiques activées entre les données in-distribution et les données OOD. Des expériences approfondies confirment l’efficacité de la méthode proposée, qui surpassent les états de l’art des méthodes post-hoc de détection OOD sur les jeux de données CIFAR-10, CIFAR-100 et ImageNet.