Couverture de l'Activation des Neurones : Repenser la Détection des Données Hors Distribution et la Généralisation

Le problème des données hors distribution (out-of-distribution, OOD) se pose généralement lorsque les réseaux neuronaux sont confrontés à des données qui s'écartent fortement de la distribution des données utilisées pour l'entraînement, c’est-à-dire les données in-distribution (InD). Dans cet article, nous étudions le problème OOD sous l’angle des activations des neurones. Nous formulons d’abord les états d’activation des neurones en tenant compte à la fois de la sortie du neurone et de son influence sur les décisions du modèle. Ensuite, afin de caractériser la relation entre les neurones et les problèmes OOD, nous introduisons une nouvelle mesure simple appelée couverture d’activation des neurones (neuron activation coverage, NAC), qui permet de quantifier le comportement des neurones sur des données InD. Grâce à notre mesure NAC, nous démontrons que : 1) les entrées InD et OOD peuvent être nettement séparées en se basant sur le comportement des neurones, ce qui simplifie considérablement le problème de détection OOD et permet de surpasser 21 méthodes antérieures sur trois benchmarks (CIFAR-10, CIFAR-100 et ImageNet-1K) ; 2) une corrélation positive entre la NAC et la capacité de généralisation du modèle se maintient de manière cohérente à travers différentes architectures et jeux de données, ce qui permet de proposer un critère fondé sur la NAC pour évaluer la robustesse du modèle. Contrairement aux critères de validation InD couramment utilisés, nous montrons que la NAC non seulement permet de sélectionner des modèles plus robustes, mais aussi présente une corrélation plus forte avec les performances sur des données OOD.