Détection d'exemples hors distribution à l'aide d'exemples in-distribution et de matrices de Gram

Lorsqu’elles sont confrontées à des exemples hors distribution (Out-of-Distribution, OOD), les réseaux neuronaux profonds produisent souvent des prédictions erronées avec un haut degré de confiance. La détection des exemples OOD est un défi majeur, les risques potentiels étant élevés. Dans cet article, nous proposons de détecter les exemples OOD en identifiant les incohérences entre les motifs d’activité et la classe prédite. Nous montrons que la caractérisation des motifs d’activité à l’aide de matrices de Gram, combinée à la détection d’anomalies dans les valeurs de ces matrices, permet d’atteindre des taux élevés de détection OOD. Ces anomalies sont détectées en comparant simplement chaque valeur à la plage correspondante observée sur les données d’entraînement. Contrairement à de nombreuses approches, notre méthode est compatible avec tout classificateur pré-entraîné utilisant une fonction softmax, ne nécessite pas de données OOD pour ajuster les hyperparamètres, ni pour estimer les paramètres lors de la phase d’inférence. Cette approche s’applique à diverses architectures et jeux de données visuels, et se distingue par ses performances supérieures ou équivalentes aux méthodes les plus avancées de détection OOD — y compris celles qui supposent l’accès aux données OOD — sur la tâche importante et surprenamment difficile de la détection d’exemples OOD très éloignés de la distribution d’origine.