Détection de données hors distribution par le biais de la priorité de classe in-distribution

Étant donné un modèle pré-entraîné sur des données intradistribution (ID), la détection des données hors distribution (OOD) en phase d'inférence vise à identifier les échantillons OOD lors de l'utilisation du modèle. Toutefois, certaines méthodes représentatives reposent sur une hypothèse non justifiée selon laquelle la probabilité que les données OOD appartiennent à chacune des classes ID est identique, c’est-à-dire que les probabilités OOD vers ID suivent en réalité une distribution uniforme. Dans cet article, nous démontrons que cette hypothèse rend ces méthodes inefficaces lorsque le modèle ID est entraîné sur des données déséquilibrées. Heureusement, en analysant les relations causales entre les classes ID/OOD et les caractéristiques, nous identifions plusieurs scénarios courants où les probabilités OOD vers ID doivent suivre la distribution a priori des classes ID. À partir de ces observations, nous proposons deux stratégies pour adapter les méthodes existantes de détection OOD en phase d’inférence : 1) remplacer la distribution uniforme par la distribution a priori des classes ID si celle-ci est explicitement utilisée ; 2) sinon, recalibrer les scores en fonction de la similarité entre la distribution a priori des classes ID et les sorties de la fonction softmax du modèle pré-entraîné. Des expériences étendues montrent que les deux stratégies améliorent significativement la performance de détection OOD lorsque le modèle ID est pré-entraîné sur des données déséquilibrées, mettant ainsi en évidence l’importance cruciale de la distribution a priori des classes ID dans la détection OOD.