HyperAIHyperAI
il y a 11 jours

SSD : Un cadre unifié pour la détection d'anomalies par apprentissage auto-supervisé

Vikash Sehwag, Mung Chiang, Prateek Mittal
SSD : Un cadre unifié pour la détection d'anomalies par apprentissage auto-supervisé
Résumé

Nous nous posons la question suivante : quelles informations d’entraînement sont nécessaires pour concevoir un détecteur d’anomalies ou de données hors distribution (OOD) efficace, c’est-à-dire capable de repérer des échantillons éloignés de la distribution d’entraînement ? Étant donné que les données non étiquetées sont facilement accessibles dans de nombreuses applications, l’approche la plus prometteuse consiste à développer des détecteurs reposant uniquement sur des données non étiquetées appartenant à la distribution d’entrée (in-distribution). Toutefois, nous constatons que la plupart des détecteurs existants fondés sur des données non étiquetées se comportent médiocrement, souvent au niveau d’une prédiction aléatoire. En revanche, les détecteurs OOD les plus performants actuellement disponibles atteignent des résultats remarquables, mais nécessitent l’accès à des étiquettes de données granulaires pour un apprentissage supervisé. Nous proposons SSD, un détecteur d’anomalies basé uniquement sur des données non étiquetées appartenant à la distribution d’entrée. Notre méthode repose sur un apprentissage représentatif auto-supervisé, suivi d’une détection fondée sur la distance de Mahalanobis dans l’espace des caractéristiques. Nous démontrons que SSD surpasse de très loin la plupart des détecteurs existants basés sur des données non étiquetées. En outre, SSD atteint même un niveau de performance comparable, voire supérieur parfois, à celui des méthodes basées sur l’apprentissage supervisé. Enfin, nous étendons notre cadre de détection avec deux améliorations clés : premièrement, nous formulons le problème de détection OOD en régime « peu d’exemples » (few-shot OOD detection), dans lequel le détecteur dispose uniquement d’un à cinq échantillons par classe provenant du jeu de données OOD ciblé ; deuxièmement, nous étendons notre cadre pour intégrer les étiquettes des données d’entraînement, si elles sont disponibles. Nous constatons que notre nouvelle architecture de détection fondée sur SSD bénéficie d’une amélioration significative grâce à ces extensions, atteignant ainsi un niveau de performance au sommet de l’état de l’art. Le code source est disponible publiquement à l’adresse suivante : https://github.com/inspire-group/SSD.