HyperAIHyperAI

Command Palette

Search for a command to run...

SSD : Un cadre unifié pour la détection d'anomalies par apprentissage auto-supervisé

Vikash Sehwag Mung Chiang Prateek Mittal

Résumé

Nous nous posons la question suivante : quelles informations d’entraînement sont nécessaires pour concevoir un détecteur d’anomalies ou de données hors distribution (OOD) efficace, c’est-à-dire capable de repérer des échantillons éloignés de la distribution d’entraînement ? Étant donné que les données non étiquetées sont facilement accessibles dans de nombreuses applications, l’approche la plus prometteuse consiste à développer des détecteurs reposant uniquement sur des données non étiquetées appartenant à la distribution d’entrée (in-distribution). Toutefois, nous constatons que la plupart des détecteurs existants fondés sur des données non étiquetées se comportent médiocrement, souvent au niveau d’une prédiction aléatoire. En revanche, les détecteurs OOD les plus performants actuellement disponibles atteignent des résultats remarquables, mais nécessitent l’accès à des étiquettes de données granulaires pour un apprentissage supervisé. Nous proposons SSD, un détecteur d’anomalies basé uniquement sur des données non étiquetées appartenant à la distribution d’entrée. Notre méthode repose sur un apprentissage représentatif auto-supervisé, suivi d’une détection fondée sur la distance de Mahalanobis dans l’espace des caractéristiques. Nous démontrons que SSD surpasse de très loin la plupart des détecteurs existants basés sur des données non étiquetées. En outre, SSD atteint même un niveau de performance comparable, voire supérieur parfois, à celui des méthodes basées sur l’apprentissage supervisé. Enfin, nous étendons notre cadre de détection avec deux améliorations clés : premièrement, nous formulons le problème de détection OOD en régime « peu d’exemples » (few-shot OOD detection), dans lequel le détecteur dispose uniquement d’un à cinq échantillons par classe provenant du jeu de données OOD ciblé ; deuxièmement, nous étendons notre cadre pour intégrer les étiquettes des données d’entraînement, si elles sont disponibles. Nous constatons que notre nouvelle architecture de détection fondée sur SSD bénéficie d’une amélioration significative grâce à ces extensions, atteignant ainsi un niveau de performance au sommet de l’état de l’art. Le code source est disponible publiquement à l’adresse suivante : https://github.com/inspire-group/SSD.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp