Détection d’anomalies peu répétitives profondes explicables à l’aide de réseaux de déviation

Les paradigmes existants de détection d’anomalies se concentrent presque exclusivement sur l’entraînement de modèles de détection à l’aide uniquement de données normales ou de données non étiquetées (majoritairement des échantillons normaux). Un problème récurrent de ces approches réside dans leur faible capacité à distinguer les anomalies des échantillons normaux, en raison du manque de connaissance concernant les anomalies elles-mêmes. Dans ce travail, nous étudions le problème de la détection d’anomalies en peu d’exemples (few-shot anomaly detection), où l’objectif est d’utiliser un petit nombre d’exemples d’anomalies étiquetés afin d’entraîner des modèles de détection efficaces en termes d’échantillons. Pour résoudre ce problème, nous proposons un cadre novateur de détection d’anomalies à faible supervision, permettant d’entraîner des modèles sans supposer que les exemples disponibles couvrent toutes les classes possibles d’anomalies.Plus précisément, l’approche proposée apprend une représentation discriminative de la normalité (régularité) en exploitant les anomalies étiquetées et une probabilité a priori, afin d’imposer des représentations expressives de la normalité et des représentations non bornées des anomalies. Cela est réalisé par une optimisation end-to-end des scores d’anomalie via un apprentissage neuronal de déviation, où les scores d’anomalie des échantillons normaux sont contraints à s’approcher de scores scalaires tirés de la loi a priori, tandis que les scores des exemples d’anomalies sont forcés à présenter des écarts statistiquement significatifs par rapport à ces scores échantillonnés, notamment dans la queue supérieure. En outre, notre modèle est optimisé pour apprendre des représentations fines de la normalité et de l’anormalité grâce à une méthode d’apprentissage de déviation dans des sous-espaces de caractéristiques basée sur le multiple-instance-learning avec top-K, permettant ainsi des représentations plus généralisables. Des expériences approfondies sur neuf benchmarks réels de détection d’anomalies dans des images montrent que notre modèle est nettement plus efficace en termes d’échantillons et plus robuste, et qu’il surpasse significativement les méthodes de pointe dans les scénarios à ensemble fermé comme à ensemble ouvert. De plus, notre modèle offre une capacité d’explication naturelle, résultant de son apprentissage des scores d’anomalie guidé par une loi a priori. Le code et les jeux de données sont disponibles à l’adresse : https://git.io/DevNet.