HyperAIHyperAI
il y a 17 jours

Détection d'anomalies par résilience aux perturbations basée sur le score

{Jong Pil Yun, Sangmoon Lee, Taehan Lee, Jonghyeon Lee, Woosang Shin}
Détection d'anomalies par résilience aux perturbations basée sur le score
Résumé

La détection d’anomalies non supervisée est largement étudiée dans le domaine industriel, en raison de la difficulté d’obtenir des données anormales. En particulier, les méthodes de détection basées sur la reconstruction peuvent offrir une solution viable lorsque l’utilisation de connaissances externes — telles que des jeux de données supplémentaires ou des modèles pré-entraînés — n’est pas possible. Toutefois, ces approches basées sur la reconstruction souffrent d’une performance de détection limitée. Récemment, les modèles basés sur le score, également appelés modèles de diffusion débruitants, ont démontré une qualité élevée des échantillons générés. Dans cet article, nous proposons une nouvelle méthode non supervisée de détection d’anomalies exploitant ce modèle basé sur le score. Cette méthode promet de bonnes performances sans nécessiter de connaissances externes. Le score, défini comme le gradient de la log-vraisemblance, possède une propriété utile pour la détection d’anomalies : les échantillons situés sur le variété des données peuvent être instantanément restaurés par le score, même après une perturbation aléatoire. Nous appelons cette propriété « résilience aux perturbations basée sur le score ». À l’inverse, les échantillons s’écartant de cette variété ne peuvent pas être restaurés de la même manière. La variation de cette résilience en fonction de la position de l’échantillon peut servir d’indicateur pour distinguer les anomalies. Cette affirmation est justifiée à partir d’une perspective géométrique. Notre méthode obtient des performances supérieures sur trois jeux de données standardisés pour la détection d’anomalies industrielles. Plus précisément, sur le jeu de données MVTec AD, nous atteignons un score AUROC au niveau image de 97,7 % et un score AUROC au niveau pixel de 97,4 %, surpassant ainsi les méthodes antérieures ne faisant pas appel à des connaissances externes.