Projection adaptative contrainte avec caractéristiques pré-entraînées pour la détection d'anomalies

La détection d’anomalies vise à distinguer les échantillons anormaux des échantillons normaux, et les réseaux pré-entraînés s’avèrent prometteurs pour cette tâche. Toutefois, l’adaptation des caractéristiques pré-entraînées comporte le risque de collapsus de motif lors de l’entraînement fin sur des données à une seule classe. Dans cet article, nous proposons un cadre de détection d’anomalies appelé projection adaptative contrainte avec caractéristiques pré-entraînées (CAP). En combinant des caractéristiques pré-entraînées, nous concevons une tête de projection linéaire simple appliquée à un échantillon spécifique et à ses k représentations normales pré-entraînées les plus similaires, afin d’adapter les caractéristiques. Une attention auto-réformée est utilisée pour exploiter les relations internes parmi les caractéristiques sémantiques d’une seule classe. Une fonction de perte est proposée afin d’éviter tout collapsus de motif potentiel. Plus précisément, elle prend en compte la similarité entre un échantillon spécifique et sa représentation normale adaptée correspondante, tout en intégrant un terme de contrainte qui aligne légèrement les espaces pré-entraînés et adaptés. Notre méthode atteint des performances de détection d’anomalies de pointe sur des benchmarks de détection d’anomalies sémantiques et sensorielles, notamment 96,5 % d’AUROC sur le jeu de données CIFAR-100, 97,0 % d’AUROC sur CIFAR-10 et 89,9 % d’AUROC sur MvTec.