Bloc d'attention convolutive prédictif auto-supervisé pour la détection d'anomalies

La détection d’anomalies est généralement abordée comme un problème de classification à une seule classe, dans lequel les modèles ne peuvent apprendre qu’à partir d’échantillons normaux durant l’entraînement, tout en étant évalués sur des échantillons normaux et anormaux lors du test. Parmi les approches efficaces pour la détection d’anomalies, une catégorie notable repose sur la prédiction d’informations masquées (par exemple, des patches, des trames futures, etc.), en exploitant l’erreur de reconstruction par rapport à ces informations masquées comme mesure d’anomalie. Contrairement aux méthodes connexes, nous proposons d’intégrer cette fonctionnalité basée sur la reconstruction dans un nouveau bloc architectural auto-supervisé. Ce bloc auto-supervisé est générique et peut être facilement intégré à diverses méthodes d’état de l’art pour la détection d’anomalies. Notre bloc commence par une couche convolutive utilisant des filtres à dilatation, où la région centrale du champ réceptif est masquée. Les cartes d’activation résultantes sont ensuite passées par un module d’attention sur les canaux. Le bloc est doté d’une fonction de perte qui minimise l’erreur de reconstruction par rapport à la région masquée dans le champ réceptif. Nous démontrons la généralité de notre bloc en l’intégrant à plusieurs cadres d’état de l’art pour la détection d’anomalies sur images et vidéos, fournissant des preuves empiriques montrant des améliorations significatives des performances sur les jeux de données MVTec AD, Avenue et ShanghaiTech. Nous mettons notre code à disposition en open source à l’adresse suivante : https://github.com/ristea/sspcab.