Distillation d’affinité contextuelle pour la détection d’anomalies dans les images

Les travaux antérieurs sur la détection d’anomalies industrielles non supervisée se concentrent principalement sur les anomalies structurelles locales, telles que les fissures ou les contaminations de couleur. Bien qu’ils atteignent des performances de détection significativement élevées pour ce type d’anomalie, ils rencontrent des difficultés face aux anomalies logiques, qui violent les dépendances à longue portée, comme un objet normal placé dans une position incorrecte. Dans ce papier, s’appuyant sur les travaux antérieurs sur la distillation de connaissances, nous proposons d’utiliser deux élèves (local et global) afin de mieux imiter le comportement du professeur. L’élève local, principalement utilisé dans les études antérieures, se concentre sur la détection des anomalies structurelles, tandis que l’élève global se consacre aux anomalies logiques. Pour renforcer davantage l’apprentissage de l’élève global afin de capturer efficacement les dépendances à longue portée, nous avons conçu un bloc de condensation du contexte global (GCCB) et proposé une perte d’affinité contextuelle pour l’entraînement des élèves ainsi que pour le scoring des anomalies. Les résultats expérimentaux montrent que la méthode proposée n’a pas besoin de techniques d’entraînement complexes et atteint une nouvelle performance de pointe sur le jeu de données MVTec LOCO AD.