Exemple dur-aware et correspondance mutuelle de modèles pour la détection d'anomalies industrielles

Les détecteurs d’anomalies sont largement utilisés dans le domaine de la fabrication industrielle pour détecter et localiser des défauts inconnus dans des images de requête. Ces détecteurs sont entraînés à partir d’échantillons sans anomalie et ont réussi à distinguer avec succès les anomalies des échantillons normaux dans la majorité des cas. Toutefois, les exemples normaux difficiles (hard-normal) sont dispersés et éloignés de la majorité des échantillons normaux, ce qui les rend souvent confondus avec des anomalies par les méthodes existantes. Pour résoudre ce problème, nous proposons HETMM (Hard-normal Example-aware Template Mutual Matching), un cadre efficace visant à construire une frontière de décision robuste basée sur des prototypes. Plus précisément, HETMM utilise une méthode proposée, l’ATMM (Affine-invariant Template Mutual Matching), pour atténuer les effets des transformations affines ainsi que ceux des exemples normaux faciles. En effectuant une correspondance mutuelle au niveau des pixels entre les prototypes à l’intérieur des espaces de recherche par patchs entre l’image de requête et l’ensemble de modèles (template set), l’ATMM permet une distinction précise entre les exemples normaux difficiles et les anomalies, atteignant ainsi des taux faibles de faux positifs et de détections manquées. Par ailleurs, nous introduisons également PTS (Prototype-based Template Selection), une méthode de compression de l’ensemble de modèles original afin d’accélérer le traitement. PTS sélectionne les centres de clusters ainsi que les exemples normaux difficiles afin de préserver la frontière de décision initiale, permettant à un ensemble réduit (de seulement 60 éléments) d’atteindre des performances comparables à celles de l’ensemble original. Des expérimentations étendues montrent que HETMM surpasse les méthodes de pointe, tandis qu’un ensemble de modèles réduit de 60 éléments permet d’obtenir des performances compétitives avec une vitesse d’inférence en temps réel (environ 26,1 FPS) sur une GPU Quadro 8000 RTX. HETMM est entièrement sans entraînement (training-free) et peut être mis à jour dynamiquement en insérant directement de nouveaux échantillons dans l’ensemble de modèles, offrant ainsi une solution efficace aux problèmes d’apprentissage incrémental rencontrés dans les environnements de fabrication industrielle.