HyperAIHyperAI
il y a 3 mois

Exploration de prototypes normaux intrinsèques au sein d'une seule image pour une détection d'anomalies universelle

Luo, Wei, Cao, Yunkang, Yao, Haiming, Zhang, Xiaotian, Lou, Jianan, Cheng, Yuqi, Shen, Weiming, Yu, Wenyong
Exploration de prototypes normaux intrinsèques au sein d'une seule image pour une détection d'anomalies universelle
Résumé

La détection d’anomalies (AD) est essentielle pour l’inspection industrielle, mais les méthodes existantes s’appuient généralement sur une « comparaison » des images de test aux références normales issues d’un ensemble d’entraînement. Toutefois, les variations d’apparence et de positionnement rendent souvent complexe l’alignement de ces références avec l’image de test, ce qui limite la précision de la détection. Nous observons que la plupart des anomalies se manifestent sous forme de variations locales, ce qui signifie qu’au sein même des images anormales, des informations normales restent pertinentes. Nous affirmons que ces informations sont utiles et peuvent être mieux alignées avec les anomalies, car à la fois les anomalies et les informations normales proviennent de la même image. Par conséquent, au lieu de s’appuyer sur une normalité externe tirée de l’ensemble d’entraînement, nous proposons INP-Former, une nouvelle méthode qui extrait directement des prototypes normaux intrinsèques (INPs) à partir de l’image de test. Plus précisément, nous introduisons un extracteur d’INPs, qui combine linéairement des tokens normaux pour représenter les INPs. Nous proposons également une perte d’cohérence des INPs afin de garantir que ceux-ci représentent fidèlement la normalité pour l’image de test. Ces INPs guident ensuite un décodeur guidé par les INPs pour reconstruire uniquement les tokens normaux, les erreurs de reconstruction servant de scores d’anomalie. En outre, nous proposons une perte de miniage doux (Soft Mining Loss) afin de privilégier les échantillons difficiles à optimiser pendant l’entraînement. INP-Former atteint des performances de pointe dans les tâches d’AD à une seule classe, à plusieurs classes et en peu d’exemples sur les jeux de données MVTec-AD, VisA et Real-IAD, se positionnant ainsi comme une solution polyvalente et universelle pour la détection d’anomalies. Notamment, INP-Former démontre également une certaine capacité à la détection d’anomalies en zéro-shot. Le code est disponible à l’adresse : https://github.com/luow23/INP-Former.