HyperAIHyperAI
il y a 17 jours

La segmentation de parties à faible exemplaire révèle la logique compositionnelle pour la détection d’anomalies industrielles

Soopil Kim, Sion An, Philip Chikontwe, Myeongkyun Kang, Ehsan Adeli, Kilian M. Pohl, Sang Hyun Park
La segmentation de parties à faible exemplaire révèle la logique compositionnelle pour la détection d’anomalies industrielles
Résumé

Les anomalies logiques (LA) désignent des données qui violent des contraintes logiques fondamentales, par exemple la quantité, l’agencement ou la composition des composants présents dans une image. La détection précise de telles anomalies nécessite des modèles capables de raisonner sur différents types de composants à l’aide de la segmentation. Toutefois, la création d’étiquetages au niveau des pixels pour la segmentation sémantique est à la fois longue et coûteuse. Bien qu’il existe certaines méthodes antérieures de segmentation de composants en co-partage peu supervisées ou non supervisées, celles-ci échouent fréquemment sur des images contenant des objets industriels. Ces images présentent des composants aux textures et aux formes similaires, rendant une distinction précise particulièrement difficile. Dans cette étude, nous proposons un nouveau modèle de segmentation de composants pour la détection des LA, qui exploite un petit nombre d’échantillons étiquetés ainsi que des images non étiquetées partageant des contraintes logiques. Pour garantir une segmentation cohérente sur les images non étiquetées, nous utilisons une perte d’ajustement d’histogramme combinée à une perte d’entropie. Étant donné que les prédictions de segmentation jouent un rôle crucial, nous proposons d’améliorer la détection de validité des échantillons à la fois au niveau local et global en capturant des aspects clés de la sémantique visuelle à l’aide de trois mémoires : des histogrammes de classes, des embeddings de composition de composants et des représentations au niveau des patches. Pour une détection efficace des LA, nous introduisons une stratégie d’adaptation de mise à l’échelle permettant de normaliser les scores d’anomalie provenant de différentes mémoires lors de l’inférence. Des expériences étendues sur le benchmark public MVTec LOCO AD montrent que notre méthode atteint un taux d’AUROC de 98,1 % pour la détection des LA, contre 89,6 % pour les méthodes concurrentes.