Reconstruction à partir d'une image d'arête combinée à la différence de couleur et de gradient pour la détection d'anomalies de surface industrielle

Les méthodes basées sur la reconstruction sont largement explorées dans le domaine de la détection d’anomalies visuelles industrielles. Ces approches reposent généralement sur la capacité du modèle à bien reconstruire les motifs normaux tout en échouant à reconstruire les anomalies, permettant ainsi de détecter ces dernières à partir de l’évaluation des erreurs de reconstruction. Toutefois, en pratique, il est souvent difficile de contrôler la frontière de généralisation du modèle. Un modèle doté d’une capacité de généralisation excessive peut même reconstruire correctement les régions anormales, rendant ainsi leur distinction moins évidente, tandis qu’un modèle à faible capacité de généralisation ne parvient pas à reconstruire les composantes à haute fréquence variables présentes dans les régions normales, ce qui entraîne inévitablement des faux positifs. Pour surmonter ce problème, nous proposons un nouveau réseau de reconstruction, appelé EdgRec, qui reconstruit l’image RGB d’origine à partir de ses contours en niveaux de gris. Cette reconstruction est réalisée à l’aide d’un auto-encodeur débruitant de type UNet munis de connexions de saut (skip connections), permettant une préservation efficace des informations à haute fréquence présentes dans l’image d’origine. Par ailleurs, la tâche de restauration proposée force le réseau à mémoriser les informations basse fréquence et chromatiques propres aux données normales. En outre, la conception débruitante empêche le modèle de copier directement les composantes à haute fréquence de l’image d’origine. Pour évaluer les anomalies, nous introduisons également une nouvelle fonction d’évaluation interprétable, conçue à la main, qui prend en compte à la fois les différences de couleur et de gradient. Notre méthode obtient des résultats compétitifs sur le benchmark exigeant MVTec AD (97,8 % pour la détection et 97,7 % pour la localisation, en termes d’AUROC). En outre, nous menons des expériences sur le jeu de données MVTec 3D-AD et montrons des résultats convaincants en utilisant uniquement des images RGB. Le code source sera disponible à l’adresse suivante : https://github.com/liutongkun/EdgRec.