Modules d'attention améliorent la détection d'anomalies au niveau image pour l'inspection industrielle : une étude de cas sur DifferNet

Dans le cadre de l’inspection visuelle industrielle (semi-)automatisée, les approches fondées sur l’apprentissage, notamment les réseaux neuronaux profonds, permettent d’analyser des défauts visuels dont les motifs sont très petits au niveau pixel, notamment sur des images haute résolution. L’apparition de ces défauts rares explique la nécessité générale de corpus de données étiquetées. Pour atténuer ce problème et faire progresser l’état de l’art en inspection visuelle non supervisée, ce travail propose une solution basée sur DifferNet et enrichie par des modules d’attention : AttentDifferNet. Cette approche améliore les capacités de détection et de classification au niveau image sur trois jeux de données standardisés pour la détection d’anomalies visuelles en inspection industrielle : InsPLAD-fault, MVTec AD et Semiconductor Wafer. En comparaison avec l’état de l’art, AttentDifferNet obtient des résultats supérieurs, une amélioration mise en évidence tout au long de notre étude qualitative et quantitative. L’évaluation quantitative révèle une amélioration moyenne de 1,77 ± 0,25 point de pourcentage en AUROC global par rapport à DifferNet sur l’ensemble des trois jeux de données, atteignant ainsi des résultats de pointe (SOTA) sur InsPLAD-fault, un jeu de données d’inspection industrielle dans des conditions réelles (in-the-wild). Étant donné que nos variantes d’AttentDifferNet montrent un fort potentiel dans le contexte des approches actuellement explorées, nous proposons une base (baseline) qui met en évidence l’importance cruciale de l’attention pour la détection d’anomalies industrielles, tant dans des environnements contrôlés que dans des conditions réelles.