Multiskalennetzwerk zur Merkmalsrekonstruktion für die industrielle Anomalieerkennung
Unüberwachte Anomalieerkennungstechniken, die ohne vorherige Kenntnis über Anomalien arbeiten, haben aufgrund ihrer Anpassungsfähigkeit und Generalisierbarkeit erhebliche Aufmerksamkeit in der industriellen Inspektion erfahren. Daher werden wissensbasierte Computer-Vision-Techniken breit angewendet, um ungewöhnliche Bildmuster zu identifizieren. Doch reale Anwendungen in Echtzeit stellen Herausforderungen dar, wie beispielsweise begrenzte Anzahl an anomalen Proben, unzureichendes Defektwissen und komplexe Hintergrundstrukturen. Diese Faktoren führen zu Schwierigkeiten bei der präzisen Identifizierung von Defektregionen, wobei herkömmliche Autoencoder-Netzwerke häufig an ihre Grenzen stoßen. Um diese Einschränkungen zu überwinden, schlagen wir ein mehrskaliges Merkmalsrekonstruktionsnetzwerk (MSFR) vor, das speziell für Szenarien mit Domänenverschiebung entwickelt wurde. Unser Ansatz nutzt ein pyramidenförmiges Vision-Transformer-Netzwerk (PVTN), um mehrskalige Merkmalskarten zu rekonstruieren und dabei diskriminative Merkmale auf verschiedenen Skalen zu erfassen. Zudem extrahiert ein vortrainiertes Modul mehrstufige Merkmale auf derselben Skala, und ein speziell entwickeltes Merkmalsübereinstimmungsmodul verbessert die Genauigkeit durch eine erhöhte Übereinstimmungswahrscheinlichkeit zwischen den Merkmalen. Die MSFR-Strategie übertrifft herkömmliche Autoencoder, indem sie informationsreiche Pixel-Level-Daten auf mehreren Ebenen filtert. Empirische Evaluierungen wurden an Benchmark-Datensätzen wie MVTec AD und AeBAD-S durchgeführt. Zudem zeigt eine umfassende Ablationsstudie die Wirksamkeit und Praktikabilität des vorgeschlagenen MSFR-Ansatzes für Aufgaben der industriellen Anomalieerkennung. Die experimentellen Ergebnisse belegen, dass das vorgeschlagene Modell neuere Ansätze signifikant übertrifft und somit besonders gut für reale industrielle Anwendungen, insbesondere im Fertigungssektor, geeignet ist.