Rekonstruktion aus Kantensbild unter Kombination von Farb- und Gradientenunterschieden für die Anomalieerkennung auf industriellen Oberflächen

Rekonstruktionsbasierte Methoden werden in der industriellen visuellen Anomalieerkennung weitgehend untersucht. Solche Ansätze erfordern typischerweise, dass das Modell die normalen Muster gut rekonstruieren kann, jedoch anormalen Bereichen scheitert, wodurch Anomalien durch die Bewertung der Rekonstruktionsfehler erkannt werden können. In der Praxis ist es jedoch oft schwierig, die Generalisierungsgrenze des Modells präzise zu kontrollieren. Ein Modell mit übermäßig starker Generalisierungsfähigkeit kann selbst anormalen Regionen gut rekonstruieren, wodurch diese weniger unterscheidbar werden, während ein Modell mit schlechter Generalisierungsfähigkeit die veränderlichen hochfrequenten Komponenten in den normalen Regionen nicht korrekt rekonstruieren kann, was letztlich zu falsch-positiven Ergebnissen führt. Um dieses Problem zu bewältigen, schlagen wir ein neues Rekonstruktionsnetzwerk vor, bei dem das ursprüngliche RGB-Bild aus seinen Grauwertkanten (EdgRec) rekonstruiert wird. Dies wird durch einen UNet-artigen Rauschunterdrückungs-Autoencoder mit Skip-Verbindungen erreicht. Die Eingabekanten sowie die Skip-Verbindungen bewahren die hochfrequenten Informationen des ursprünglichen Bildes effektiv. Gleichzeitig zwingt die vorgeschlagene Wiederherstellungsaufgabe das Netzwerk, die normalen niederfrequenten und farblichen Informationen zu speichern. Darüber hinaus verhindert der Rauschunterdrückungs-Entwurf, dass das Modell die hochfrequenten Komponenten des Originalbildes direkt kopiert. Zur Bewertung von Anomalien stellen wir außerdem eine neue interpretierbare, handgefertigte Bewertungsfunktion vor, die sowohl Farb- als auch Gradientenunterschiede berücksichtigt. Unsere Methode erzielt wettbewerbsfähige Ergebnisse auf dem anspruchsvollen Benchmark MVTec AD (97,8 % für die Erkennung und 97,7 % für die Lokalisierung, AUROC). Zudem führen wir Experimente auf dem MVTec 3D-AD-Datensatz durch und zeigen überzeugende Ergebnisse unter Verwendung lediglich von RGB-Bildern. Der Quellcode wird unter https://github.com/liutongkun/EdgRec verfügbar sein.