DRAEM – Ein diskriminativ trainiertes Rekonstruktionsembedding für die Oberflächenanomalieerkennung

Die visuelle Oberflächenanomalieerkennung zielt darauf ab, lokale Bildregionen zu identifizieren, die sich signifikant von einem normalen Erscheinungsbild unterscheiden. Moderne Ansätze zur Oberflächenanomalieerkennung basieren auf generativen Modellen, die normale Bereiche präzise rekonstruieren, jedoch an Anomalien scheitern. Diese Methoden werden ausschließlich an anomalienfreien Bildern trainiert und erfordern häufig handgefertigte Nachverarbeitungsschritte zur Lokalisierung von Anomalien, was eine Optimierung der Merkmalsextraktion für maximale Erkennungsfähigkeit verhindert. Neben dem rekonstruktiven Ansatz betrachten wir die Oberflächenanomalieerkennung primär als ein diskriminatives Problem und stellen ein diskriminativ trainiertes Rekonstruktionsanomalie-Embedding-Modell (DRAEM) vor. Das vorgeschlagene Verfahren lernt eine gemeinsame Darstellung eines anomalienbehafteten Bildes und seiner anomalienfreien Rekonstruktion, während es gleichzeitig eine Entscheidungsgrenze zwischen normalen und anomalienbehafteten Beispielen erlernt. Dadurch ermöglicht die Methode eine direkte Lokalisierung von Anomalien ohne zusätzliche, komplizierte Nachverarbeitung des Netzwerkoutputs und kann mit einfachen und allgemeinen Simulationsansätzen für Anomalien trainiert werden. Auf dem anspruchsvollen MVTec-Anomalieerkennungsdatensatz übertrifft DRAEM die derzeitigen state-of-the-art unsupervisierten Methoden deutlich und erzielt auf dem weit verbreiteten DAGM-Datensatz für Oberflächenfehlererkennung eine Erkennungsleistung, die nahe an der von vollständig überwachten Methoden liegt, und übertrifft diese dabei deutlich in der Lokalisierungsgenauigkeit.