DRAEM – Ein diskriminativ trainiertes Rekonstruktions-Embedding für die Oberflächenanomalieerkennung

Die visuelle Oberflächenanomalieerkennung zielt darauf ab, lokale Bildbereiche zu identifizieren, die sich signifikant von der normalen Erscheinung unterscheiden. Rezent entwickelte Methoden zur Oberflächenanomalieerkennung stützen sich auf generative Modelle, um normale Bereiche präzise zu rekonstruieren und Anomalien hingegen zu versagen. Diese Ansätze werden ausschließlich an anomaliefreien Bildern trainiert und erfordern häufig handgefertigte Nachbearbeitungsschritte zur Lokalisierung von Anomalien, was die Optimierung der Merkmalsextraktion für maximale Erkennungsfähigkeit verhindert. Neben dem rekonstruktiven Ansatz stellen wir die Oberflächenanomalieerkennung primär als ein diskriminatives Problem dar und schlagen ein diskriminativ trainiertes Rekonstruktionsanomalie-Embedding-Modell (DRAEM) vor. Das vorgeschlagene Verfahren lernt eine gemeinsame Darstellung eines anomalen Bildes und seiner anomaliefreien Rekonstruktion gleichzeitig mit der Lernung einer Entscheidungsgrenze zwischen normalen und anomalen Beispielen. Dadurch ermöglicht die Methode eine direkte Lokalisierung von Anomalien ohne zusätzliche, komplizierte Nachbearbeitung der Netzwerk-Ausgabe und kann mit einfachen und allgemeinen Simulationen von Anomalien trainiert werden. Auf dem anspruchsvollen MVTec-Anomalieerkennungs-Datensatz übertrifft DRAEM die derzeitige State-of-the-Art-Methoden im unüberwachten Lernen deutlich und erzielt sogar eine Erkennungsleistung, die der von vollständig überwachten Methoden auf dem weit verbreiteten DAGM-Datensatz für Oberflächenfehlererkennung nahekommt, wobei es insbesondere in der Lokalisierungsgenauigkeit erheblich übertrifft.