CutPaste: Selbstüberwachtes Lernen für die Anomalieerkennung und -lokalisierung

Wir zielen darauf ab, ein hochleistungsfähiges Modell für Defekterkennung zu entwickeln, das unbekannte anomale Muster in Bildern erkennt, ohne auf anomales Trainingsdaten angewiesen zu sein. Dazu schlagen wir einen zweistufigen Rahmen für die Konstruktion von Anomalie-Detektoren vor, der ausschließlich mit normalen Trainingsdaten arbeitet. Zunächst lernen wir selbstüberwachte tiefe Darstellungen und bauen anschließend einen generativen One-Class-Klassifikator auf diesen gelernten Darstellungen auf. Die Darstellungen werden durch die Klassifizierung normaler Daten aus dem CutPaste-Ansatz erlernt, einer einfachen Daten-Augmentierungsstrategie, bei der ein Bildpatch ausgeschnitten und an einer zufälligen Stelle eines größeren Bildes wieder eingefügt wird. Unsere empirische Studie auf dem MVTec-Anomalieerkennungs-Datensatz zeigt, dass der vorgeschlagene Algorithmus allgemein einsetzbar ist und verschiedene Arten realer Defekte effektiv erkennen kann. Bei der Lernung von Darstellungen von Grund auf erreichen wir eine Verbesserung gegenüber vorherigen Ansätzen um 3,1 AUC. Durch Transfer-Lernen auf vortrainierten Darstellungen auf ImageNet erreichen wir eine neue SOTA (State-of-the-Art)-Leistung von 96,6 AUC. Schließlich erweitern wir den Rahmen, um Darstellungen aus Bildpatches zu lernen und zu extrahieren, sodass die Lokalisierung defekter Bereiche ohne Annotationen während des Trainings möglich wird.