Untersuchung von intrinsischen Normalprototypen innerhalb eines einzelnen Bildes für universelle Anomalieerkennung

Anomalieerkennung (AD) ist für die industrielle Inspektion von entscheidender Bedeutung, wobei bestehende Methoden typischerweise auf einem „Vergleich“ von Testbildern mit normalen Referenzen aus einem Trainingsdatensatz basieren. Allerdings erschweren oft auftretende Veränderungen in der Erscheinung und Positionierung die Ausrichtung dieser Referenzen mit dem Testbild, was die Erkennungsgenauigkeit einschränkt. Wir beobachten, dass sich die meisten Anomalien als lokale Abweichungen manifestieren, was bedeutet, dass auch innerhalb anormaler Bilder wertvolle normale Informationen erhalten bleiben. Wir argumentieren, dass diese Informationen nützlich sind und möglicherweise besser mit den Anomalien korrelieren, da sowohl die Anomalien als auch die normalen Informationen aus demselben Bild stammen. Daher schlagen wir INP-Former, eine neuartige Methode, vor, die Intrinsic Normal Prototypes (INPs) direkt aus dem Testbild extrahiert, anstatt sich auf externe Normalität aus dem Trainingsdatensatz zu verlassen. Konkret führen wir den INP-Extractor ein, der normale Tokens linear kombiniert, um INPs darzustellen. Weiterhin schlagen wir eine INP-Kohärenzverlustfunktion vor, um sicherzustellen, dass die INPs die Normalität des Testbildes treu widerspiegeln. Diese INPs leiten dann den INP-gesteuerten Decoder an, nur normale Tokens wiederherzustellen, wobei die Rekonstruktionsfehler als Anomalie-Scores dienen. Zusätzlich schlagen wir eine Soft-Mining-Verlustfunktion vor, um schwierig zu optimierende Beispiele während des Trainings zu priorisieren. INP-Former erreicht eine state-of-the-art-Leistung bei ein- und mehrklassigen sowie few-shot-AD-Aufgaben auf den Datensätzen MVTec-AD, VisA und Real-IAD und positioniert sich damit als vielseitige und universelle Lösung für die Anomalieerkennung. Bemerkenswerterweise zeigt INP-Former zudem gewisse Fähigkeiten für zero-shot-AD. Der Quellcode ist verfügbar unter: https://github.com/luow23/INP-Former.