Ziel vor dem Schuss: Genauige Anomalieerkennung und Lokalisierung innerhalb einer Millisekunde mittels kaskadierter Patch-Abfrage

In dieser Arbeit untersuchen wir erneut die „Matching“-Natur des Anomalieerkennung (Anomaly Detection, AD) und stellen einen neuen AD-Framework vor, der gleichzeitig neue Rekorde hinsichtlich der AD-Genauigkeit und eine deutlich höhere Laufgeschwindigkeit erreicht. Im Rahmen dieses Frameworks wird das Anomalieerkennungsproblem durch ein kaskadenartiges Patch-Abfrageverfahren gelöst, bei dem die nächsten Nachbarn für jeden Test-Bildpatch auf fein-granularer Weise von grob bis fein abgerufen werden. Gegeben ein Testsample werden zunächst die K ähnlichsten Trainingsbilder basierend auf einem robusten Histogramm-Matching-Prozess ausgewählt. Anschließend wird für jeden Test-Patch der nächstgelegene Nachbar über die ähnlichen geometrischen Positionen innerhalb jener „globalen nächsten Nachbarn“ mithilfe eines sorgfältig trainierten lokalen Metrik-Modells ermittelt. Schließlich wird der Anomalie-Score jedes Test-Bildpatches anhand der Distanz zu seinem „lokalen nächsten Nachbarn“ sowie der „nicht-Hintergrund“-Wahrscheinlichkeit berechnet. Der vorgeschlagene Ansatz wird in dieser Arbeit als „Cascade Patch Retrieval“ (CPR) bezeichnet. Im Gegensatz zu herkömmlichen, auf Patch-Matching basierenden AD-Algorithmen wählt CPR zunächst geeignete „Ziele“ (Referenzbilder und Positionen) aus, bevor die eigentliche „Abfrage“ (Patch-Matching) erfolgt. Auf den allgemein anerkannten Datensätzen MVTec AD, BTAD und MVTec-3D AD übertrifft der vorgeschlagene Algorithmus alle vergleichbaren State-of-the-Art-Methoden signifikant, gemessen an verschiedenen AD-Metrik-Kriterien. Darüber hinaus zeichnet sich CPR durch äußerste Effizienz aus: Bei Standard-Einstellungen läuft es mit einer Geschwindigkeit von 113 FPS, während die vereinfachte Version eines Bildes in weniger als 1 ms verarbeitet – mit einer vernachlässigbaren Abnahme der Genauigkeit. Der Quellcode von CPR ist unter https://github.com/flyinghu123/CPR verfügbar.