HyperAIHyperAI

Command Palette

Search for a command to run...

Ziel vor dem Schuss: Genauige Anomalieerkennung und Lokalisierung innerhalb einer Millisekunde mittels kaskadierter Patch-Abfrage

Hanxi Li Jianfei Hu Bo Li Hao Chen Yongbin Zheng Chunhua Shen

Zusammenfassung

In dieser Arbeit untersuchen wir erneut die „Matching“-Natur des Anomalieerkennung (Anomaly Detection, AD) und stellen einen neuen AD-Framework vor, der gleichzeitig neue Rekorde hinsichtlich der AD-Genauigkeit und eine deutlich höhere Laufgeschwindigkeit erreicht. Im Rahmen dieses Frameworks wird das Anomalieerkennungsproblem durch ein kaskadenartiges Patch-Abfrageverfahren gelöst, bei dem die nächsten Nachbarn für jeden Test-Bildpatch auf fein-granularer Weise von grob bis fein abgerufen werden. Gegeben ein Testsample werden zunächst die K ähnlichsten Trainingsbilder basierend auf einem robusten Histogramm-Matching-Prozess ausgewählt. Anschließend wird für jeden Test-Patch der nächstgelegene Nachbar über die ähnlichen geometrischen Positionen innerhalb jener „globalen nächsten Nachbarn“ mithilfe eines sorgfältig trainierten lokalen Metrik-Modells ermittelt. Schließlich wird der Anomalie-Score jedes Test-Bildpatches anhand der Distanz zu seinem „lokalen nächsten Nachbarn“ sowie der „nicht-Hintergrund“-Wahrscheinlichkeit berechnet. Der vorgeschlagene Ansatz wird in dieser Arbeit als „Cascade Patch Retrieval“ (CPR) bezeichnet. Im Gegensatz zu herkömmlichen, auf Patch-Matching basierenden AD-Algorithmen wählt CPR zunächst geeignete „Ziele“ (Referenzbilder und Positionen) aus, bevor die eigentliche „Abfrage“ (Patch-Matching) erfolgt. Auf den allgemein anerkannten Datensätzen MVTec AD, BTAD und MVTec-3D AD übertrifft der vorgeschlagene Algorithmus alle vergleichbaren State-of-the-Art-Methoden signifikant, gemessen an verschiedenen AD-Metrik-Kriterien. Darüber hinaus zeichnet sich CPR durch äußerste Effizienz aus: Bei Standard-Einstellungen läuft es mit einer Geschwindigkeit von 113 FPS, während die vereinfachte Version eines Bildes in weniger als 1 ms verarbeitet – mit einer vernachlässigbaren Abnahme der Genauigkeit. Der Quellcode von CPR ist unter https://github.com/flyinghu123/CPR verfügbar.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp