HyperAIHyperAI
vor 17 Tagen

AnomalyDINO: Steigerung der patchbasierten Few-shot-Anomalieerkennung mit DINOv2

Simon Damm, Mike Laszkiewicz, Johannes Lederer, Asja Fischer
AnomalyDINO: Steigerung der patchbasierten Few-shot-Anomalieerkennung mit DINOv2
Abstract

Neuere Fortschritte in multimodalen Grundmodelle haben neue Maßstäbe für die Few-Shot-Anomalieerkennung gesetzt. Diese Arbeit untersucht, ob hochwertige visuelle Merkmale allein ausreichen, um bestehende State-of-the-Art-Vision-Language-Modelle zu überbieten. Wir bejahen diese Frage, indem wir DINOv2 für One-Shot- und Few-Shot-Anomalieerkennung anpassen, wobei der Fokus auf industrielle Anwendungen gerichtet ist. Wir zeigen, dass dieser Ansatz nicht nur bestehende Methoden erreicht, sondern in vielen Szenarien sogar übertrifft. Unser vorgeschlagener vision-only-Ansatz, AnomalyDINO, folgt dem etablierten Patch-level Deep Nearest Neighbor-Paradigma und ermöglicht sowohl die Bild-level-Anomalievorhersage als auch die Pixel-level-Anomalie-Segmentierung. Der Ansatz ist methodisch einfach und trainingsfrei und benötigt somit keinerlei zusätzliche Daten für Fine-Tuning oder Meta-Learning. Trotz seiner Einfachheit erreicht AnomalyDINO State-of-the-Art-Ergebnisse bei One-Shot- und Few-Shot-Anomalieerkennung (beispielsweise steigert sich die One-Shot-Leistung auf MVTec-AD von 93,1 % AUROC auf 96,6 %). Die geringe Überhead-Komplexität, kombiniert mit der herausragenden Few-Shot-Leistung, macht AnomalyDINO zu einem starken Kandidaten für eine schnelle Implementierung, beispielsweise in industriellen Kontexten.