HyperAIHyperAI
vor 2 Monaten

Dinomalie: Die Philosophie von Weniger ist Mehr in der Mehrklassen-Unüberwachten Anomalieerkennung

Guo, Jia ; Lu, Shuai ; Zhang, Weihang ; Chen, Fang ; Li, Huiqi ; Liao, Hongen
Dinomalie: Die Philosophie von Weniger ist Mehr in der Mehrklassen-Unüberwachten
Anomalieerkennung
Abstract

Kürzliche Studien haben ein praktisches Szenario der unüberwachten Anomalieerkennung (UAD) hervorgehoben, bei dem ein einheitliches Modell für mehrklassige Bilder entwickelt wird. Trotz verschiedener Fortschritte in der Bewältigung dieser anspruchsvollen Aufgabe bleibt die Erkennungsleistung im mehrklassigen Szenario weit hinter den leistungsstärksten klassengetrennten Modellen zurück. Unser Forschungsziel ist es, diese erhebliche Leistungsunterschied zu überbrücken. In diesem Artikel stellen wir einen minimalistischen, rekonstruktionsbasierten Rahmen zur Anomalieerkennung vor, nämlich Dinomaly, der sich ausschließlich auf reine Transformer-Architekturen stützt und ohne komplexe Designs, zusätzliche Module oder spezialisierte Tricks auskommt. Basierend auf diesem leistungsfähigen Rahmen, der nur aus Aufmerksamkeitsmechanismen (Attentions) und Multilayer-Perceptrons (MLPs) besteht, haben wir vier einfache Komponenten identifiziert, die für die mehrklassige Anomalieerkennung entscheidend sind: (1) Grundlegende Transformer, die universelle und diskriminative Merkmale extrahieren, (2) Rauschenflaschenhals (Noisy Bottleneck), bei dem vorgängige Dropout-Mechanismen alle Rauscheinjektionstricks durchführen, (3) Lineare Aufmerksamkeit (Linear Attention), die natürlicherweise nicht fokussieren kann, und (4) Lockerer Wiederherstellungsvorgang (Loose Reconstruction), der keine Schicht-zu-Schicht- oder Punkt-zu-Punkt-Wiederherstellung erzwingt. Wir führen umfangreiche Experimente an verschiedenen gängigen Benchmarks für Anomalieerkennung durch, darunter MVTec-AD, VisA und Real-IAD. Unsere vorgeschlagene Methode Dinomaly erreicht beeindruckende Bild-Level-AUROC-Werte von 99,6 %, 98,7 % und 89,3 % auf den drei Datensätzen jeweils. Diese Ergebnisse sind nicht nur überlegen zu den fortschrittlichsten mehrklassigen UAD-Methoden, sondern erreichen auch die besten klassengetrennten UAD-Rekorde.