Ein Einheitliches Modell für die Mehrklassen-Anomalieerkennung

Trotz des raschen Fortschritts bei der unüberwachten Anomalieerkennung erfordern bestehende Methoden das Training separater Modelle für verschiedene Objekte. In dieser Arbeit stellen wir UniAD vor, eine Methode, die die Anomalieerkennung für mehrere Klassen mit einem einheitlichen Framework bewältigt. Unter solch einer anspruchsvollen Einstellung können populäre Rekonstruktionsnetze in einen „identischen Abkürzungsweg“ verfallen, bei dem sowohl normale als auch anomale Stichproben gut rekonstruiert werden und daher Ausreißer nicht identifiziert werden. Um dieses Hindernis zu überwinden, führen wir drei Verbesserungen ein. Erstens überarbeiten wir die Formulierungen der vollständig verbundenen Schicht, der Faltungs-Schicht sowie der Aufmerksamkeitsschicht und bestätigen die wichtige Rolle des Query-Embeddings (d.h., innerhalb der Aufmerksamkeitsschicht) bei der Verhinderung, dass das Netzwerk den Abkürzungsweg lernt. Wir entwickeln daher einen schichtweisen Query-Decoder, um die Modellierung der multiklassenverteilung zu unterstützen. Zweitens setzen wir ein Nachbarschaftsmaskierungsmodul für Aufmerksamkeit ein, um weitere Informationslecks von den Eingangsmerkmalen zu den rekonstruierten Ausgangsmerkmalen zu vermeiden. Drittens schlagen wir eine Strategie zur Merkmalsstörung vor, die das Modell dazu anhält, auch bei verrauschten Eingaben die korrekten Informationen wiederherzustellen. Wir evaluieren unseren Algorithmus auf den Datensätzen MVTec-AD und CIFAR-10, wo wir die Stand-of-the-Art-Alternativen um einen ausreichend großen Vorsprung übertreffen. Zum Beispiel übertreffen wir beim Lernen eines einheitlichen Modells für 15 Kategorien im MVTec-AD-Datensatz den zweiten Wettbewerber sowohl in der Anomalieerkennung (von 88,1% auf 96,5%) als auch in der Anomalielokalisierung (von 89,5% auf 96,8%). Der Code ist unter https://github.com/zhiyuanyou/UniAD verfügbar.