HyperAIHyperAI
vor 17 Tagen

Dual-Modeling-Entkoppelte Distillation für die überwachungsfreie Anomalieerkennung

Xinyue Liu, Jianyuan Wang, Biao Leng, Shuo Zhang
Dual-Modeling-Entkoppelte Distillation für die überwachungsfreie Anomalieerkennung
Abstract

Wissensdistillation basierend auf Student-Teacher-Netzwerken stellt eine der etablierten Lösungsansätze für die anspruchsvolle Aufgabe der unsupervisierten Anomalieerkennung dar. Sie nutzt die Unterschiede in den Repräsentationsfähigkeiten zwischen Lehrer- und Schülernetzwerk zur Lokalisierung von Anomalien. Allerdings kann eine übermäßige Generalisierung des Schülernetzwerks gegenüber dem Lehrernetzwerk zu vernachlässigbaren Unterschieden in den Repräsentationen von Anomalien führen, was die Detektionseffektivität beeinträchtigt. Bestehende Methoden adressieren das Risiko einer Übergeneralisierung, indem sie strukturell unterschiedliche Schüler- und Lehrernetzwerke einsetzen oder explizit die übertragene Information aus inhaltlicher Sicht erweitern. Diese Ansätze führen jedoch zwangsläufig zu einer erhöhten Wahrscheinlichkeit von Unteranpassung (Underfitting) des Schülernetzwerks und zu schlechten Anomalieerkennungsergebnissen in Anomaliezentren oder -rändern. In diesem Artikel stellen wir Dual-Modeling Decouple Distillation (DMDD) für die unsupervisierte Anomalieerkennung vor. In DMDD wird ein entkoppeltes Student-Teacher-Netzwerk vorgeschlagen, das die ursprünglichen Schülermerkmale in Normalitäts- und Anomalitätsmerkmale entkoppelt. Darüber hinaus führen wir eine Dual-Modeling-Distillation basierend auf Normal-Anomalie-Bildpaaren ein, die die Normalitätsmerkmale von Anomaliebildern sowie die Lehrermerkmale der entsprechenden Normalbilder anpasst und somit die Distanz zwischen den Anomalitätsmerkmalen und den Lehrermerkmalen in Anomaliebereichen vergrößert. Durch die Synthese dieser beiden Distillationsszenarien erreichen wir eine Anomalieerkennung, die sowohl auf den Rändern als auch auf den Zentren von Anomalien fokussiert ist. Schließlich wird ein Multi-Perception-Segmentierungsnetzwerk vorgeschlagen, um eine gezielte Fusionsanomaliekarte basierend auf mehreren Aufmerksamkeitsmechanismen zu erzielen. Experimentelle Ergebnisse auf dem MVTec AD-Datensatz zeigen, dass DMDD die bisherigen State-of-the-Art-Leistungen von auf Wissensdistillation basierenden Methoden übertrifft und eine Pixel-Level-AUC von 98,85 % sowie eine PRO-Metrik von 96,13 % erreicht.