GLAD: Hin zum besseren Rekonstruktionsprozess durch globale und lokale adaptive Diffusionsmodelle für unsupervisierte Anomalieerkennung

Diffusionsmodelle haben eine überlegene Leistung bei Aufgaben der unsupervisierten Anomalieerkennung gezeigt. Da sie ausschließlich mit normalen Daten trainiert werden, neigen sie dazu, die normalen Entsprechungen von Testbildern bei hinzugefügtem Rauschen zu rekonstruieren. Diese Ansätze behandeln jedoch alle potenziellen Anomalien gleich, was zwei Hauptprobleme verursacht. Aus globaler Perspektive ist die Schwierigkeit der Rekonstruktion von Bildern mit unterschiedlichen Anomalien ungleichmäßig verteilt. Daher schlagen wir vor, anstelle einer einheitlichen Einstellung für alle Proben für jede einzelne Probe einen spezifischen Entrauschungsschritt vorherzusagen, indem wir die Differenz zwischen dem Bildinhalt und den aus den Diffusionsmodellen extrahierten Prior-Informationen bewerten. Aus lokaler Perspektive unterscheidet sich die Rekonstruktion anormaler Regionen von normalen Bereichen sogar innerhalb desselben Bildes. Theoretisch prognostiziert das Diffusionsmodell für jeden Schritt einen Rauschterm, der typischerweise einer Standard-Gauß-Verteilung folgt. Aufgrund der Differenz zwischen der Anomalie und ihrem potenziellen normalen Gegenstück wird der vorhergesagte Rauschterm in anormalen Regionen jedoch zwangsläufig von der Standard-Gauß-Verteilung abweichen. Um dies zu adressieren, schlagen wir vor, während des Trainings synthetische anormale Proben einzuführen, um die Diffusionsmodelle dazu zu bringen, die Beschränkung der Standard-Gauß-Verteilung zu überwinden. Während der Inferenz wird zudem ein raumadaptive Merkmalsfusionsschema verwendet. Durch diese Modifikationen stellen wir ein globales und lokales adaptives Diffusionsmodell (abgekürzt GLAD) für die unsupervisierte Anomalieerkennung vor, das eine ansprechende Flexibilität bietet und gleichzeitig eine anomaliefreie Rekonstruktion ermöglicht, wobei so viel normale Information wie möglich erhalten bleibt. Umfassende Experimente wurden auf drei häufig verwendeten Datensätzen zur Anomalieerkennung (MVTec-AD, MPDD und VisA) sowie auf einem integrierten Datensatz für Leiterplatten (PCB-Bank) durchgeführt, wodurch die Wirksamkeit des vorgeschlagenen Ansatzes nachgewiesen wird.