Dynamische Hinzufügung von Rauschen in einem Diffusionsmodell zur Anomalieerkennung

Diffusionsmodelle haben sich in der Anomalieerkennung als wertvoll erwiesen, indem sie die normale Datenverteilung erfassen und Anomalien über die Rekonstruktion identifizieren. Trotz ihrer Vorteile zeigen sie Schwierigkeiten bei der Lokalisierung von Anomalien unterschiedlicher Skalen, insbesondere bei größeren Anomalien wie vollständig fehlenden Komponenten. Um diesem Problem zu begegnen, präsentieren wir einen neuartigen Ansatz, der die Fähigkeiten von Diffusionsmodellen durch die Erweiterung des zuvor vorgestellten impliziten Bedingungsansatzes von Meng et al. (2022) in drei wesentlichen Aspekten erheblich verbessert. Erstens integrieren wir eine dynamische Berechnung der Schrittweite, die variable Rauschschritte im Vorwärtsprozess ermöglicht und durch eine anfängliche Anomalievorhersage geleitet wird. Zweitens zeigen wir, dass das Entrauschen eines lediglich skalierten Eingabebildes – ohne zusätzlichen Rauschanteil – die Leistung des herkömmlichen Entrauschprozesses übertrifft. Drittens projizieren wir Bilder in einen latente Raum, um feine Details abzustreifen, die die Rekonstruktion großer fehlender Komponenten beeinträchtigen. Zudem schlagen wir eine Feinabstimmungsmechanik vor, die es dem Modell ermöglicht, die Feinheiten des Zielbereichs effektiv zu erfassen. Unser Ansatz wird an bedeutenden Datensätzen für Anomalieerkennung wie VisA, BTAD und MVTec gründlich evaluiert und erzielt dabei hervorragende Ergebnisse. Wichtig ist, dass unser Framework Anomalien unabhängig von ihrer Skala effektiv lokalisieren kann, was eine entscheidende Fortschrittsstufe in der Anomalieerkennung basierend auf Diffusionsmodellen darstellt.