HyperAIHyperAI
vor 17 Tagen

Produzieren Sie einmal, nutzen Sie zweimal für die Anomalieerkennung

Shuyuan Wang, Qi Li, Huiyuan Luo, Chengkan Lv, Zhengtao Zhang
Produzieren Sie einmal, nutzen Sie zweimal für die Anomalieerkennung
Abstract

Die visuelle Anomalieerkennung zielt darauf ab, Bereiche zu klassifizieren und zu lokalisieren, die von der normalen Erscheinung abweichen. Embedding-basierte und Rekonstruktions-basierte Methoden stellen zwei Hauptansätze für diese Aufgabe dar. Allerdings sind sie entweder nicht effizient genug oder nicht präzise genug für industrielle Anwendungen. Um dieses Problem zu bewältigen, leiten wir POUTA (Produce Once Utilize Twice for Anomaly detection) ab, das sowohl Genauigkeit als auch Effizienz durch die Wiederverwendung des diskriminativen Informationspotenzials im Rekonstruktionsnetzwerk verbessert. Wir beobachten, dass die Encoder- und Decoder-Darstellungen des Rekonstruktionsnetzwerks jeweils die Merkmale des ursprünglichen und des rekonstruierten Bildes repräsentieren können. Die Differenzen zwischen den symmetrischen Rekonstruktionsdarstellungen liefern bereits eine grobe, aber bereits brauchbare Anomalieinformation. Um diese Information zu verfeinern, wird in POUTA ein grob-zu-fein-Prozess vorgeschlagen, der die Semantik jeder diskriminativen Schicht durch hochwertige Darstellungen und eine Überwachungsverlustfunktion kalibriert. Durch die Integration dieser Module verfügt POUTA über die Fähigkeit, eine präzisere Anomaliepositionierung als frühere Ansätze zu ermöglichen. Darüber hinaus ermöglicht die Wiederverwendung von Darstellungen auch die Auslassung des Merkmalsextraktionsprozesses im diskriminativen Netzwerk, was die Anzahl der Parameter reduziert und die Effizienz steigert. Ausführliche Experimente zeigen, dass POUTA sowohl hinsichtlich der Leistung als auch des Ressourcenverbrauchs gegenüber vorherigen Methoden überlegen oder zumindest konkurrenzfähig ist. Zudem erreicht POUTA eine bessere Leistung als die derzeit besten Few-Shot-Anomalieerkennungsmethoden, ohne spezielle Designmerkmale zu erfordern, was belegt, dass POUTA eine starke Fähigkeit besitzt, die inhärenten Strukturen im Trainingsdatensatz zu lernen.