HyperAIHyperAI
vor 17 Tagen

Aufmerksamkeitsgesteuerte Anomalie-Lokalisierung in Bildern

Shashanka Venkataramanan, Kuan-Chuan Peng, Rajat Vikram Singh, Abhijit Mahalanobis
Aufmerksamkeitsgesteuerte Anomalie-Lokalisierung in Bildern
Abstract

Anomalie-Lokalisierung ist ein zentrales Problem im Bereich des Computer Vision und beinhaltet die Identifizierung anormaler Regionen innerhalb von Bildern mit Anwendungen in der industriellen Inspektion, Überwachung und medizinischen Bildanalyse. Diese Aufgabe ist aufgrund der geringen Stichprobengröße und der begrenzten Pixelabdeckung der Anomalien in realen Szenarien besonders herausfordernd. Die meisten bisherigen Ansätze benötigen anormale Trainingsbilder, um einen klassenspezifischen Schwellenwert zu berechnen, um Anomalien zu lokalisieren. Ohne die Notwendigkeit anormaler Trainingsbilder stellen wir den Convolutional Adversarial Variational Autoencoder mit Guided Attention (CAVGA) vor, der die Anomalie mit einer konvolutionalen Latentvariablen lokalisiert, um räumliche Informationen zu bewahren. Im unsupervisierten Setting führen wir eine Aufmerksamkeits-Erweiterungsverlustfunktion ein, bei der CAVGA dazu angeregt wird, sich auf alle normalen Regionen des Bildes zu konzentrieren. Darüber hinaus schlagen wir im schwach-supervisierten Setting eine ergänzende geführte Aufmerksamkeitsverlustfunktion vor, bei der die Aufmerksamkeitskarte daraufhin optimiert wird, sich auf alle normalen Regionen zu fokussieren, während gleichzeitig die Aufmerksamkeit auf anormale Regionen minimiert wird. CAVGA erreicht eine bessere Leistung als die derzeitigen State-of-the-Art (SOTA)-Methoden zur Anomalie-Lokalisierung auf den Datensätzen MVTec Anomaly Detection (MVTAD), modified ShanghaiTech Campus (mSTC) und Large-scale Attention based Glaucoma (LAG) im unsupervisierten Setting und bei Verwendung lediglich von 2 % anormalen Bildern im schwach-supervisierten Setting. Zudem übertrifft CAVGA die SOTA-Methoden zur Anomalieerkennung auf den Datensätzen MNIST, CIFAR-10, Fashion-MNIST, MVTAD, mSTC und LAG.

Aufmerksamkeitsgesteuerte Anomalie-Lokalisierung in Bildern | Neueste Forschungsarbeiten | HyperAI