HyperAIHyperAI
vor 17 Tagen

OLED: Ein One-Class Gelernter Encoder-Decoder-Netzwerk mit adversarieller Kontextmaskierung zur Anomalieerkennung

John Taylor Jewell, Vahid Reza Khazaie, Yalda Mohsenzadeh
OLED: Ein One-Class Gelernter Encoder-Decoder-Netzwerk mit adversarieller Kontextmaskierung zur Anomalieerkennung
Abstract

Die Detektion von Neuem (Novelty Detection) ist die Aufgabe, Muster zu erkennen, die nicht der Verteilung der Zielklasse entstammen. Während des Trainings ist die Neuheitsklasse nicht vorhanden, was die Anwendung traditioneller Klassifikationsansätze unmöglich macht. Tiefgelegene Autoencoder werden häufig als Grundlage vieler unsupervisierter Methoden zur Detektion von Neuem verwendet. Insbesondere haben Kontext-Autoencoder bei dieser Aufgabe Erfolg gezeigt, da sie durch die Rekonstruktion ursprünglicher Bilder aus zufällig maskierten Bildern effektivere Darstellungen lernen. Ein wesentlicher Nachteil von Kontext-Autoencodern besteht jedoch darin, dass die zufällige Maskierung nicht konsistent wichtige Strukturen des Eingabebildes abdeckt, was zu suboptimalen Darstellungen führt – insbesondere für die Aufgabe der Detektion von Neuem. In diesem Artikel entwickeln wir einen Ansatz zur Optimierung der Eingabemaskierung, indem wir ein Framework aus zwei konkurrierenden Netzwerken entwerfen: einem Masken-Modul und einem Rekonstruktor. Das Masken-Modul ist ein konvolutioneller Autoencoder, der lernt, optimale Masken zu generieren, die die wichtigsten Teile der Bilder abdecken. Der Rekonstruktor hingegen ist ein konvolutioneller Encoder-Decoder, dessen Ziel darin besteht, unverfälschte Bilder aus maskierten Bildern wiederherzustellen. Die Netzwerke werden adversarial trainiert: Das Masken-Modul erzeugt Masken, die auf Bilder angewendet werden, die dem Rekonstruktor zur Verfügung gestellt werden. Auf diese Weise versucht das Masken-Modul, den Rekonstruktionsfehler zu maximieren, während der Rekonstruktor diesen Fehler minimieren möchte. Bei der Anwendung auf die Detektion von Neuem lernt der vorgeschlagene Ansatz semantisch reichhaltigere Darstellungen im Vergleich zu Kontext-Autoencodern und verbessert die Detektion von Neuem im Testzeitpunkt durch optimierte Maskierung. Experimente zur Detektion von Neuem auf den Bild-Datensätzen MNIST und CIFAR-10 belegen die Überlegenheit des vorgeschlagenen Ansatzes gegenüber aktuellen State-of-the-Art-Methoden. In einer weiteren Studie auf dem UCSD-Videodatensatz zur Detektion von Neuem erzielt der vorgeschlagene Ansatz state-of-the-art-Ergebnisse.