HyperAIHyperAI
il y a 17 jours

OLED : Réseau d'encodage-décodage appris à une seule classe avec masquage contextuel adversarial pour la détection de nouveauté

John Taylor Jewell, Vahid Reza Khazaie, Yalda Mohsenzadeh
OLED : Réseau d'encodage-décodage appris à une seule classe avec masquage contextuel adversarial pour la détection de nouveauté
Résumé

La détection de nouveautés consiste à identifier des échantillons qui n’appartiennent pas à la distribution de la classe cible. Lors de l’entraînement, la classe de nouveauté est absente, ce qui empêche l’utilisation des approches classiques de classification. Les autoencodeurs profonds sont largement utilisés comme base de nombreuses méthodes non supervisées de détection de nouveautés. En particulier, les autoencodeurs contextuels se sont révélés efficaces pour cette tâche, en raison des représentations plus pertinentes qu’ils apprennent en reconstruisant des images originales à partir d’images partiellement masquées de manière aléatoire. Toutefois, un inconvénient majeur des autoencodeurs contextuels réside dans le fait que le masquage aléatoire ne couvre pas de manière cohérente les structures importantes des images d’entrée, entraînant ainsi des représentations sous-optimales — particulièrement problématique dans le cadre de la détection de nouveautés. Dans cet article, afin d’optimiser le masquage d’entrée, nous proposons un cadre composé de deux réseaux concurrents : un module de masquage (Mask Module) et un reconstructeur (Reconstructor). Le Mask Module est un autoencodeur convolutif qui apprend à générer des masques optimaux couvrant les parties les plus importantes des images. Le Reconstructor, quant à lui, est un encodeur-décodageur convolutif dont l’objectif est de reconstruire les images non perturbées à partir d’images masquées. Ces deux réseaux sont entraînés de manière antagoniste : le Mask Module génère des masques appliqués aux images envoyées au Reconstructor. Ainsi, le Mask Module cherche à maximiser l’erreur de reconstruction que le Reconstructor tente de minimiser. Lorsqu’il est appliqué à la détection de nouveautés, l’approche proposée apprend des représentations sémantiquement plus riches que celles des autoencodeurs contextuels, et améliore la détection de nouveautés au moment de l’évaluation grâce à un masquage plus optimal. Des expériences de détection de nouveautés sur les jeux de données d’images MNIST et CIFAR-10 démontrent l’avantage de l’approche proposée par rapport aux méthodes de pointe. Dans une expérience complémentaire sur le jeu de données vidéo UCSD pour la détection de nouveautés, l’approche atteint des résultats de l’état de l’art.

OLED : Réseau d'encodage-décodage appris à une seule classe avec masquage contextuel adversarial pour la détection de nouveauté | Articles de recherche récents | HyperAI