CSI : Détection de nouveauté par apprentissage contrastif sur des instances soumises à un décalage de distribution

La détection de nouveautés, c’est-à-dire l’identification de l’origine d’un échantillon donné en dehors de la distribution d’apprentissage, est essentielle pour garantir la fiabilité des systèmes d’apprentissage automatique. À cette fin, de nombreuses tentatives ont été faites afin d’apprendre une représentation adaptée à la détection de nouveautés, ainsi que de concevoir un score fondé sur une telle représentation. Dans cet article, nous proposons une méthode simple mais efficace, nommée Contrasting Shifted Instances (CSI), inspirée du succès récent de l’apprentissage contrastif des représentations visuelles. Plus précisément, en plus de contraster un échantillon donné avec d’autres instances, comme cela est fait dans les méthodes classiques d’apprentissage contrastif, notre schéma d’entraînement contraste également l’échantillon avec des augmentations décalées de sa propre distribution. À partir de cette approche, nous proposons un nouveau score de détection spécifiquement conçu pour le cadre d’entraînement proposé. Nos expériences démontrent l’efficacité supérieure de notre méthode dans diverses scénarios de détection de nouveautés, y compris les cas à une seule classe non étiquetée, à plusieurs classes non étiquetées et à plusieurs classes étiquetées, sur différentes bases de données d’images. Le code source et les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/alinlab/CSI.