DROCC : Classification d'une seule classe robuste basée sur les réseaux de neurones profonds

Les approches classiques pour les problèmes à une classe, telles que le SVM à une classe ou l’isolation forest, nécessitent une ingénierie soigneuse des caractéristiques lorsqu’elles sont appliquées à des domaines structurés comme les images. Les méthodes de pointe visent à exploiter l’apprentissage profond afin d’apprendre des caractéristiques adaptées via deux approches principales. La première, fondée sur la prédiction de transformations (Golan & El-Yaniv, 2018 ; Hendrycks et al., 2019a), bien qu’efficace dans certains domaines, dépend crucialement d’un ensemble approprié de transformations spécifiques au domaine, difficile à obtenir de manière générale. La deuxième approche, qui consiste à minimiser une perte classique à une classe sur les représentations apprises au niveau de la dernière couche, par exemple DeepSVDD (Ruff et al., 2018), souffre d’un inconvénient fondamental : le phénomène de « collapse » des représentations. Dans ce travail, nous proposons Deep Robust One-Class Classification (DROCC), une méthode applicable à la plupart des domaines standards sans nécessiter d’informations auxiliaires et robuste au collapse des représentations. DROCC repose sur l’hypothèse que les points appartenant à la classe d’intérêt sont situés sur une variété à faible dimension, localement linéaire et bien échantillonnée. Une évaluation expérimentale montre que DROCC est hautement efficace dans deux configurations différentes de problèmes à une classe, sur une large gamme de jeux de données réels provenant de domaines variés : données tabulaires, images (CIFAR et ImageNet), audio et séries temporelles, offrant jusqu’à une amélioration de 20 % en précision par rapport à l’état de l’art en détection d’anomalies. Le code est disponible à l’adresse suivante : https://github.com/microsoft/EdgeML.