DASVDD : Descripteur de données à vecteur de support par auto-encodeur profond pour la détection d'anomalies

La détection semi-supervisée d’anomalies vise à identifier des anomalies à partir d’échantillons normaux à l’aide d’un modèle entraîné uniquement sur des données normales. Grâce aux progrès récents du deep learning, les chercheurs ont conçu des méthodes efficaces de détection d’anomalies profondes. Les travaux existants utilisent couramment des réseaux de neurones pour mapper les données vers une représentation plus informative, avant d’appliquer un algorithme de détection d’anomalies. Dans cet article, nous proposons une méthode, DASVDD, qui apprend simultanément les paramètres d’un autoencodeur tout en minimisant le volume d’une hyper-sphère encadrant la représentation latente. Nous introduisons un score d’anomalie combinant l’erreur de reconstruction de l’autoencodeur et la distance par rapport au centre de l’hyper-sphère dans l’espace latente. La minimisation de ce score permet de mieux apprendre la distribution sous-jacente de la classe normale durant l’entraînement. L’intégration de l’erreur de reconstruction dans le score d’anomalie garantit que DASVDD évite le problème courant de « collapse » de l’hyper-sphère, car le modèle DASVDD ne converge pas vers une solution triviale consistant à mapper toutes les entrées vers un point constant dans l’espace latente. Des évaluations expérimentales sur plusieurs jeux de données standard montrent que la méthode proposée surpasser les algorithmes d’état de l’art couramment utilisés tout en maintenant une performance robuste face à différentes classes d’anomalies.