Détection non supervisée d'anomalies dans les images profondes : un cadre théorique de l'information

Les méthodes fondées sur des tâches substituées ont récemment montré un grand potentiel pour la détection d’anomalies dans les images en mode non supervisé. Toutefois, aucune garantie n’existe quant au fait que ces tâches substituées partagent une direction d’optimisation cohérente avec la détection d’anomalies. Dans cet article, nous revenons à une fonction objectif directe pour la détection d’anomalies, fondée sur la théorie de l’information, qui vise à maximiser la distance entre les données normales et anormales en termes de distribution conjointe des images et de leurs représentations. Malheureusement, cette fonction objectif n’est pas directement optimisable dans un cadre non supervisé, où aucune donnée anormale n’est disponible pendant l’entraînement. À travers une analyse mathématique de cette fonction objectif, nous parvenons à la décomposer en quatre composantes. Afin d’optimiser de manière non supervisée, nous montrons que, sous l’hypothèse que les distributions des données normales et anormales sont séparables dans l’espace latent, une borne inférieure de cette fonction peut être interprétée comme une fonction qui pondère le compromis entre l’information mutuelle et l’entropie. Cette fonction objectif permet non seulement d’expliquer pourquoi les méthodes basées sur des tâches substituées sont efficaces pour la détection d’anomalies, mais ouvre également la voie à des directions potentielles d’amélioration. À partir de cette fonction objectif, nous proposons un nouveau cadre théorique fondé sur l’information pour la détection d’anomalies dans les images en mode non supervisé. Des expériences étendues démontrent que le cadre proposé surpasse significativement plusieurs méthodes de pointe sur plusieurs jeux de données standard.