PANDA : Adaptation des caractéristiques préentraînées pour la détection et la segmentation des anomalies

Les méthodes de détection d’anomalies nécessitent des caractéristiques de haute qualité. Ces dernières années, la communauté spécialisée dans la détection d’anomalies a tenté d’obtenir de meilleures caractéristiques grâce aux progrès réalisés dans le domaine de l’apprentissage profond auto-supervisé. De manière surprenante, une piste particulièrement prometteuse — l’utilisation de caractéristiques préentraînées issues de modèles profonds — a été largement ignorée. Dans cet article, nous établissons empiriquement un résultat peut-être attendu, mais jusque-là non rapporté : combiner des caractéristiques préentraînées avec des méthodes simples de détection et de segmentation d’anomalies permet d’obtenir des performances significativement supérieures à celles des méthodes de pointe, bien plus complexes.Afin d’obtenir des gains supplémentaires en détection d’anomalies, nous adaptons les caractéristiques préentraînées à la distribution cible. Bien que les méthodes d’apprentissage par transfert soient bien établies dans les problèmes de classification multi-classes, elles sont moins explorées dans le cadre de la classification à une seule classe (OCC, One-Class Classification). Il s’avère que les méthodes d’adaptation naïves, qui fonctionnent généralement bien en apprentissage supervisé, entraînent souvent un effondrement catastrophique (détérioration des caractéristiques) dans les scénarios OCC, ce qui nuit aux performances. Une méthode populaire dans le cadre OCC, DeepSVDD, recommande l’utilisation d’architectures spécialisées, mais cela limite les gains potentiels d’adaptation. Nous proposons deux approches pour contrer cet effondrement : i) une variante de l’arrêt précoce qui apprend dynamiquement l’itération optimale d’arrêt ; ii) une régularisation élastique inspirée de l’apprentissage continu. Notre méthode, PANDA, surpasser largement l’état de l’art dans les configurations de OCC, d’exposition aux outliers et de segmentation d’anomalies.