Apprentissage contrastif semi-push-pull guidé par une frontière explicite pour la détection d'anomalies supervisée

La plupart des modèles de détection d’anomalies (AD) sont appris de manière non supervisée à partir uniquement d’échantillons normaux, ce qui peut entraîner une frontière de décision floue et une discriminabilité insuffisante. En réalité, quelques échantillons d’anomalies sont souvent disponibles dans les applications du monde réel, et les connaissances précieuses associées à ces anomalies connues devraient être exploitées efficacement. Toutefois, l’utilisation de quelques anomalies connues pendant l’entraînement peut engendrer un autre problème : le modèle pourrait être biaisé par ces anomalies connues et échouer à généraliser aux anomalies inédites. Dans cet article, nous abordons la détection d’anomalies supervisée, c’est-à-dire que nous apprenons des modèles AD à partir d’un petit nombre d’anomalies disponibles, dans le but de détecter à la fois les anomalies observées et les anomalies inconnues. Nous proposons un nouveau mécanisme de apprentissage contrastif semi-pousser-pull guidé par une frontière explicite, qui améliore la discriminabilité du modèle tout en atténuant le biais. Notre approche repose sur deux conceptions fondamentales : premièrement, nous identifions une frontière de séparation explicite et compacte, qui sert de guide pour l’apprentissage ultérieur des caractéristiques. Étant donné que cette frontière dépend uniquement de la distribution des caractéristiques normales, le problème de biais provoqué par un petit nombre d’anomalies connues est atténué. Deuxièmement, nous introduisons une fonction de perte semi-pousser-pull guidée par la frontière, qui ne fait que rapprocher les caractéristiques normales tout en éloignant les caractéristiques anormales de la frontière de séparation au-delà d’une certaine région de marge. Ainsi, notre modèle peut établir une frontière de décision plus explicite et plus discriminative, permettant de distinguer plus efficacement les anomalies connues et inconnues des échantillons normaux. Le code sera disponible à l’adresse suivante : https://github.com/xcyao00/BGAD.