Cadre de restauration d'attributs pour la détection d'anomalies

Grâce aux récents progrès des réseaux neuronaux profonds, la détection d’anomalies dans les multimédias a suscité un intérêt croissant au sein de la communauté du vision par ordinateur. Bien que les méthodes basées sur la reconstruction aient récemment montré un grand potentiel pour la détection d’anomalies, l’équivalence d’information entre l’entrée et la supervision dans les tâches de reconstruction ne parvient pas efficacement à contraindre le réseau à apprendre des embeddings de caractéristiques sémantiques. Nous proposons ici de briser cette équivalence en supprimant des attributs sélectionnés à partir des données d’origine, puis en reformulant le problème comme une tâche de restauration, dans laquelle les données normales et anormales doivent être distinguées à partir des erreurs de restauration. En obligeant le réseau à restaurer l’image d’origine, les embeddings sémantiques associés aux attributs supprimés sont appris par le réseau. Lors des phases de test, comme les données anormales sont restaurées à l’aide des attributs appris à partir des données normales, on s’attend à ce que l’erreur de restauration soit importante. Des expériences étendues ont démontré que la méthode proposée surpasse significativement plusieurs états de l’art sur plusieurs jeux de données standard, notamment sur ImageNet, où elle améliore de 10,1 % le score AUROC du modèle de référence le plus performant. Nous avons également évalué notre méthode sur un jeu de données réel de détection d’anomalies, MVTec AD, ainsi que sur un jeu de données vidéo pour la détection d’anomalies, ShanghaiTech.