Embedding semi-orthogonal pour une segmentation d'anomalies non supervisée efficace

Nous présentons l'efficacité de l'embedding semi-orthogonal pour la segmentation non supervisée des anomalies. Les caractéristiques multi-échelles issues de réseaux de neurones convolutifs pré-entraînés sont récemment utilisées pour calculer des distances de Mahalanobis localisées, offrant des performances significatives. Toutefois, la taille accrue des caractéristiques pose problème pour une mise à l’échelle vers des réseaux plus grands, en raison de la nécessité de calculer l’inverse par lot d’un tenseur de covariance multidimensionnel. Dans cet article, nous généralisons une méthode heuristique, la sélection aléatoire de caractéristiques, en une approche d’embedding semi-orthogonal, permettant une approximation robuste et réduisant cubiquement le coût computationnel associé à l’inverse du tenseur de covariance multidimensionnel. Grâce à des études d’ablation approfondies, la méthode proposée atteint un nouveau record d’état de l’art, avec des marges importantes, sur les jeux de données MVTec AD, KolektorSDD, KolektorSDD2 et mSTC. Les analyses théoriques et empiriques offrent des éclairages et une validation de notre approche simple mais économiquement efficace.