HyperAIHyperAI
il y a 2 mois

Dinomaly : La Philosophie Moins C'est Plus dans la Détection Non Supervisée d'Anomalies Multiclasse

Guo, Jia ; Lu, Shuai ; Zhang, Weihang ; Chen, Fang ; Li, Huiqi ; Liao, Hongen
Dinomaly : La Philosophie Moins C'est Plus dans la Détection Non Supervisée d'Anomalies Multiclasse
Résumé

Des études récentes ont mis en évidence un cadre pratique de détection d'anomalies non supervisée (UAD) qui construit un modèle unifié pour des images multiclasses. Malgré divers progrès réalisés pour relever ce défi, les performances de détection dans le cadre multiclasses restent largement en retard par rapport aux modèles séparés par classe de pointe. Notre recherche vise à combler cet important écart de performance. Dans cet article, nous présentons un cadre minimaliste de détection d'anomalies basé sur la reconstruction, nommé Dinomaly, qui utilise des architectures Transformer pures sans recourir à des conceptions complexes, des modules supplémentaires ou à des astuces spécialisées. Grâce à ce puissant cadre composé uniquement d'Attention et de MLPs, nous avons identifié quatre composants simples essentiels à la détection d'anomalies multiclasses : (1) les Transformers fondamentaux qui extraient des caractéristiques universelles et discriminantes, (2) le Bouteille de bruit où les Dropouts préexistants effectuent toutes les techniques d'injection de bruit, (3) l'Attention linéaire qui ne peut naturellement pas se concentrer, et (4) la Reconstruction souple qui n'impose pas une reconstruction couche par couche et point par point. Des expériences approfondies ont été menées sur plusieurs benchmarks populaires de détection d'anomalies, notamment MVTec-AD, VisA et Real-IAD. Notre méthode proposée Dinomaly obtient des performances impressionnantes au niveau des images avec un AUROC de 99,6 %, 98,7 % et 89,3 % respectivement sur ces trois jeux de données, ce qui non seulement est supérieur aux méthodes UAD multiclasses les plus avancées actuellement disponibles, mais atteint également les meilleures performances des méthodes UAD séparées par classe.