HyperAIHyperAI
il y a 17 jours

VT-ADL : Un réseau Vision Transformer pour la détection et la localisation des anomalies dans les images

Pankaj Mishra, Riccardo Verk, Daniele Fornasier, Claudio Piciarelli, Gian Luca Foresti
VT-ADL : Un réseau Vision Transformer pour la détection et la localisation des anomalies dans les images
Résumé

Nous présentons un réseau de détection et de localisation des anomalies dans les images basé sur les transformateurs. Notre modèle proposé combine une approche fondée sur la reconstruction et une méthode d’embedding par patch. L’utilisation des réseaux transformateurs permet de préserver les informations spatiales des patches intégrés, qui sont ultérieurement traités par un réseau de densité de mélange gaussien afin de localiser les régions anormales. En outre, nous publions également BTAD, un ensemble de données réel issu d’un contexte industriel pour la détection d’anomalies. Nos résultats sont comparés à ceux d’autres algorithmes de pointe, utilisant des jeux de données publics tels que MNIST et MVTec.

VT-ADL : Un réseau Vision Transformer pour la détection et la localisation des anomalies dans les images | Articles de recherche récents | HyperAI