HyperAIHyperAI
il y a 11 jours

Cible avant tir : Détection et localisation précises des anomalies en moins d’un milliseconde grâce à une récupération en cascade de patches

Hanxi Li, Jianfei Hu, Bo Li, Hao Chen, Yongbin Zheng, Chunhua Shen
Cible avant tir : Détection et localisation précises des anomalies en moins d’un milliseconde grâce à une récupération en cascade de patches
Résumé

Dans ce travail, en réexaminant la nature « d’alignement » de la détection d’anomalies (AD), nous proposons un nouveau cadre de détection d’anomalies offrant à la fois de nouveaux records en précision et une vitesse d’exécution très élevée. Dans ce cadre, le problème de détection d’anomalies est résolu par une procédure en cascade de récupération de patches qui recherche les voisins les plus proches pour chaque patch d’image de test de manière progressive, du grossier au fin. Étant donné un échantillon de test, les K images d’entraînement les plus similaires sont d’abord sélectionnées grâce à un processus robuste d’alignement par histogrammes. Ensuite, le voisin le plus proche de chaque patch de test est identifié aux emplacements géométriquement similaires parmi ces « voisins globaux les plus proches », en utilisant une métrique locale soigneusement entraînée. Enfin, le score d’anomalie de chaque patch d’image de test est calculé en fonction de la distance à son « voisin local le plus proche » ainsi que de la probabilité « non-fond » (non-arrière-plan). La méthode proposée est désignée dans ce travail sous le nom de « Cascade Patch Retrieval » (CPR). Contrairement aux algorithmes classiques de détection d’anomalies basés sur le matching de patches, CPR sélectionne d’abord les « cibles » appropriées (images de référence et emplacements) avant d’effectuer le « tir » (le matching de patch). Sur les jeux de données bien établis MVTec AD, BTAD et MVTec-3D AD, l’algorithme proposé dépasse de manière significative toutes les méthodes de l’état de l’art comparables, selon diverses métriques de détection d’anomalies. En outre, CPR est extrêmement efficace : il fonctionne à 113 FPS dans les paramètres standards, tandis que sa version simplifiée nécessite moins de 1 ms pour traiter une image, au prix d’une chute négligeable de précision. Le code source de CPR est disponible à l’adresse suivante : https://github.com/flyinghu123/CPR.