HyperAIHyperAI
il y a 17 jours

PAD : Un jeu de données et un benchmark pour la détection d'anomalies indépendante de la pose

Qiang Zhou, Weize Li, Lihan Jiang, Guoliang Wang, Guyue Zhou, Shanghang Zhang, Hao Zhao
PAD : Un jeu de données et un benchmark pour la détection d'anomalies indépendante de la pose
Résumé

La détection d’anomalies d’objets constitue un problème crucial en vision par ordinateur et a connu des progrès significatifs récemment. Toutefois, deux défis majeurs freinent sa recherche et son application. Premièrement, les jeux de données existants manquent d’informations visuelles complètes provenant de multiples angles de pose. Ils reposent souvent sur une hypothèse irréaliste selon laquelle les données d’entraînement sans anomalie sont alignées selon la pose, et que les échantillons de test présentent la même pose que ceux d’entraînement. En pratique, cependant, les anomalies peuvent apparaître dans n’importe quelle région d’un objet, et les échantillons d’entraînement comme ceux de requête peuvent présenter des poses différentes, ce qui rend nécessaire l’étude de la détection d’anomalies indépendante de la pose (pose-agnostic). Deuxièmement, l’absence de consensus sur les protocoles expérimentaux pour la détection d’anomalies indépendante de la pose entraîne des comparaisons injustes entre différentes méthodes, freinant ainsi le progrès dans ce domaine.Pour relever ces défis, nous proposons le jeu de données Multi-pose Anomaly Detection (MAD) et le benchmark Pose-agnostic Anomaly Detection (PAD), marquant la première étape vers la résolution du problème de détection d’anomalies indépendante de la pose. Plus précisément, MAD est construit à partir de 20 jouets LEGO à formes complexes, incluant 4 000 vues sous diverses poses, ainsi que des anomalies 3D de haute qualité et diversifiées, générées aussi bien dans des environnements simulés que réels. Par ailleurs, nous proposons une nouvelle méthode, OmniposeAD, entraînée sur MAD, spécifiquement conçue pour la détection d’anomalies indépendante de la pose. À travers des évaluations approfondies, nous démontrons la pertinence de notre jeu de données et de notre méthode. En outre, nous mettons à disposition une bibliothèque open source incluant le jeu de données et des méthodes de base couvrant huit paradigmes de détection d’anomalies, afin de faciliter les recherches futures et les applications dans ce domaine. Le code, les données et les modèles sont accessibles publiquement à l’adresse suivante : https://github.com/EricLee0224/PAD.