HyperAIHyperAI
vor 17 Tagen

PAD: Ein Datensatz und Benchmark für pose-agnostische Anomalieerkennung

Qiang Zhou, Weize Li, Lihan Jiang, Guoliang Wang, Guyue Zhou, Shanghang Zhang, Hao Zhao
PAD: Ein Datensatz und Benchmark für pose-agnostische Anomalieerkennung
Abstract

Die Anomalieerkennung von Objekten stellt ein zentrales Problem im Bereich der Maschinenwahrnehmung dar und hat in jüngster Zeit bemerkenswerte Fortschritte erzielt. Zwei wesentliche Herausforderungen behindern jedoch die Forschung und Anwendung in diesem Bereich. Erstens fehlen bestehende Datensätze umfassenden visuellen Informationen aus verschiedenen Blickwinkeln. Sie basieren häufig auf unrealistischen Annahmen, wonach die Trainingsdaten ohne Anomalien pose-gealigniert sind und die Testproben dieselbe Pose wie die Trainingsdaten aufweisen. In der Praxis kann jedoch eine Anomalie an beliebigen Stellen eines Objekts auftreten, und Trainings- sowie Abfrageproben können unterschiedliche Pose aufweisen, was die Entwicklung von pose-unabhängiger Anomalieerkennung erforderlich macht. Zweitens fehlt es an einer einheitlichen Vereinbarung bezüglich der experimentellen Protokolle für die pose-unabhängige Anomalieerkennung, was faire Vergleiche zwischen verschiedenen Methoden erschwert und die Forschung in diesem Bereich beeinträchtigt. Um diese Probleme anzugehen, entwickeln wir den Multi-pose Anomaly Detection (MAD)-Datensatz und die Pose-agnostic Anomaly Detection (PAD)-Benchmark, die den ersten Schritt zur Lösung des Problems der pose-unabhängigen Anomalieerkennung darstellen. Konkret bauen wir MAD mit 20 komplex geformten LEGO-Spielzeugen auf, die jeweils 4.000 Ansichten unter verschiedenen Pose enthalten, sowie hochwertige und vielfältige 3D-Anomalien sowohl in simulierten als auch in realen Umgebungen. Zusätzlich stellen wir eine neuartige Methode namens OmniposeAD vor, die auf MAD trainiert wurde und speziell für die pose-unabhängige Anomalieerkennung konzipiert ist. Durch umfassende Evaluationen zeigen wir die Relevanz unseres Datensatzes und unserer Methode. Darüber hinaus stellen wir eine Open-Source-Benchmark-Bibliothek bereit, die den Datensatz sowie Baseline-Methoden für acht unterschiedliche Paradigmen der Anomalieerkennung umfasst, um zukünftige Forschung und Anwendung in diesem Bereich zu fördern. Code, Daten und Modelle sind öffentlich über https://github.com/EricLee0224/PAD zugänglich.