17 天前
PAD:一种与姿态无关的异常检测数据集与基准测试
Qiang Zhou, Weize Li, Lihan Jiang, Guoliang Wang, Guyue Zhou, Shanghang Zhang, Hao Zhao

摘要
物体异常检测是机器视觉领域中的一个重要问题,近年来取得了显著进展。然而,其研究与应用仍面临两大关键挑战。首先,现有数据集缺乏来自多种姿态角度的全面视觉信息。大多数方法基于一个不切实际的假设:无异常的训练数据与测试样本在姿态上完全对齐,即训练与测试样本具有相同姿态。但在实际场景中,异常可能出现在物体的任意区域,且训练样本与查询样本之间可能存在姿态差异,因此亟需开展姿态无关(pose-agnostic)的异常检测研究。其次,当前缺乏针对姿态无关异常检测的统一实验协议,导致不同方法之间的比较缺乏公平性,严重制约了该方向的深入发展。为应对上述问题,我们构建了多姿态异常检测数据集(Multi-pose Anomaly Detection, MAD)与姿态无关异常检测基准(Pose-agnostic Anomaly Detection, PAD),标志着该领域迈出关键的第一步。具体而言,MAD数据集基于20个复杂形状的乐高玩具,包含4,000张不同姿态下的高质量图像,并在模拟与真实环境中引入了丰富多样的3D异常样本。此外,我们提出了一种新型方法——OmniposeAD,该方法基于MAD数据集进行训练,专为姿态无关异常检测而设计。通过全面的实验评估,我们验证了所提数据集与方法的有效性与相关性。为进一步推动该领域的研究与应用,我们开源发布了一个包含完整数据集与8种典型异常检测范式的基线方法的基准库。相关代码、数据及模型已公开,可访问 https://github.com/EricLee0224/PAD 获取。