17일 전

PAD: 자세에 관계없이 이상 탐지용 데이터셋 및 벤치마크

Qiang Zhou, Weize Li, Lihan Jiang, Guoliang Wang, Guyue Zhou, Shanghang Zhang, Hao Zhao
PAD: 자세에 관계없이 이상 탐지용 데이터셋 및 벤치마크
초록

물체 이상 탐지(Object anomaly detection)는 머신 비전 분야에서 중요한 문제이며, 최근 급격한 발전을 보여왔다. 그러나 연구 및 응용을 방해하는 두 가지 주요 과제가 존재한다. 첫째, 기존의 데이터셋은 다양한 자세(pose) 각도에서의 포괄적인 시각 정보를 부족하게 제공한다. 일반적으로 이상 없는 학습 데이터셋이 자세 정렬(pose-aligned)되어 있으며, 테스트 샘플 또한 학습 데이터와 동일한 자세를 가진다는 비현실적인 가정을 하고 있다. 그러나 실제 환경에서는 이상이 물체의 어떤 영역에서도 발생할 수 있으며, 학습 샘플과 쿼리 샘플 간에 자세가 다를 수 있으므로, 자세에 관계없이 이상을 탐지할 수 있는 '자세 무관 이상 탐지(pose-agnostic anomaly detection)' 연구가 필수적이다. 둘째, 자세 무관 이상 탐지에 대한 실험 프로토콜에 대한 합의가 부족하여, 다양한 방법 간의 공정한 비교가 어려워지고, 이는 자세 무관 이상 탐지 분야의 연구 발전을 저해하고 있다.이러한 문제를 해결하기 위해 우리는 다중 자세 이상 탐지(Multi-pose Anomaly Detection, MAD) 데이터셋과 자세 무관 이상 탐지(Pose-agnostic Anomaly Detection, PAD) 벤치마크를 개발하였다. 이는 자세 무관 이상 탐지 문제에 대한 첫걸음을 내딛는 중요한 기여이다. 구체적으로, MAD 데이터셋은 20종의 복잡한 형태의 레고 장난감을 활용하여, 다양한 자세에서 촬영한 총 4,000개의 뷰를 포함하고 있으며, 시뮬레이션 및 실제 환경 모두에서 고해상도이고 다양한 특성을 가진 3D 이상 데이터를 포함한다. 또한, MAD 데이터셋을 기반으로 학습된 새로운 방법인 OmniposeAD를 제안한다. 이 방법은 자세 무관 이상 탐지에 특화된 설계를 통해 뛰어난 성능을 발휘한다. 광범위한 평가를 통해 본 연구에서 제안한 데이터셋과 방법의 타당성과 관련성을 입증하였다. 더불어, 8가지 이상 탐지 패러다임을 커버하는 기초 모델과 함께 오픈소스 벤치마크 라이브러리를 제공하여, 본 분야의 향후 연구 및 응용을 촉진한다. 코드, 데이터, 모델은 모두 공개되어 있으며, GitHub에서 확인 가능하다: https://github.com/EricLee0224/PAD.