2달 전

GenPose: 확산 모델을 통한 생성적 범주 수준 객체 포즈 추정

Zhang, Jiyao ; Wu, Mingdong ; Dong, Hao
GenPose: 확산 모델을 통한 생성적 범주 수준 객체 포즈 추정
초록

물체 자세 추정은 체화된 인공지능(embodied AI)과 컴퓨터 비전에서 중요한 역할을 하며, 지능형 에이전트가 주변 환경을 이해하고 상호작용할 수 있도록 합니다. 카테고리 수준의 자세 추정의 실용성에도 불구하고, 현재 접근 방식들은 부분적으로 관찰된 포인트 클라우드에서 다중 가설 문제(multihypothesis issue)를 겪고 있습니다. 본 연구에서는 이러한 문제를 해결하기 위해 카테고리 수준의 물체 자세 추정을 조건부 생성 모델링으로 재구성하는 새로운 방법을 제안합니다. 전통적인 점 대 점 회귀(point-to-point regression)에서 벗어나, 스코어 기반 확산 모델(score-based diffusion models)을 활용하여 확산 모델에서 후보들을 샘플링하고, 이들을 두 단계 과정을 통해 집계합니다: 가능도 추정을 통해 이상치(outliers)를 필터링한 다음, 남은 후보들의 평균 풀링(mean-pooling)을 수행합니다.가능도를 추정할 때 비용이 많이 드는 통합 과정을 피하기 위해, 원래의 스코어 기반 모델에서 에너지 기반 모델(energy-based model)을 학습시키는 대안적 방법을 소개합니다. 이를 통해 끝까지 가능한 가능도 추정(end-to-end likelihood estimation)이 가능해집니다. 우리의 접근 방식은 REAL275 데이터셋에서 최고 수준의 성능을 달성하며, 엄격한 5d2cm 및 5d5cm 메트릭에서 각각 50%와 60%를 초과하는 결과를 보여줍니다. 또한, 유사한 대칭 속성을 공유하는 새로운 카테고리에 대한 강력한 일반화 능력을 보여주며, 미세 조정(fine-tuning) 없이도 적용될 수 있습니다. 그리고 물체 자세 추적(object pose tracking) 작업에도 쉽게 적응하여 현존하는 최신 기법들과 비교 가능한 결과를 제공합니다.

GenPose: 확산 모델을 통한 생성적 범주 수준 객체 포즈 추정 | 최신 연구 논문 | HyperAI초신경