2달 전
Pose for Everything: 모든 범주에 대한 자세 추정
Xu, Lumin ; Jin, Sheng ; Zeng, Wang ; Liu, Wentao ; Qian, Chen ; Ouyang, Wanli ; Luo, Ping ; Wang, Xiaogang

초록
기존의 2D 자세 추정 연구는 주로 특정 범주, 예를 들어 인간, 동물, 차량에 초점을 맞추고 있습니다. 그러나 많은 응용 시나리오에서 미리 보지 못한 객체 클래스의 자세/키포인트를 감지해야 하는 경우가 있습니다. 본 논문에서는 이러한 문제를 해결하기 위해 범주 독립적 자세 추정(CAPE, Category-Agnostic Pose Estimation) 작업을 소개합니다. 이 작업은 몇 개의 키포인트 정의가 있는 샘플만 주어진 상태에서 어떤 객체 클래스든 자세를 감지할 수 있는 모델을 만드는 것을 목표로 합니다. 이를 달성하기 위해, 우리는 자세 추정 문제를 키포인트 매칭 문제로 정식화하고 새로운 CAPE 프레임워크인 POse Matching Network (POMNet)을 설계하였습니다. 또한, 다양한 키포인트 간의 상호작용과 서포트 이미지 및 쿼리 이미지 간의 관계를 포착하기 위한 트랜스포머 기반 Keypoint Interaction Module (KIM)을 제안하였습니다. 우리는 또한 100개의 객체 범주와 20,000개 이상의 인스턴스를 포함하는 다중 범주 자세(MP-100) 데이터셋을 소개합니다. 이 데이터셋은 CAPE 알고리즘 개발에 적합하게 설계되었습니다. 실험 결과, 우리의 방법이 다른 기준 접근법들보다 크게 우수함을 보여주었습니다. 코드와 데이터는 https://github.com/luminxu/Pose-for-Everything에서 제공됩니다.