2달 전
생성 범주 수준 형태 및 자세 추정에 대한 의미 원시형
Li, Guanglin ; Li, Yifeng ; Ye, Zhichao ; Zhang, Qihang ; Kong, Tao ; Cui, Zhaopeng ; Zhang, Guofeng

초록
일상 물체에 대한 3D 이해를 자율 에이전트에게 부여하는 것은 로봇학 응용 분야에서 큰 도전 과제입니다. 미지의 환경을 탐사할 때, 물체 자세 추정을 위한 기존 방법들은 물체 형태의 다양성 때문에 아직 만족스럽지 않습니다. 본 논문에서는 단일 RGB-D 이미지로부터 카테고리 수준의 물체 형태와 자세 추정을 위한 새로운 프레임워크를 제안합니다. 카테고리 내 변동성을 처리하기 위해, 다양한 형태를 통합된 잠재 공간으로 인코딩하는 의미적 원시 표현(semantic primitive representation)을 채택하였습니다. 이는 관찰된 포인트 클라우드와 추정된 형태 간의 신뢰할 수 있는 대응 관계를 설정하는 데 핵심적인 역할을 합니다. 그 다음, SIM(3)-불변형 모양 설명자(SIM(3)-invariant shape descriptor)를 사용하여 물체의 모양과 자세를 우아하게 분리하였으며, 이로써 임의의 자세에서 목표물의 잠재 모양 최적화를 지원합니다. 광범위한 실험 결과, 제안된 방법이 실제 데이터셋에서 최고 수준의 자세 추정 성능과 더 나은 일반화 능력을 보였습니다. 코드와 동영상은 https://zju3dv.github.io/gCasp에서 확인 가능합니다.