2달 전

DualPoseNet: 카테고리 수준의 6D 객체 자세 및 크기 추정을 위한 자세 일관성 학습이 개선된 듀얼 포즈 네트워크

Lin, Jiehong ; Wei, Zewei ; Li, Zhihao ; Xu, Songcen ; Jia, Kui ; Li, Yuanqing
DualPoseNet: 카테고리 수준의 6D 객체 자세 및 크기 추정을 위한 
자세 일관성 학습이 개선된 듀얼 포즈 네트워크
초록

범주 수준 6D 객체 자세 및 크기 추정은 단일 임의의 시점에서 복잡한 장면에서 관찰된 객체 인스턴스의 회전, 이동, 크기의 전체 자세 구성을 예측하는 것입니다. 본 논문에서는 이 작업을 위해 포즈 일관성 학습을 개선한 새로운 방법인 듀얼 포즈 네트워크(Dual Pose Network)를 제안하며, 이를 줄여서 듀얼포즈넷(DualPoseNet)이라고 합니다. 듀얼포즈넷은 공유된 포즈 인코더 위에 두 개의 병렬 포즈 디코더를 쌓아놓았으며, 암시적 디코더는 명시적 디코더와 다른 작동 메커니즘으로 객체의 포즈를 예측합니다. 따라서 이들은 포즈 인코더의 학습에 보완적인 감독을 가하게 됩니다. 우리는 스퍼리컬 컨볼루션(spherical convolutions)을 기반으로 인코더를 구성하고, 외관과 형태 관찰에서 얻은 포즈 민감 특징을 더 잘 임베딩하기 위한 스퍼리컬 퓨전(Spherical Fusion) 모듈을 설계하였습니다. 테스트용 CAD 모델이 주어지지 않은 경우, 암시적 디코더의 신규 도입이 두 디코더 간의 예측된 포즈 일관성을 강제로 유지하는 자기 적응 손실 항(self-adaptive loss term)을 사용하여 테스트 중 정교한 포즈 예측을 가능하게 합니다. 범주 수준 및 인스턴스 수준 객체 자세 데이터셋 벤치마크에서 수행한 철저한 실험 결과, 우리의 설계가 효과적임을 확인할 수 있었습니다. 듀얼포즈넷은 고정밀 영역에서 기존 방법들을 크게 능가하며, 우리의 코드는 https://github.com/Gorilla-Lab-SCUT/DualPoseNet 에 공개적으로 제공됩니다.

DualPoseNet: 카테고리 수준의 6D 객체 자세 및 크기 추정을 위한 자세 일관성 학습이 개선된 듀얼 포즈 네트워크 | 최신 연구 논문 | HyperAI초신경