
초록
본 논문에서는 RGB 이미지에서 3D 객체 검출 및 6D 자세 추정을 위한 새로운 딥러닝 방법을 제시합니다. 이 방법은 DPOD (Dense Pose Object Detector)라는 이름으로, 입력 이미지와 사용 가능한 3D 모델 간의 밀집된 다중 클래스 2D-3D 대응 맵을 추정합니다. 대응 관계가 주어지면, PnP (Perspective-n-Point) 및 RANSAC (RANdom SAmple Consensus)를 통해 6자유도(6DoF) 자세가 계산됩니다. 초기 자세 추정치에 대한 추가적인 RGB 자세 정교화는 사용자 정의 딥러닝 기반 정교화 방식을 사용하여 수행됩니다. 본 연구의 결과와 관련 연구들과의 비교를 통해, 많은 수의 대응 관계가 정교화 전후로 고품질의 6D 자세를 얻는 데 유리하다는 것을 입증하였습니다. 다른 방법들이 주로 실제 데이터를 사용하여 학습하고 합성 렌더링에 대해 학습하지 않는 것과 달리, 우리는 합성 및 실제 훈련 데이터에서 평가를 수행하여 최근 모든 감지기들보다 우수한 결과를 보여주었습니다. 본 논문에서 제시된 접근법은 정확하면서도 실시간 처리가 가능합니다.