
초록
우리는 새로운 6차원 물체 자세 추정 방법인 HybridPose를 소개한다. HybridPose는 입력 이미지 내 다양한 기하학적 정보를 표현하기 위해 하이브리드 중간 표현을 활용한다. 이 중간 표현은 관절점(keypoints), 에지 벡터(edge vectors), 대칭 대응(symmetry correspondences) 등을 포함한다. 단일 표현 방식과 비교하여, 하이브리드 표현 방식은 특정 유형의 예측 표현이 정확하지 않을 경우(예: 가림으로 인한 오차 발생 시)에도 자세 회귀 과정에서 더 풍부하고 다양한 특징을 활용할 수 있도록 한다. HybridPose가 사용하는 다양한 중간 표현들은 모두 동일한 간단한 신경망으로 예측 가능하며, 예측된 중간 표현에서 발생하는 이상치(outliers)는 강건한 회귀 모듈을 통해 필터링된다. 최신 기술 대비 HybridPose는 실행 시간과 정확도 면에서 유사한 성능을 보이며, 예를 들어 가림이 있는 Linemod 데이터셋에서 30 fps의 예측 속도를 달성하면서 평균 ADD(-S) 정확도 47.5%를 기록하여 최신 기술 수준의 성능을 입증하였다. HybridPose의 구현 코드는 https://github.com/chensong1995/HybridPose 에서 공개되어 있다.