2달 전
GPV-Pose: 기하학적 가이드를 통한 카테고리 수준 객체 포즈 추정
Di, Yan ; Zhang, Ruida ; Lou, Zhiqiang ; Manhardt, Fabian ; Ji, Xiangyang ; Navab, Nassir ; Tombari, Federico

초록
최근 6D 객체 포즈 추정은 큰 발전을 이뤘지만, 대부분의 방법들은 여전히 단일 객체나 몇 개의 다른 객체만 처리할 수 있어 그 응용 범위가 제한적입니다. 이러한 문제를 해결하기 위해, 최근에는 주어진 객체 클래스 집합에서 미리 본 적 없는 인스턴스들의 6D 포즈와 3D 메트릭 크기를 예측하는 카테고리 레벨 객체 포즈 추정이 재조명되고 있습니다. 그러나 이는 클래스 내부에서 심각한 형태 변동이 발생하기 때문에 훨씬 더 어려운 과제입니다. 이를 해결하기 위해, 우리는 기하학적 통찰력을 활용하여 카테고리 레벨 포즈에 민감한 특징의 학습을 강화하는 새로운 프레임워크인 GPV-Pose를 제안합니다.첫째, 기하학적으로 인식 가능한 회전 행렬을 복원할 수 있는 분리된 신뢰도 기반 회전 표현을 도입합니다. 둘째, 3D 객체 바운딩 박스의 안정적인 검색을 위한 새로운 기하학적 가이드 점별 투표 패러다임을 제안합니다. 마지막으로, 이러한 다양한 출력 스트림을 활용하여 여러 가지 기하학적 일관성 조건들을 강제 적용할 수 있으며, 특히 비대칭 카테고리에서 성능을 더욱 향상시킵니다.GPV-Pose는 일반적인 공개 벤치마크에서 최신 연구 경쟁자들보다 우수한 결과를 보여주며, 거의 실시간 추론 속도인 20 FPS를 달성하고 있습니다.