15일 전

GDRNPP: 기하학적 지침과 완전히 학습 기반의 객체 자세 추정기

Xingyu Liu, Ruida Zhang, Chenyangguang Zhang, Gu Wang, Jiwen Tang, Zhigang Li, Xiangyang Ji
GDRNPP: 기하학적 지침과 완전히 학습 기반의 객체 자세 추정기
초록

정밀한 물체의 6차원 자세 추정(6D pose estimation)은 컴퓨터 비전 분야에서 오랜 기간 지속된 도전 과제이다. 최근 딥러닝의 등장은 컨볼루션 신경망(Convolutional Neural Networks, CNN)이 신뢰할 수 있는 6D 자세를 예측할 수 있는 잠재력을 보여주었다. 그러나 현재 직렬 자세 회귀 네트워크는 여전히 최적의 성능을 발휘하지 못하고 있어, 대부분의 방법들은 여전히 어느 정도의 정도로 전통적인 기법에 의존하고 있다. 예를 들어, 최고 성능을 기록하는 방법들은 일반적으로 2D-3D 또는 3D-3D 대응 관계를 먼저 구축한 후, RANSAC 기반의 PnP 또는 Kabsch 알고리즘을 적용하고, 이후 정밀화를 위해 ICP(Iterative Closest Point) 알고리즘을 활용하는 간접 전략을 채택한다. 이러한 접근은 성능 향상에는 기여하지만, 전통적 기법의 통합으로 인해 네트워크가 계산 시간이 길어지고 엔드 투 엔드 학습이 불가능하게 되는 단점이 있다. 이와는 반대로, 본 논문은 완전히 학습 기반의 물체 자세 추정기(learning-based object pose estimator)를 제안한다. 본 연구에서는 먼저 직렬 및 간접적 접근 방식을 심층적으로 분석하고, 단일 이미지에서 엔드 투 엔드 방식으로 6D 자세를 학습할 수 있는 간단하면서도 효과적인 기하학적 지도를 제공하는 직렬 회귀 네트워크(Geometry-guided Direct Regression Network, GDRN)를 제안한다. 이후, 추가적인 깊이 데이터가 제공될 경우 자세 정확도를 향상시키기 위해 기하학적 지도를 기반으로 한 자세 정밀화 모듈을 도입한다. 예측된 좌표 맵을 기반으로, 관측된 RGB-D 이미지와 렌더링된 RGB-D 이미지 간에 강건하고 정확한 3D-3D 대응 관계를 형성할 수 있는 엔드 투 엔드 미분 가능한 아키텍처를 구축한다. 제안된 개선된 자세 추정 파이프라인인 GDRNPP(GDRN Plus Plus)는 두 해 연속으로 BOP 챌린지의 랭킹을 선도하며, 정확성과 속도 측면에서 기존의 전통적 기법에 의존하는 모든 이전 방법들을 초월한 최초의 시스템이 되었다. 코드와 모델은 다음 링크에서 공개된다: https://github.com/shanice-l/gdrnpp_bop2022.

GDRNPP: 기하학적 지침과 완전히 학습 기반의 객체 자세 추정기 | 최신 연구 논문 | HyperAI초신경