11일 전
FFB6D: 6차원 자세 추정을 위한 완전 흐름 양방향 융합 네트워크
Yisheng He, Haibin Huang, Haoqiang Fan, Qifeng Chen, Jian Sun

초록
이 연구에서는 단일 RGBD 이미지로부터 6차원 자세 추정을 위한 전류 방향 복합 네트워크인 FFB6D를 제안한다. 본 연구의 핵심 통찰은 RGB 이미지의 외관 정보와 깊이 이미지로부터 얻는 기하 정보가 서로 보완적인 두 가지 데이터 소스라는 점이며, 이러한 정보를 어떻게 최대한 효과적으로 활용할지에 대한 문제는 여전히 미해결 상태이다. 이를 해결하기 위해, 본 연구는 표현 학습과 출력 표현 선택을 위해 외관 정보와 기하 정보를 학습적으로 통합하는 FFB6D를 제안한다. 구체적으로 표현 학습 단계에서는 두 네트워크의 전체 흐름에 이중 방향 복합 모듈을 구축하여, 인코딩 및 디코딩 각 층에 복합를 적용한다. 이를 통해 두 네트워크는 상호의 국소적 및 전역적 보완 정보를 활용하여 더 우수한 표현을 얻을 수 있다. 또한 출력 표현 단계에서는 물체의 텍스처 및 기하 정보를 고려한 간단하면서도 효과적인 3D 키포인트 선택 알고리즘을 설계하여, 정밀한 자세 추정을 위한 키포인트 위치 결정을 단순화하였다. 실험 결과, 제안한 방법은 여러 벤치마크에서 기존 최고 성능 기법들을 크게 상회함을 입증하였다. 코드 및 영상은 \url{https://github.com/ethnhe/FFB6D.git}에서 제공된다.