2달 전

DenseFusion: 반복적인 밀도 융합을 통한 6D 객체 자세 추정

Wang, Chen ; Xu, Danfei ; Zhu, Yuke ; Martín-Martín, Roberto ; Lu, Cewu ; Fei-Fei, Li ; Savarese, Silvio
DenseFusion: 반복적인 밀도 융합을 통한 6D 객체 자세 추정
초록

RGB-D 이미지에서 6D 객체 자세 추정을 수행하는 주요 기술적 난제는 두 개의 보완적인 데이터 소스를 완전히 활용하는 것입니다. 이전 연구들은 RGB 이미지와 깊이 정보를 별도로 처리하거나 비용이 많이 드는 후처리 단계를 사용하여, 고밀도 환경과 실시간 응용 분야에서 성능에 제한을 초래하였습니다. 본 연구에서는 DenseFusion이라는 일반적인 프레임워크를 제시합니다. 이 프레임워크는 알려진 객체 집합의 6D 자세를 RGB-D 이미지로부터 추정하는 데 사용됩니다. DenseFusion은 이질 구조로, 두 데이터 소스를 개별적으로 처리하고 새로운 밀집 융합 네트워크를 통해 픽셀 단위의 밀집 특성 임베딩을 추출하며, 이를 바탕으로 자세를 추정합니다. 또한, 우리는 종단 간 반복적인 자세 정교화 절차를 통합하여, 실시간 추론에 가까운 성능을 달성하면서 자세 추정의 정확성을 더욱 향상시키고 있습니다. 실험 결과, 제안된 방법이 YCB-Video와 LineMOD 두 데이터셋에서 최신 접근법들을 능가함을 확인할 수 있었습니다. 또한, 제안된 방법을 실제 로봇에 적용하여 추정된 자세에 기반한 객체의 집게 및 조작 작업을 수행하였습니다.