2달 전
깊은 호프 보팅을 이용한 포인트 클라우드에서의 3D 객체 검출
Qi, Charles R. ; Litany, Or ; He, Kaiming ; Guibas, Leonidas J.

초록
현재의 3D 객체 검출 방법은 2D 검출기에 크게 영향을 받습니다. 2D 검출기의 아키텍처를 활용하기 위해, 이들은 종종 3D 포인트 클라우드를 정규 그리드(예: 복셀 그리드 또는 상공 시점 이미지)로 변환하거나, 2D 이미지에서의 검출을 통해 3D 박스를 제안합니다. 그러나 포인트 클라우드에서 직접 객체를 검출하려는 연구는 거의 이루어지지 않았습니다. 본 연구에서는 포인트 클라우드 데이터에 대한 3D 검출 파이프라인을 가능한 한 일반적으로 구성하기 위해 원칙으로 돌아갑니다. 그러나 데이터의 희소성 -- 3D 공간 내의 2D 매니폴드 샘플 -- 때문에, 장면 포인트에서 직접 바운딩 박스 매개변수를 예측할 때 주요 과제에 직면하게 됩니다: 3D 객체 중심점이 어떤 표면 포인트에서도 멀리 떨어져 있을 수 있으므로, 단계에서 정확히 회귀시키기가 어렵습니다. 이 문제를 해결하기 위해, 우리는 딥 포인트 세트 네트워크와 호그 보팅(Hough voting)의 시너지를 기반으로 하는 end-to-end 3D 객체 검출 네트워크인 VoteNet을 제안합니다. 우리의 모델은 간단한 설계, 소형 모델 크기 및 높은 효율성을 유지하면서 실제 3D 스캔 데이터셋 두 개, ScanNet과 SUN RGB-D에서 최고 수준의 3D 검출 성능을 달성합니다. 특히, VoteNet은 색상 이미지를 사용하지 않고 순수한 기하학적 정보만으로도 이전 방법들을 능가하는 성능을 보여줍니다.