13일 전

RBGNet: 3차원 객체 탐지를 위한 광선 기반 그룹화

Haiyang Wang, Shaoshuai Shi, Ze Yang, Rongyao Fang, Qi Qian, Hongsheng Li, Bernt Schiele, Liwei Wang
RBGNet: 3차원 객체 탐지를 위한 광선 기반 그룹화
초록

컴퓨터 비전 분야의 핵심 문제인 3차원 객체 탐지(3D object detection)는 최근 급속한 발전을 보이고 있다. 비정형적이고 희박하게 분포된 점들로부터 점별 특징(point-wise features)을 추출하기 위해 기존의 방법들은 일반적으로 특징 그룹화(feature grouping) 모듈을 활용하여 객체 후보 영역에 점 특징을 집계한다. 그러나 이러한 기존 방법들은 전경 객체의 표면 기하학적 구조를 활용하여 그룹화 및 3차원 박스 생성을 개선하는 데 아직 미흡한 실적을 보이고 있다. 본 논문에서는 점군(point clouds)에서 정확한 3차원 객체 탐지를 위한 기반 투표 기반 3차원 탐지기(RBGNet) 프레임워크를 제안한다. 3차원 박스 예측을 위한 클러스터 특징을 향상시키기 위해 객체의 형태를 보다 잘 표현할 수 있는 표현을 학습하기 위해, 클러스터 중심에서 균일하게 방출된 일련의 광선(ray)을 사용하여 객체 표면 상의 점별 특징을 집계하는 광선 기반 특징 그룹화 모듈(ray-based feature grouping module)을 제안한다. 또한, 전경 점들이 3차원 박스 추정에 더 의미 있는 정보를 포함하고 있음을 고려하여, 다운샘플링 과정에서 객체 표면에 더 많은 점을 샘플링할 수 있도록 새로운 전경 편향 샘플링 전략(foreground biased sampling strategy)을 설계하였다. 이는 탐지 성능을 더욱 향상시키는 데 기여한다. 제안한 모델은 ScanNet V2 및 SUN RGB-D 데이터셋에서 최신 기술(SOTA, state-of-the-art) 수준의 3차원 탐지 성능을 달성하며, 두 데이터셋 모두에서 뚜렷한 성능 향상을 보였다. 코드는 https://github.com/Haiyang-W/RBGNet 에서 공개될 예정이다.

RBGNet: 3차원 객체 탐지를 위한 광선 기반 그룹화 | 최신 연구 논문 | HyperAI초신경