2달 전
GS3D: 자율 주행을 위한 효율적인 3D 객체 검출 프레임워크
Buyu Li; Wanli Ouyang; Lu Sheng; Xingyu Zeng; Xiaogang Wang

초록
우리는 자율 주행 환경에서 단일 RGB 이미지를 기반으로 한 효율적인 3D 객체 검출 프레임워크를 제시합니다. 본 연구에서는 2D 이미지에서 내재된 3D 정보를 추출하고, 포인트 클라우드나 스테레오 데이터 없이 객체의 정확한 3D 바운딩 박스를 결정하는 데 중점을 두고 있습니다. 기존의 2D 객체 검출기를 활용하여, 각 예측된 2D 박스에 대해 효과적으로 대략적인 큐브체(coarse cuboid)를 얻는 방법을 제안합니다. 이 대략적인 큐브체는 충분한 정확도를 가지고 있어, 이를 통해 객체의 3D 박스를 세부 조정하여 결정할 수 있는 안내 역할을 합니다. 이전 최신 방법들이 2D 바운딩 박스에서 추출된 특징만을 사용하여 박스를 세부 조정하는 것과 달리, 우리는 가시 표면의 시각적 특징을 활용하여 객체의 3D 구조 정보를 탐색합니다. 표면에서 얻은 새로운 특징은 2D 바운딩 박스만 사용할 때 발생하는 표현 모호성 문제를 해결하는 데 이용됩니다. 또한, 우리는 다양한 3D 박스 세부 조정 방법을 연구하였으며, 품질 인식 손실(quality aware loss)을 사용한 분류 공식(classification formulation)이 회귀(regression)보다 훨씬 더 우수한 성능을 보임을 발견하였습니다. KITTI 벤치마크에서 평가한 결과, 우리의 접근법은 단일 RGB 이미지를 기반으로 하는 3D 객체 검출 분야에서 현재 최신 방법들을 능가하는 것으로 나타났습니다.