
초록
정확한 3차원 물체 탐지(3DOD)는 자율 로봇이 복잡한 환경에서 안전하게 주행하기 위해 필수적이다. 그러나 희소한 LiDAR 데이터 기반으로 혼잡한 환경에서 정확한 3차원 경계상자(3D bounding box)를 회귀하는 것은 매우 도전적인 문제이다. 본 연구에서는 확률적 회귀를 위한 조건부 에너지 기반 모델(EBM)의 최신 발전을 활용하여 이 문제를 해결한다. 이미지 내 2차원 물체 탐지에서 EBM을 활용한 기법들은 뛰어난 성능을 보여왔지만, 이러한 기법들은 3차원 경계상자에 직접 적용되기 어렵다. 따라서 본 연구에서는 3차원 경계상자를 위한 미분 가능한 풀링 연산자(differentiable pooling operator)를 설계하였으며, 이는 본 EBM 네트워크의 핵심 모듈로 기능한다. 또한, 이 일반적인 접근법을 최신 3D 물체 탐지기인 SA-SSD에 통합하였다. KITTI 데이터셋에서 제안하는 방법은 모든 3DOD 지표에서 SA-SSD 기준선을 일관되게 상회하며, EBM 기반 회귀가 매우 정확한 3차원 물체 탐지에 가능성을 지닌다는 것을 입증한다. 코드는 https://github.com/fregu856/ebms_3dod 에서 공개되어 있다.