LXL: LiDAR 제외형 경량 3D 객체 탐지 기술: 4D 이미징 레이더 및 카메라 융합 기반

4차원(4D) 이미징 레이더는 새로운 기술이자 비교적 저렴한 장치로서 자율주행에서 3차원 물체 탐지에 효과적임이 이미 입증되었다. 그러나 4D 레이더 포인트 클라우드의 희박성과 노이즈로 인해 성능 향상이 제한되며, 다른 모달리티와의 융합에 대한 심층적인 연구는 여전히 부족한 실정이다. 한편, 이미지 기반 탐지기에서 일부에 적용된 새로운 이미지 뷰 변환 전략인 '샘플링(sampling)'은, 이미지 깊이 예측 없이도 기존에 널리 사용되는 '깊이 기반 스플래터링(depth-based splatting)' 전략을 포함한 Lift-Splat-Shoot(LSS)보다 우수한 성능을 보여주고 있다. 그러나 '샘플링' 전략의 잠재력은 아직 충분히 발휘되지 못하고 있다. 본 논문은 카메라와 4D 이미징 레이더 융합 기반 3차원 물체 탐지에 있어서 '샘플링' 뷰 변환 전략을 탐구한다. 이미지 전방 시점(PV) 특징에서 LiDAR 제외형 라이트(LiDAR Excluded Lean, LXL) 모델을 통해 예측된 이미지 깊이 분포 맵과 레이더 벌점 시점(BEV) 특징에서 생성된 레이더 3차원 점유 그리드를 각각 생성한다. 이들 정보는 LXL의 핵심인 '레이더 점유율 보조 깊이 기반 샘플링(radar occupancy-assisted depth-based sampling)'으로 전달되어 이미지 뷰 변환을 지원한다. 실험을 통해 이미지 깊이 정보와 레이더 정보를 도입함으로써 '샘플링' 전략이 더욱 정확한 뷰 변환을 수행할 수 있음을 입증하였다. VoD 및 TJ4DRadSet 데이터셋에서의 실험 결과, 별도의 복잡한 기법 없이도 제안된 방법이 최신 기술에 비해 상당한 성능 우위를 보였다. 제거 실험(Ablation study) 결과, 다양한 개선 설정 중에서 본 방법이 가장 우수한 성능을 기록함을 확인하였다.