3달 전

EA-LSS: 3차원 BEV 객체 탐지를 위한 엣지 인지 리프트-스플래트-샷 프레임워크

Haotian Hu, Fanyi Wang, Jingwen Su, Yaonong Wang, Laifeng Hu, Weiye Fang, Jingwei Xu, Zhiwang Zhang
EA-LSS: 3차원 BEV 객체 탐지를 위한 엣지 인지 리프트-스플래트-샷 프레임워크
초록

최근 들어 라이프-스플래트-샷(Lift-Splat-Shot, LSS) 기반 3차원 객체 탐지 기법에서 큰 진전이 이루어졌다. 그러나 카메라 기반 및 다중 모달리티 3차원 객체 탐지 모델의 정확도를 제한하는 중요한 요인으로, 깊이 추정의 부정확성이 여전히 존재하며, 특히 깊이가 급격히 변화하는 영역(즉, '깊이 점프(depth jump)' 문제)에서 두드러진다. 본 논문에서는 새로운 엣지 인식형 라이프-스플래트-샷(Edge-aware Lift-splat-shot, EA-LSS) 프레임워크를 제안한다. 구체적으로, '깊이 점프' 문제를 완화하기 위해 엣지 인식형 깊이 융합(Edge-aware Depth Fusion, EADF) 모듈을 도입하였으며, 더 정교한 깊이 추정을 위한 세밀한 깊이(Fine-grained Depth, FGD) 모듈을 제안하였다. 제안한 EA-LSS 프레임워크는 모든 LSS 기반 3차원 객체 탐지 모델과 호환되며, 추론 시간의 거의 증가 없이 모델 성능을 효과적으로 향상시킨다. nuScenes 벤치마크에서의 실험 결과, EA-LSS는 카메라 기반 모델과 다중 모달리티 모델 모두에서 뛰어난 성능을 보였다. 특히 주목할 점은, EA-LSS가 nuScenes 테스트 벤치마크에서 mAP 76.5%, NDS 77.6%의 최신 기술 수준(SOTA) 성능을 달성했다는 점이다.