11일 전
Far3D: 주변 시야 3D 객체 탐지의 가능성을 확장하다
Xiaohui Jiang, Shuailin Li, Yingfei Liu, Shihao Wang, Fan Jia, Tiancai Wang, Lijin Han, Xiangyu Zhang

초록
최근, 주변 영상(surround-view images)을 이용한 3D 객체 탐지 기술은 낮은 구현 비용이라는 장점을 바탕으로 눈에 띄는 발전을 이루었다. 그러나 대부분의 기존 연구들은 근거리 탐지에 주로 초점을 맞추며, 장거리 탐지에 대한 탐색은 여전히 부족한 실정이다. 기존 방법을 직접적으로 장거리 범위로 확장할 경우, 과도한 계산 비용과 안정적인 수렴 문제 등 여러 도전 과제가 존재한다. 이러한 한계를 극복하기 위해 본 논문은 새로운 스파스 쿼리 기반 프레임워크인 Far3D를 제안한다. 고품질의 2D 객체 사전 정보를 활용하여 3D 적응형 쿼리를 생성함으로써, 기존의 3D 전역 쿼리와 보완적인 관계를 형성한다. 장거리 객체에 대해 다양한 시점과 스케일에서 구분 가능한 특징을 효율적으로 추출하기 위해, 시점 인지(aggregation) 모듈을 도입한다. 또한, 쿼리 오류 전파 문제를 해결하고 장거리 탐지 작업에서의 수렴 불안정성을 완화하기 위해 범위 조절형 3D 디노이징 기법을 제안한다. 특히, Far3D는 도전적인 Argoverse 2 데이터셋에서 150미터에 이르는 광범위한 탐지 범위를 커버하며, 여러 LiDAR 기반 접근법을 넘어서는 최고 수준의 성능을 보였다. 또한, nuScenes 데이터셋에서도 기존 방법들에 비해 뛰어난 성능을 나타냈다. 관련 코드는 https://github.com/megvii-research/Far3D 에서 공개되어 있다.