2달 전
DAOcc: 3D 객체 감지 지원 다중 센서 융합을 통한 3D 점유 예측
Yang, Zhen ; Dong, Yanpeng ; Wang, Heng ; Ma, Lichao ; Cui, Zijian ; Liu, Qi ; Pei, Haoran

초록
다중 센서 융합은 자율 주행 및 로봇 기술에서 중요한 역할을 하는 3D 의미 점유 예측의 정확성과 안정성을 크게 향상시킵니다. 그러나 대부분의 기존 접근 방식은 최고 성능을 달성하기 위해 큰 이미지 해상도와 복잡한 네트워크에 의존하여 실제 시나리오에서의 적용을 제약하고 있습니다. 또한, 대부분의 다중 센서 융합 접근 방식은 융합 특징의 개선에 초점을 맞추면서 이러한 특징에 대한 감독 전략의 탐구를 간과하고 있습니다. 이에 우리는 3D 객체 검출 감독을 활용하여 우수한 성능을 달성하는 데 도움을 주는 새로운 다중 모달 점유 예측 프레임워크인 DAOcc를 제안합니다. DAOcc는 배포에 적합한 이미지 특징 추출 네트워크와 실용적인 입력 이미지 해상도를 사용합니다. 또한, BEV 뷰 범위 확장 전략을 도입하여 이미지 해상도 감소로 인한 부정적인 영향을 완화합니다. 실험 결과, DAOcc는 Occ3D-nuScenes 및 SurroundOcc 벤치마크에서 새로운 최고 수준의 성능을 달성하였으며, ResNet50과 256*704 입력 이미지 해상도만 사용하여 다른 방법들보다 크게 우수한 성능을 보였습니다. 코드는 https://github.com/AlphaPlusTT/DAOcc에서 제공될 예정입니다.