11일 전

레이 노이즈 제거: 다중 시점 3D 객체 탐지를 위한 깊이 인식 하드 네거티브 샘플링

Feng Liu, Tengteng Huang, Qianjing Zhang, Haotian Yao, Chi Zhang, Fang Wan, Qixiang Ye, Yanzhao Zhou
레이 노이즈 제거: 다중 시점 3D 객체 탐지를 위한 깊이 인식 하드 네거티브 샘플링
초록

다중 시점 3D 객체 탐지 시스템은 이미지로부터 깊이를 추정하는 데 어려움을 겪으며, 이로 인해 정확한 예측 생성이 어렵고 중복되거나 잘못된 탐지가 증가하는 문제가 발생한다. 본 논문에서는 카메라 레이를 따라 전략적으로 샘플링하여 어려운 음성 예시(hard negatives)를 구성함으로써 탐지 정확도를 향상시키는 혁신적인 기법인 Ray Denoising을 제안한다. 이러한 음성 예시는 시각적으로 진짜 긍정 예시와 구분하기 어려운 형태로 설계되어, 모델이 깊이 인식 능력을 갖춘 특징을 학습하도록 유도함으로써 진짜 긍정과 거짓 긍정을 더 잘 구분할 수 있도록 한다. Ray Denoising은 어떠한 DETR 기반 다중 시점 3D 탐지기와도 호환되는 플러그 앤 플레이 모듈로 설계되었으며, 학습 시 계산 비용은 거의 증가시키지 않으면서도 추론 속도에는 영향을 주지 않는다. 광범위한 실험과 상세한 아블레이션 연구를 통해 Ray Denoising이 여러 데이터셋에서 강력한 기준 모델들을 뛰어넘는 일관된 성능을 보임을 입증하였다. NuScenes 데이터셋에서 최첨단 기법인 StreamPETR 대비 평균 정밀도(mAP)에서 1.9% 향상을 달성하였으며, Argoverse 2 데이터셋에서도 두드러진 성능 향상이 나타나 그 일반화 능력을 입증한다. 코드는 https://github.com/LiewFeng/RayDN 에 공개될 예정이다.

레이 노이즈 제거: 다중 시점 3D 객체 탐지를 위한 깊이 인식 하드 네거티브 샘플링 | 최신 연구 논문 | HyperAI초신경