2달 전
GrooMeD-NMS: 단일 카메라 3D 객체 검출을 위한 그룹화된 수학적으로 미분 가능한 NMS
Kumar, Abhinav ; Brazil, Garrick ; Liu, Xiaoming

초록
현대의 3D 객체 검출기는 엔드투엔드 학습 아이디어로부터 큰 혜택을 받았습니다. 그러나 대부분의 검출기들은 추론 시에만 Non-Maximal Suppression (NMS)라는 후처리 알고리즘을 사용합니다. 2D 객체 검출과 같은 작업에서 NMS를 훈련 파이프라인에 포함시키는 시도가 있었지만, NMS의 비수학적인 표현 때문에 널리 채택되지는 않았�습니다. 본 논문에서는 단일 이미지 기반 3D 객체 검출을 위해 새로운 그룹화된 수학적으로 미분 가능한 NMS (GrooMeD-NMS)를 제시하고 통합합니다. 이를 통해 NMS 후의 박스에 대한 손실함수와 함께 네트워크를 엔드투엔드로 훈련할 수 있습니다. 먼저 NMS를 행렬 연산으로 공식화한 다음, 지도 없이 박스들을 그룹화하고 마스킹하여 NMS의 간단한 폐형 표현을 얻습니다. GrooMeD-NMS는 훈련과 추론 파이프라인 사이의 불일치를 해결하며, 따라서 네트워크가 미분 가능한 방식으로 최적의 3D 박스를 선택하도록 강제합니다. 결과적으로, GrooMeD-NMS는 KITTI 벤치마크 데이터셋에서 단일 이미지 기반 3D 객체 검출 성능이 단일 영상 기반 방법들과 유사한 최고 수준의 결과를 달성하였습니다. 코드와 모델은 https://github.com/abhi1kumar/groomed_nms 에서 확인할 수 있습니다.