GLENet: 생성적 레이블 불확실성 추정을 통한 3D 객체 탐지기 성능 향상

3D 경계 상자에 대한 진정한 레이블(ground-truth) 주석에는 가려짐(occlusion), 신호 손실, 또는 수동 주석 오류 등으로 인해 내재된 모호성이 존재하며, 이는 학습 과정에서 깊은 3D 객체 탐지기에게 혼란을 초래하여 탐지 정확도를 저하시킬 수 있다. 그러나 기존의 방법들은 이러한 문제를 어느 정도 간과하며 레이블을 결정론적(deterministic)으로 취급한다. 본 논문에서는 레이블의 불확실성 문제를 객체에 대해 가능한 여러 가지 타당한 경계 상자들 간의 다양성으로 모델링한다. 이를 바탕으로, 조건부 변분 자동인코더(conditional variational autoencoders)에서 유도된 생성형 프레임워크인 GLENet을 제안한다. GLENet은 잠재 변수(latent variables)를 활용하여 일반적인 3D 객체와 그 가능성 있는 진정한 경계 상자들 사이의 일대다(one-to-many) 관계를 모델링한다. GLENet을 통해 생성된 레이블 불확실성은 플러그 앤 플레이(Plug-and-play) 모듈로 구현되며, 기존의 깊은 3D 탐지기에 간편하게 통합되어 확률적 탐지기(probabilistic detectors)를 구축하고, 위치 불확실성의 학습을 지도할 수 있다. 또한, 확률적 탐지기 내에서 예측된 위치 불확실성을 활용하여 IoU-브랜치의 학습을 안내하는 불확실성 인식 품질 평가기(uncertainty-aware quality estimator) 아키텍처를 제안한다. 제안된 방법들을 다양한 인기 있는 기반 3D 탐지기들에 통합하여 KITTI 및 Waymo 벤치마크 데이터셋에서 뚜렷하고 일관된 성능 향상을 입증하였다. 특히, 제안한 GLENet-VR은 모든 발표된 라이다 기반 접근법들보다 크게 우수하며, 도전적인 KITTI 테스트 세트에서 단일 모달(single-modal) 방법 중 최상위 순위를 기록하였다. 소스 코드와 사전 학습된 모델은 \url{https://github.com/Eaphan/GLENet}에서 공개되어 있다.