12일 전
자율 주행을 위한 공동 3D 인스턴스 세그멘테이션 및 객체 탐지
{ Ruigang Yang, Hongdong Li, Yuchao Dai, Junbo Yin, Liu Liu, Xibin Song, Jin Fang, Dingfu Zhou}

초록
현재 자율주행(AD) 분야에서 대부분의 3차원 객체 탐지 프레임워크(어노테이션 기반 또는 어노테이션 프리 기반)는 객체 탐지를 경계 상자(BBox) 회귀 문제로 간주하고 있다. 그러나 이러한 축소된 표현 방식은 객체의 모든 정보를 탐색하는 데 부족하다. 이 문제를 해결하기 위해, 3차원 BBox와 인스턴스 세그멘테이션을 동시에 예측할 수 있는 간단하면서도 실용적인 탐지 프레임워크를 제안한다. 인스턴스 세그멘테이션을 위해, 전경 포인트들을 각 객체의 중심에 집계하는 공간 임베딩(Spatial Embeddings, SEs) 전략을 제안한다. SE 결과를 기반으로 간단한 클러스터링 전략을 통해 객체 제안 영역을 생성한다. 각 클러스터에 대해 단 하나의 제안 영역만 생성되므로, 기존의 비최대 억제(NMS) 과정이 더 이상 필요하지 않다. 마지막으로, 제안된 인스턴스 인지 ROI 풀링 기법을 통해 두 번째 단계 네트워크에서 BBox를 정밀하게 보정한다. 공개된 KITTI 데이터셋에서의 실험 결과, 제안된 SEs 기법이 다른 특징 임베딩 기반 방법과 비교해 인스턴스 세그멘테이션 성능을 크게 향상시킴을 확인할 수 있으며, 동시에 KITTI 테스트 벤치마크에서 대부분의 3차원 객체 탐지기보다 뛰어난 성능을 달성하였다.