
초록
최근 로봇공학 및 증강현실 분야에서의 유망한 응용 사례로 인해 포인트 클라우드에서의 3차원 객체 탐지에 대한 관심이 크게 증가하고 있다. 본 논문에서는 처음으로 제안된 완전 컨볼루션형 앵커리스(Anchor-free) 실내 3차원 객체 탐지 방법인 FCAF3D를 소개한다. 이는 포인트 클라우드를 복셀(Voxel) 표현으로 변환하고, 희소 컨볼루션(Sparse Convolution)을 활용하여 복셀을 처리하는 간단하면서도 효과적인 방법이다. FCAF3D는 단일 완전 컨볼루션 전방전달(Fully Convolutional Feed-Forward Pass)을 통해 대규모 장면을 최소한의 런타임으로 처리할 수 있다. 기존의 3차원 객체 탐지 방법들은 객체의 기하학적 구조에 대해 사전 가정을 하고 있는데, 이러한 가정이 모델의 일반화 능력을 제한한다고 주장한다. 이를 극복하기 위해, 사전 가정 없이 순수하게 데이터 주도적인 방식으로 더 우수한 성능을 달성할 수 있도록 새로운 방향성 바운딩 박스(parametrization of oriented bounding boxes)를 제안한다. 제안된 방법은 ScanNet V2 (+4.5), SUN RGB-D (+3.5), S3DIS (+20.5) 데이터셋에서 [email protected] 기준으로 최신 기술 수준(SOTA)의 3차원 객체 탐지 성능을 달성하였다. 코드와 모델은 https://github.com/samsunglabs/fcaf3d 에서 공개되어 있다.