11일 전
SqueezeSegV3: 효율적인 포인트 클라우드 세그멘테이션을 위한 공간적 적응형 컨볼루션
Chenfeng Xu, Bichen Wu, Zining Wang, Wei Zhan, Peter Vajda, Kurt Keutzer, Masayoshi Tomizuka

초록
LiDAR 포인트 클라우드 분할은 다양한 응용 분야에서 중요한 문제이다. 대규모 포인트 클라우드 분할의 경우, \textit{de facto} 표준 방법은 3차원 포인트 클라우드를 투영하여 2차원 LiDAR 이미지로 변환한 후 컨볼루션을 사용하여 처리하는 것이다. 정규 RGB 이미지와 LiDAR 이미지 간의 유사성에도 불구하고, 우리는 LiDAR 이미지의 특징 분포가 이미지 내 다양한 위치에서 급격히 변화함을 발견하였다. 이러한 특징 분포 변화를 고려하지 않고 표준 컨볼루션을 적용하면 문제가 발생한다. 왜냐하면 컨볼루션 필터는 이미지 특정 영역에서만 활성화되는 국소적 특징을 학습하게 되어, 전체 네트워크의 표현 능력이 제한되고 분할 성능이 저하되기 때문이다. 이를 해결하기 위해 우리는 입력 이미지의 특성에 따라 각 위치에 맞는 서로 다른 필터를 적용하는 공간적 적응형 컨볼루션(Spatially-Adaptive Convolution, SAC)을 제안한다. SAC는 원소별 곱셈, im2col 변환 및 표준 컨볼루션의 조합으로 효율적으로 구현될 수 있어 계산 비용이 낮으며, 기존 여러 방법들을 특수한 경우로 포함할 수 있는 일반적인 프레임워크이다. 본 논문에서는 SAC를 기반으로 SqueezeSegV3를 구축하여, 추론 속도는 유사하게 유지하면서 SemanticKITTI 벤치마크에서 이전에 발표된 모든 방법보다 최소 3.7% 이상의 mIoU 성능을 달성하였다.