11일 전

포인트 클라우드에서 3D 인스턴스 세그멘테이션을 위한 확장 가능한 소프트그룹

Thang Vu, Kookhoi Kim, Tung M. Luu, Thanh Nguyen, Junyeong Kim, Chang D. Yoo
포인트 클라우드에서 3D 인스턴스 세그멘테이션을 위한 확장 가능한 소프트그룹
초록

이 논문은 정확하고 확장 가능한 3D 인스턴스 세그멘테이션을 위한 소프트 그룹(SoftGroup)이라는 네트워크를 제안한다. 기존의 최신 기술들은 하드(hard)한 의미적 예측을 먼저 수행한 후, 이를 바탕으로 인스턴스 세그멘테이션 결과를 그룹화한다. 그러나 이러한 하드 결정에서 발생하는 오류는 그룹화 과정으로 전파되며, 예측된 인스턴스와 진짜 레이블 간의 겹침이 낮고, 큰 양의 오류 양성(false positive)이 발생하게 된다. 위 문제를 해결하기 위해, SoftGroup은 각 점이 여러 클래스와 연결될 수 있도록 허용함으로써 의미적 예측에서 발생하는 불확실성을 완화한다. 또한, 배경(background)으로 분류하도록 학습함으로써 오류 양성 인스턴스를 억제한다. 확장성 측면에서 기존의 빠른 방법들은 대규모 장면에서 10초 수준의 계산 시간을 요구하는데, 이는 실시간 적용에 부적절하며 만족스럽지 못하다. 본 연구에서 발견한 바에 따르면, 그룹화의 전제 조건인 $k$-최근접 이웃($k$-NN) 모듈이 계산적 병목 현상을 초래함을 확인하였다. 이를 해결하기 위해 SoftGroup은 계산 병목을 해결하는 확장된 버전인 SoftGroup++로 개선되었다. 제안된 SoftGroup++는 오크트리(Octree) 기반 $k$-NN을 통해 시간 복잡도를 감소시키고, 클래스 인식 피라미드 스케일링과 지연 복소화(late devoxelization)를 통해 탐색 공간을 축소한다. 다양한 실내 및 실외 데이터셋에서의 실험 결과는 제안된 SoftGroup과 SoftGroup++의 유효성과 일반성을 입증하며, AP$_{50}$ 기준으로 가장 우수한 기준 모델보다 6\%~16\%의 큰 성능 향상을 달성하였다. 대규모 장면을 포함한 데이터셋에서는 SoftGroup++가 SoftGroup 대비 평균 6배의 속도 향상을 보였다. 더불어 SoftGroup은 기존 방법들에 비해 비약적인 개선을 보이며 객체 탐지 및 팬옵틱 세그멘테이션(panoptic segmentation)에도 확장 가능하다. 소스 코드와 학습된 모델은 \url{https://github.com/thangvubk/SoftGroup}에서 공개되어 있다.

포인트 클라우드에서 3D 인스턴스 세그멘테이션을 위한 확장 가능한 소프트그룹 | 최신 연구 논문 | HyperAI초신경