11일 전
PV-RCNN++: 3차원 객체 탐지를 위한 로컬 벡터 표현을 활용한 포인트-복합체 특징 집약
Shaoshuai Shi, Li Jiang, Jiajun Deng, Zhe Wang, Chaoxu Guo, Jianping Shi, Xiaogang Wang, Hongsheng Li

초록
3D 객체 탐지 기술은 다양한 분야에서의 광범위한 응용 가능성으로 인해 산업계와 학계에서 점점 더 많은 주목을 받고 있다. 본 논문에서는 포인트 클라우드 기반 3D 객체 탐지에 대해 Point-Voxel Region-based Convolutional Neural Networks(PV-RCNNs)를 제안한다. 먼저, 포인트 기반 세트 추상화와 범프 기반 희소 컨볼루션의 특징 학습을 두 가지 새로운 단계—즉, 범프-키포인트 장면 인코딩과 키포인트-그리드 RoI 특징 추상화—를 통해 깊이 통합함으로써 3D 탐지 성능을 향상시키는 새로운 3D 탐지기인 PV-RCNN을 제안한다. 두 번째로, 보다 효율적이고 정확한 3D 객체 탐지를 위한 고급 프레임워크인 PV-RCNN++을 제안한다. 이는 두 가지 주요 개선 사항으로 구성된다: 더 많은 대표성을 갖춘 키포인트를 효율적으로 생성하기 위한 섹터화된 제안 중심 샘플링, 그리고 훨씬 더 적은 자원 소비로 지역 포인트 특징을 더 효과적으로 집계하는 VectorPool 집계 방식이다. 이러한 두 가지 전략을 통해 PV-RCNN++은 PV-RCNN보다 약 3배 빠른 속도를 달성하면서도 더 우수한 성능을 보였다. 실험 결과, 제안하는 PV-RCNN++ 프레임워크는 대규모이며 높은 경쟁력이 있는 Waymo Open Dataset에서 최신 기술 수준의 3D 객체 탐지 성능을 달성하였으며, 탐지 범위 150m × 150m에서 10 FPS의 추론 속도를 실현하였다.