11일 전

PV-RCNN++: 3차원 객체 탐지를 위한 로컬 벡터 표현을 활용한 포인트-복합체 특징 집약

Shaoshuai Shi, Li Jiang, Jiajun Deng, Zhe Wang, Chaoxu Guo, Jianping Shi, Xiaogang Wang, Hongsheng Li
PV-RCNN++: 3차원 객체 탐지를 위한 로컬 벡터 표현을 활용한 포인트-복합체 특징 집약
초록

3D 객체 탐지 기술은 다양한 분야에서의 광범위한 응용 가능성으로 인해 산업계와 학계에서 점점 더 많은 주목을 받고 있다. 본 논문에서는 포인트 클라우드 기반 3D 객체 탐지에 대해 Point-Voxel Region-based Convolutional Neural Networks(PV-RCNNs)를 제안한다. 먼저, 포인트 기반 세트 추상화와 범프 기반 희소 컨볼루션의 특징 학습을 두 가지 새로운 단계—즉, 범프-키포인트 장면 인코딩과 키포인트-그리드 RoI 특징 추상화—를 통해 깊이 통합함으로써 3D 탐지 성능을 향상시키는 새로운 3D 탐지기인 PV-RCNN을 제안한다. 두 번째로, 보다 효율적이고 정확한 3D 객체 탐지를 위한 고급 프레임워크인 PV-RCNN++을 제안한다. 이는 두 가지 주요 개선 사항으로 구성된다: 더 많은 대표성을 갖춘 키포인트를 효율적으로 생성하기 위한 섹터화된 제안 중심 샘플링, 그리고 훨씬 더 적은 자원 소비로 지역 포인트 특징을 더 효과적으로 집계하는 VectorPool 집계 방식이다. 이러한 두 가지 전략을 통해 PV-RCNN++은 PV-RCNN보다 약 3배 빠른 속도를 달성하면서도 더 우수한 성능을 보였다. 실험 결과, 제안하는 PV-RCNN++ 프레임워크는 대규모이며 높은 경쟁력이 있는 Waymo Open Dataset에서 최신 기술 수준의 3D 객체 탐지 성능을 달성하였으며, 탐지 범위 150m × 150m에서 10 FPS의 추론 속도를 실현하였다.

PV-RCNN++: 3차원 객체 탐지를 위한 로컬 벡터 표현을 활용한 포인트-복합체 특징 집약 | 최신 연구 논문 | HyperAI초신경