11일 전

SVGA-Net: 포인트 클라우드로부터 3D 객체 탐지를 위한 희소 복셀-그래프 어텐션 네트워크

Qingdong He, Zhengning Wang, Hao Zeng, Yi Zeng, Yijun Liu
SVGA-Net: 포인트 클라우드로부터 3D 객체 탐지를 위한 희소 복셀-그래프 어텐션 네트워크
초록

포인트 클라우드로부터 정확한 3차원 객체 탐지는 자율 주행 시스템에서 핵심적인 구성 요소로 부상하고 있다. 그러나 기존의 연구에서 사용된 체적 표현 방식과 투영 방법은 국소적인 포인트 집합 간의 관계를 효과적으로 설정하지 못하고 있다. 본 논문에서는 원시 LIDAR 데이터로부터 비교 가능한 3차원 객체 탐지 성능을 달성하기 위해, 주로 복셀-그래프 모듈과 희소-밀도 회귀 모듈을 포함하는 새로운 엔드투엔드 학습 가능한 네트워크인 Sparse Voxel-Graph Attention Network(SVGA-Net)을 제안한다. 구체적으로, SVGA-Net은 각각의 3차원 구형 복셀 내부에서 국소적 완전 그래프를 구성하고, 모든 복셀을 통틀어 전역 KNN 그래프를 형성한다. 이 국소적 및 전역 그래프는 추출된 특징을 강화하기 위한 주의 메커니즘으로 활용된다. 또한, 다양한 레벨에서의 특징 맵 집계를 통해 3차원 박스 추정 정확도를 향상시키는 새로운 희소-밀도 회귀 모듈이 도입된다. KITTI 객체 탐지 벤치마크에서 수행된 실험 결과는 그래프 표현을 3차원 객체 탐지에 확장하는 것이 효과적임을 입증하며, 제안한 SVGA-Net이 우수한 탐지 정확도를 달성할 수 있음을 보여준다.

SVGA-Net: 포인트 클라우드로부터 3D 객체 탐지를 위한 희소 복셀-그래프 어텐션 네트워크 | 최신 연구 논문 | HyperAI초신경