11일 전

HEDNet: 포인트 클라우드에서 3D 객체 탐지를 위한 계층적 인코더-디코더 네트워크

Gang Zhang, Junnan Chen, Guohuan Gao, Jianmin Li, Xiaolin Hu
HEDNet: 포인트 클라우드에서 3D 객체 탐지를 위한 계층적 인코더-디코더 네트워크
초록

포인트 클라우드에서의 3D 객체 탐지는 자율주행 시스템에 있어 매우 중요한 과제이다. 3D 객체 탐지의 주요 과제 중 하나는 3D 시점 내에서 포인트의 분포가 희박하다는 점에 기인한다. 기존의 고성능 방법들은 주로 작은 커널을 사용하는 3D 희소 컨볼루셔널 신경망을 활용하여 특징을 추출한다. 계산 비용을 줄이기 위해 이러한 방법들은 공간적으로 분리된 특징 간의 정보 교환을 차단하는 서브매니폴드 희소 컨볼루션을 사용한다. 최근 일부 연구들은 대규모 커널 컨볼루션 또는 자기 주의 메커니즘(self-attention mechanism)을 도입함으로써 이 문제를 해결하려는 시도를 하였지만, 이들 방법은 정확도 향상이 제한적이거나 과도한 계산 비용을 수반하는 등의 문제를 겪고 있다. 본 연구에서는 공간적 영역 내 특징 간의 장거리 종속성을 효과적으로 포착할 수 있도록 인코더-디코더 블록을 활용하는 계층적 인코더-디코더 네트워크인 HEDNet을 제안한다. 특히 큰 크기 또는 멀리 떨어진 객체에 대해 뛰어난 성능을 발휘하도록 설계되었다. 제안된 HEDNet은 Waymo Open 및 nuScenes 데이터셋에서 광범위한 실험을 수행하였으며, 기존 최고 수준의 방법들에 비해 우수한 탐지 정확도를 달성하면서도 경쟁적인 효율성을 보였다. 코드는 https://github.com/zhanggang001/HEDNet 에서 공개되어 있다.

HEDNet: 포인트 클라우드에서 3D 객체 탐지를 위한 계층적 인코더-디코더 네트워크 | 최신 연구 논문 | HyperAI초신경