17일 전

패치 개선 -- 국소화된 3D 객체 탐지

Johannes Lehner, Andreas Mitterecker, Thomas Adler, Markus Hofmarcher, Bernhard Nessler, Sepp Hochreiter
패치 개선 -- 국소화된 3D 객체 탐지
초록

우리는 포인트 클라우드 데이터로부터 정확한 3D 객체 탐지 및 위치 추정을 위한 이중 단계 모델인 Patch Refinement을 제안한다. Patch Refinement은 VoxelNet 기반의 두 개의 독립적으로 학습된 네트워크, 즉 영역 제안 네트워크(Region Proposal Network, RPN)와 국소 보정 네트워크(Local Refinement Network, LRN)로 구성된다. 본 연구에서는 탐지 작업을 초기 Birds' Eye View(BEV) 탐지 단계와 국소 3D 탐지 단계로 분해한다. RPN이 제안한 BEV 위치를 기반으로, 작은 포인트 클라우드 하위 집합(이하 ‘패치’)을 추출하며, 이러한 패치는 LRN에 의해 처리된다. 각 패치의 영역이 작기 때문에 LRN은 메모리 제약에 덜 제한받을 수 있으며, 이로 인해 국소적으로 더 높은 복셀 해상도로 인코딩을 적용할 수 있다. 또한 LRN의 독립성 덕분에 추가적인 증강 기법을 활용할 수 있으며, 각 시나리오의 일부만을 사용하므로 회귀 중심의 효율적인 학습이 가능하다. KITTI 3D 객체 탐지 벤치마크에서 평가한 결과, 2019년 1월 28일 제출한 본 모델은 차량 클래스의 세 가지 난이도에서 이전 모든 기록을 초과하였으며, 사용 가능한 학습 데이터의 50%만을 활용하고, LiDAR 정보만을 사용한 상태에서도 뛰어난 성능을 보였다.

패치 개선 -- 국소화된 3D 객체 탐지 | 최신 연구 논문 | HyperAI초신경