11일 전

프루스텀-포인트필라스: RGB 카메라와 LiDAR를 활용한 3D 객체 탐지를 위한 다단계 접근법

{Christian Laugier, Özgür Erkent, David Sierra-Gonzalez, Anshul Paigwar}
프루스텀-포인트필라스: RGB 카메라와 LiDAR를 활용한 3D 객체 탐지를 위한 다단계 접근법
초록

정확한 3차원 객체 탐지는 자율주행 차량의 인지 모듈에서 핵심적인 역할을 한다. 3차원 공간 내 객체에 대한 보다 정교한 이해는 더 나은 의사결정 및 경로 계획을 가능하게 한다. 자율주행 차량에서 환경 인지에 가장 널리 사용되는 센서는 RGB 카메라와 LiDAR이다. RGB 이미지를 활용한 2차원 객체 탐지에 대한 많은 접근 방식이 희망적인 성과를 보였지만, 대규모 장면의 3차원 포인트 클라우드에서 보행자와 같은 소형 객체를 효율적으로 정위치화하는 것은 여전히 연구의 도전 과제로 남아 있다. 본 연구에서는 LiDAR 데이터를 활용한 3차원 객체 탐지를 위한 새로운 방법인 Frustum-PointPillars를 제안한다. 포인트 클라우드 특징에만 의존하는 기존 방식과 달리, 2차원 객체 탐지 기술의 성숙한 기반을 활용하여 3차원 공간 내 탐색 공간을 축소한다. 이후, 축소된 포인트 클라우드 내에서 객체 정위치화를 위해 Pillar Feature Encoding 네트워크를 사용한다. 또한, 포인트 클라우드 마스킹을 위한 새로운 접근 방식을 제안하여 객체 정위치화 성능을 추가로 향상시켰다. 제안한 네트워크는 KITTI 데이터셋에서 학습하고 실험을 통해 그 효과를 검증하였다. KITTI 테스트 세트에서 본 방법은 다중 센서 기반 최신 기술(SOTA) 대비 3차원 보행자 정위치화(Bird’s Eye View 기준) 성능에서 우수한 결과를 기록하며, 동시에 14Hz의 매우 빠른 실행 속도를 달성하였다.

프루스텀-포인트필라스: RGB 카메라와 LiDAR를 활용한 3D 객체 탐지를 위한 다단계 접근법 | 최신 연구 논문 | HyperAI초신경