SparseDrive: 희소한 시점 표현을 통한 엔드투엔드 자율 주행

기존의 잘 정립된 모듈형 자율주행 시스템은 감지(perception), 예측(prediction), 계획(planning) 등 서로 독립적인 작업들로 분리되어 있어 모듈 간 정보 손실과 오류 누적 문제를 겪고 있다. 반면, 엔드투엔드(end-to-end) 접근 방식은 다중 작업을 완전히 미분 가능한 프레임워크로 통합하여 계획 중심의 최적화를 가능하게 한다. 엔드투엔드 방식은 큰 잠재력을 지니고 있으나, 기존 방법들은 특히 계획의 안전성 측면에서 성능과 효율성이 만족스럽지 못한 실정이다. 이러한 문제는 계산 비용이 큰 BEV(Bird's Eye View) 특징과 예측 및 계획 모듈에 대한 단순한 설계 때문이라고 판단된다. 이를 해결하기 위해 우리는 엔드투엔드 자율주행을 위한 희소 표현(sparse representation)과 작업 설계를 재검토하여 새로운 패러다임인 SparseDrive를 제안한다. 구체적으로, SparseDrive는 대칭적인 희소 감지 모듈과 병렬 동작 계획기(parallel motion planner)로 구성된다. 희소 감지 모듈은 대칭적인 모델 아키텍처를 통해 감지, 추적, 온라인 맵핑을 통합하여 주행 환경의 완전히 희소한 표현을 학습한다. 운동 예측과 계획을 위한 설계에서는 두 작업 간의 높은 유사성을 고려하여 병렬 구조의 계획기를 도입하였다. 이러한 병렬 설계를 기반으로, 계획을 다중 모드(multi-modal) 문제로 모델링하고, 충돌 인지(rescore) 모듈을 포함한 계층적 계획 선택 전략을 제안하여 합리적이고 안전한 궤적을 최종 계획 출력으로 선정한다. 이러한 효과적인 설계를 통해 SparseDrive는 모든 작업에서 기존 최고 성능 기법을 크게 능가하며, 동시에 훈련 및 추론 효율성도 크게 향상시켰다. 코드는 향후 연구를 지원하기 위해 https://github.com/swc-17/SparseDrive 에 공개될 예정이다.