2달 전

운전 전 두 번 생각하기: 엔드투엔드 자율주행을 위한 확장 가능한 디코더 개발 방향

Jia, Xiaosong ; Wu, Penghao ; Chen, Li ; Xie, Jiangwei ; He, Conghui ; Yan, Junchi ; Li, Hongyang
운전 전 두 번 생각하기: 엔드투엔드 자율주행을 위한 확장 가능한 디코더 개발 방향
초록

최근 몇 년 동안 엔드투엔드 자율주행 기술은 놀라운 발전을 이룩하였습니다. 기존 방법들은 일반적으로 분리된 인코더-디코더 패러다임을 채택하는데, 여기서 인코더는 원시 센서 데이터에서 은닉 특성을 추출하고, 디코더는 자신의 차량(에고 차량)의 미래 궤적 또는 행동을 출력합니다. 이러한 패러다임 하에서는 인코더가 에고 에이전트의 의도된 행동에 접근할 수 없어, 대규모 수용 필드에서 안전에 중요한 영역을 찾아내고 미래 상황을 추론하는 부담이 디코더에게 전가됩니다. 더욱 문제인 것은, 디코더가 보통 간단한 다층 퍼셉트론(MLP)이나 GRU로 구성되는데 반해, 인코더는 정교하게 설계되어 있습니다(예: 무거운 ResNet이나 Transformer의 조합). 이러한 불균형적인 리소스-태스크 분배는 학습 과정을 방해합니다.본 연구에서는 위와 같은 문제를 완화하기 위해 두 가지 원칙을 제시합니다: (1) 인코더의 능력을 충분히 활용하고, (2) 디코더의 능력을 증가시키는 것입니다. 구체적으로, 먼저 인코더 특성 기반으로 대략적인 미래 위치와 행동을 예측합니다. 그런 다음, 이 위치와 행동에 조건부로 미래 장면을 상상하여 해당 방식으로 주행했을 때의 결과를 확인합니다. 또한 예측된 좌표 주변의 인코더 특성을 검색하여 안전에 중요한 영역에 대한 세부 정보를 얻습니다. 마지막으로, 예측된 미래와 검색된 주요 특성을 바탕으로 그라운드 트루로부터의 오프셋(offset)을 예측하여 대략적인 위치와 행동을 개선합니다. 위의 개선 모듈은 계단식(cascaded)으로 쌓일 수 있으며, 이는 공간-시간적 사전 지식을 이용하여 조건부 미래에 대한 디코더의 능력을 확장합니다. 우리는 CARLA 시뮬레이터에서 실험을 수행하였으며, 폐루프 벤치마크에서 최고 수준의 성능을 달성하였습니다. 광범위한 아블레이션 연구(ablation studies)를 통해 각 제안된 모듈의 효과성이 입증되었습니다.

운전 전 두 번 생각하기: 엔드투엔드 자율주행을 위한 확장 가능한 디코더 개발 방향 | 최신 연구 논문 | HyperAI초신경