8일 전

도시 주행을 위한 엔드투엔드 모델리스 강화학습: 은유적 가능성을 활용한 접근

Marin Toromanoff, Emilie Wirbel, Fabien Moutarde
도시 주행을 위한 엔드투엔드 모델리스 강화학습: 은유적 가능성을 활용한 접근
초록

강화학습(RL)은 규칙 기반 제어 방법이 아닌, 스스로의 실험을 통해 최적의 행동 정책을 학습하는 것을 목표로 한다. 그러나 현재까지 도시 주행과 같은 복잡한 과제를 처리할 수 있는 강화학습 알고리즘은 존재하지 않는다. 본 연구에서는 도로 유지, 보행자 및 차량 회피, 신호등 탐지 등 도시 주행의 핵심 과제를 포함하여, 강화학습을 효과적으로 활용할 수 있도록 하는 새로운 기법인 '암묵적 가능성(implicit affordances)'을 제안한다. 우리 연구팀은 신호등 탐지라는 측면에서 특히 복잡한 도시 주행 과제를 성공적으로 처리하는 강화학습 에이전트를 최초로 제시한 것으로 알고 있다. 또한, 본 연구에서 제안한 방법의 효과성을 입증하기 위해 CARLA 챌린지의 카메라 전용 트랙에서 우승을 차지함으로써 그 실용성을 입증하였다.

도시 주행을 위한 엔드투엔드 모델리스 강화학습: 은유적 가능성을 활용한 접근 | 최신 연구 논문 | HyperAI초신경