8일 전
도시 주행을 위한 엔드투엔드 모델리스 강화학습: 은유적 가능성을 활용한 접근
Marin Toromanoff, Emilie Wirbel, Fabien Moutarde

초록
강화학습(RL)은 규칙 기반 제어 방법이 아닌, 스스로의 실험을 통해 최적의 행동 정책을 학습하는 것을 목표로 한다. 그러나 현재까지 도시 주행과 같은 복잡한 과제를 처리할 수 있는 강화학습 알고리즘은 존재하지 않는다. 본 연구에서는 도로 유지, 보행자 및 차량 회피, 신호등 탐지 등 도시 주행의 핵심 과제를 포함하여, 강화학습을 효과적으로 활용할 수 있도록 하는 새로운 기법인 '암묵적 가능성(implicit affordances)'을 제안한다. 우리 연구팀은 신호등 탐지라는 측면에서 특히 복잡한 도시 주행 과제를 성공적으로 처리하는 강화학습 에이전트를 최초로 제시한 것으로 알고 있다. 또한, 본 연구에서 제안한 방법의 효과성을 입증하기 위해 CARLA 챌린지의 카메라 전용 트랙에서 우승을 차지함으로써 그 실용성을 입증하였다.