
초록
시각 기반 도시 주행은 매우 어렵다. 자율 시스템은 세상을 인지하고 그 안에서 행동하는 능력을 학습해야 한다. 본 연구에서는 이러한 도전적인 학습 문제를 두 단계로 분해함으로써 단순화할 수 있음을 보여준다. 먼저, 특권 정보(privileged information)에 접근할 수 있는 에이전트를 훈련시킨다. 이 특권 에이전트는 환경의 정확한 구조(layout)와 모든 교통 참여자의 위치를 직접 관측함으로써 '사기'를 한다. 두 번째 단계에서 이 특권 에이전트는 교사(teacher) 역할을 하며, 순수하게 시각 기반 센서모터(sensorimotor) 정보에 의존하는 에이전트를 훈련시킨다. 결과적으로 생성된 센서모터 에이전트는 어떠한 특권 정보에도 접근할 수 없으며, 사기를 치지 않는다. 이 두 단계 훈련 절차는 처음에는 직관에 어긋보이지만, 분석과 실험을 통해 그 중요하고 유용한 장점들을 입증한다. 본 연구에서 제시한 방법을 활용해, CARLA 벤치마크와 최신 NoCrash 벤치마크에서 기존 최고 수준을 크게 초월하는 시각 기반 자율주행 시스템을 개발하였다. 본 방법은 원본 CARLA 벤치마크의 모든 과제에서 처음으로 100% 성공률을 달성했으며, NoCrash 벤치마크에서는 새로운 기록을 수립하였으며, 이전 최고 성능 대비 위반 사례의 빈도를 한 단계 낮추는 성과를 거두었다. 본 연구의 요약 영상은 다음 링크에서 확인할 수 있다: https://youtu.be/u9ZCxxD-UUw