2달 전

연속 제어를 위한 딥 강화 학습 벤치마킹

Duan, Yan ; Chen, Xi ; Houthooft, Rein ; Schulman, John ; Abbeel, Pieter
연속 제어를 위한 딥 강화 학습 벤치마킹
초록

최근 연구원들은 딥 러닝의 특성 표현 학습과 강화 학습을 결합하는 분야에서 중요한 진전을 이룩하였습니다. 주목할 만한 예로는 원시 픽셀 데이터를 기반으로 Atari 게임을 플레이하도록 에이전트를 훈련시키고, 원시 감각 입력을 사용하여 고급 조작 기술을 습득하도록 하는 것이 있습니다. 그러나, 연속 제어 영역에서의 진전을 측정하기는 공통적으로 채택된 벤치마크가 부족하기 때문에 어려웠�습니다.본 연구에서는 카트-폴 스윙업(Cart-Pole Swing-Up)과 같은 고전적인 과제부터 3D 인간형 로봇 이동(3D Humanoid Locomotion)과 같이 매우 높은 상태 및 행동 차원을 가진 과제, 부분 관측이 필요한 과제, 계층적 구조를 가진 과제 등을 포함하는 연속 제어 과제의 벤치마크 모음집을 제시합니다. 우리는 다양한 강화 학습 알고리즘의 체계적인 평가를 통해 새로운 발견들을 보고합니다. 벤치마크와 참조 구현은 실험 재현성을 용이하게 하고 다른 연구자들의 채택을 장려하기 위해 https://github.com/rllab/rllab에서 공개되었습니다.

연속 제어를 위한 딥 강화 학습 벤치마킹 | 최신 연구 논문 | HyperAI초신경