
초록
비디오 게임을 마스터하기 위해서는 기술, 전략 및 전술이 필요합니다. 이러한 속성은 인간 플레이어가 자연스럽게 습득할 수 있지만, 컴퓨터 프로그램에게 가르치기는 훨씬 더 어려운 과제입니다. 최근 몇 년 동안 강화 학습 분야에서 많은 연구가 이루어졌으며, 비디오 게임과 같은 인간의 작업을 수행하는 방법을 배우기 위한 다양한 알고리즘이 소개되었습니다. 그 결과, 아케이드 학습 환경(Arcade Learning Environment, ALE) (Bellemare et al., 2013)은 여러 아타리 2600 게임에서 알고리즘을 훈련시키는 표준 벤치마크 환경으로 자리 잡았습니다. 많은 게임에서 최신 알고리즘이 인간을 능가하고 있습니다. 본 논문에서는 새로운 학습 환경인 레트로 학습 환경(Retro Learning Environment, RLE)을 소개합니다. 이 환경은 슈퍼 닌텐도 엔터테인먼트 시스템(SNES), 세가 메가 드라이브(Sega Genesis) 및 여러 다른 게임 콘솔에서 게임을 실행할 수 있습니다. 이 환경은 확장 가능하며, 추가적인 비디오 게임과 콘솔을 쉽게 추가할 수 있으며 ALE와 동일한 인터페이스를 유지합니다. 또한, RLE는 Python과 Torch와 호환됩니다. SNES 게임들은 그 복잡성과 다용도성 때문에 현재의 알고리즘에 큰 도전이 됩니다.