9일 전

강화학습을 이용한 2048 게임 플레이

Shilun Li, Veronica Peng

초록

2048은 매우 중독성 있는 게임이다. 게임을 배우는 것은 간단하지만, 마스터하는 것은 매우 어렵다. 실제로 생성된 게임 결과를 분석한 바에 따르면, 수억 회가 넘는 게임 중에서 승리한 경우는 약 1%에 불과하다. 본 논문에서는 2048에서 승리하기 위해 강화학습 기법을 탐구한다. 우리가 적용한 방법론은 딥 Q-러닝과 빔 서치(Beam Search)이며, 그 중 빔 서치는 2048에 대해 28.5%의 승리 비율을 기록했다.