
초록
2048은 매우 중독성 있는 게임이다. 게임을 배우는 것은 간단하지만, 마스터하는 것은 매우 어렵다. 실제로 생성된 게임 결과를 분석한 바에 따르면, 수억 회가 넘는 게임 중에서 승리한 경우는 약 1%에 불과하다. 본 논문에서는 2048에서 승리하기 위해 강화학습 기법을 탐구한다. 우리가 적용한 방법론은 딥 Q-러닝과 빔 서치(Beam Search)이며, 그 중 빔 서치는 2048에 대해 28.5%의 승리 비율을 기록했다.
2048은 매우 중독성 있는 게임이다. 게임을 배우는 것은 간단하지만, 마스터하는 것은 매우 어렵다. 실제로 생성된 게임 결과를 분석한 바에 따르면, 수억 회가 넘는 게임 중에서 승리한 경우는 약 1%에 불과하다. 본 논문에서는 2048에서 승리하기 위해 강화학습 기법을 탐구한다. 우리가 적용한 방법론은 딥 Q-러닝과 빔 서치(Beam Search)이며, 그 중 빔 서치는 2048에 대해 28.5%의 승리 비율을 기록했다.