
要約
2048は非常に中毒性の高いゲームである。ゲームのルールは簡単だが、実際には非常に難しく、数百億回以上プレイされたゲームのうち、勝利に至ったのはわずか1%程度にとどまっている。本論文では、2048をクリアするための強化学習技術の活用を検討する。採用した手法には、ディープQ学習(deep Q-learning)とビームサーチ(beam search)があり、その結果、ビームサーチを用いたアプローチにより、2048の達成率が28.5%に達した。
2048は非常に中毒性の高いゲームである。ゲームのルールは簡単だが、実際には非常に難しく、数百億回以上プレイされたゲームのうち、勝利に至ったのはわずか1%程度にとどまっている。本論文では、2048をクリアするための強化学習技術の活用を検討する。採用した手法には、ディープQ学習(deep Q-learning)とビームサーチ(beam search)があり、その結果、ビームサーチを用いたアプローチにより、2048の達成率が28.5%に達した。