9日前

強化学習を用いた2048のプレイ

Shilun Li, Veronica Peng
強化学習を用いた2048のプレイ
要約

2048は非常に中毒性の高いゲームである。ゲームのルールは簡単だが、実際には非常に難しく、数百億回以上プレイされたゲームのうち、勝利に至ったのはわずか1%程度にとどまっている。本論文では、2048をクリアするための強化学習技術の活用を検討する。採用した手法には、ディープQ学習(deep Q-learning)とビームサーチ(beam search)があり、その結果、ビームサーチを用いたアプローチにより、2048の達成率が28.5%に達した。

強化学習を用いた2048のプレイ | 最新論文 | HyperAI超神経