HyperAIHyperAI

Command Palette

Search for a command to run...

自己対戦による将棋とチェスの習得:一般的強化学習アルゴリズムの活用

David Silver; Thomas Hubert; Julian Schrittwieser; Ioannis Antonoglou; Matthew Lai; Arthur Guez; Marc Lanctot; Laurent Sifre; Dharshan Kumaran; Thore Graepel; Timothy Lillicrap; Karen Simonyan; Demis Hassabis

概要

チェスは、人工知能の歴史において最も広く研究されてきた分野です。最強のプログラムは、洗練された探索技術、分野特有の適応、そして数十年にわたる人間の専門家によって改良された手作りの評価関数を組み合わせて構築されています。一方、AlphaGo Zeroプログラムは、自己対戦からのタブーラ・ラサ(白紙状態)強化学習により、囲碁で超人的な性能を達成しました。本論文では、このアプローチを一般化し、複数の挑戦的な分野でタブーラ・ラサ(白紙状態)から超人的な性能を達成できる単一のAlphaZeroアルゴリズムを開発しました。ランダムなプレイから始め、ゲームルール以外の分野知識を与えない条件下で、AlphaZeroは24時間以内にチェスと将棋(日本のチェス)、そして囲碁で超人的なレベルに到達し、それぞれの場合において世界チャンピオン級のプログラムを明確に破りました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています