HyperAIHyperAI

Command Palette

Search for a command to run...

Agent57:アタリ人間ベンチマークを上回る

Adrià Puigdomènech Badia Bilal Piot Steven Kapturowski Pablo Sprechmann Alex Vitvitskyi Daniel Guo Charles Blundell

概要

過去10年間、アタリゲームは強化学習(RL)分野における長年にわたり用いられてきたベンチマークとしての役割を果たしてきた。このベンチマークは、RLアルゴリズムの汎用的実力(一般能力)を評価することを目的として提案された。これまでの研究では、多数のゲームで優れた成績を収めることで平均性能が高く評価されてきたが、特に困難ないくつかのゲームでは著しく劣る結果にとどまっていた。本研究では、57種類すべてのアタリゲームにおいて、標準的な人間のパフォーマンスを上回る初のディープRLエージェント「Agent57」を提案する。この成果を達成するため、極めて探索的から完全に利用的まで、多様な方策(ポリシー)をパラメータ化するニューラルネットワークを学習する。さらに、学習プロセス全体を通じてどの方策を優先すべきかを動的に選択する機構を提案する。また、より一貫性があり安定した学習を可能にする新しいアーキテクチャのパラメータ化手法を導入している。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています