2ヶ月前

アーケード学習環境:汎用エージェントの評価プラットフォーム

Marc G. Bellemare; Yavar Naddaf; Joel Veness; Michael Bowling
アーケード学習環境:汎用エージェントの評価プラットフォーム
要約

本稿では、アーケード学習環境(Arcade Learning Environment: ALE)について紹介します。ALEは、一般的なドメイン非依存のAI技術の開発評価における課題問題およびプラットフォームとメソドロジーを提供しています。ALEは、数百のAtari 2600ゲーム環境へのインターフェースを提供し、それぞれが異なる魅力を持ち、人間プレイヤーにとって挑戦的なものとなっています。ALEは強化学習、モデル学習、モデルベース計画、模倣学習、転移学習、内在的動機付けなどの分野で重要な研究課題を提示しています。特に重要なのは、これらの課題に対するアプローチの評価と比較のために厳密なテストベッドを提供している点です。私たちは既に確立されたAI技術を使用してドメイン非依存エージェントを開発し、ベンチマークを行うことでALEの可能性を示しています。これにより、ALEによって可能となった評価メソドロジーも提案しており、55以上の異なるゲームでの実証結果を報告しています。このソフトウェアにはベンチマークエージェントも含まれており、すべて公開されています。