L'Environnement d'Apprentissage Arcade : Une Plateforme d'Évaluation pour les Agents Généraux

Dans cet article, nous présentons l'Arcade Learning Environment (ALE) : à la fois un problème de défi et une plateforme et méthodologie pour évaluer le développement de technologies d'IA générales et indépendantes du domaine. L'ALE fournit une interface vers des centaines d'environnements de jeux Atari 2600, chacun étant différent, intéressant et conçu pour représenter un défi pour les joueurs humains. L'ALE pose des défis de recherche importants en apprentissage par renforcement, apprentissage de modèles, planification basée sur des modèles, apprentissage par imitation, transfert d'apprentissage et motivation intrinsèque. Plus important encore, il offre un environnement rigoureux pour évaluer et comparer les approches à ces problèmes. Nous illustrons le potentiel de l'ALE en développant et en évaluant des agents indépendants du domaine conçus à l'aide de techniques d'IA bien établies, tant pour l'apprentissage par renforcement que pour la planification. Dans ce processus, nous proposons également une méthodologie d'évaluation rendue possible par l'ALE, en rapportant des résultats empiriques sur plus de 55 jeux différents. Tous les logiciels, y compris les agents de référence, sont disponibles au public.