2 个月前

《Arcade 学习环境:通用智能体的评估平台》

Marc G. Bellemare; Yavar Naddaf; Joel Veness; Michael Bowling
《Arcade 学习环境:通用智能体的评估平台》
摘要

本文介绍了Arcade学习环境(ALE):它既是一个挑战问题,也是一个评估通用、领域无关的人工智能技术发展的平台和方法。ALE提供了数百个Atari 2600游戏环境的接口,每个游戏都各不相同,引人入胜,并且设计上对人类玩家具有挑战性。ALE为强化学习、模型学习、基于模型的规划、模仿学习、迁移学习和内在动机等研究领域带来了显著的挑战。最重要的是,它提供了一个严格的测试平台,用于评估和比较解决这些问题的方法。我们通过开发并基准测试使用已建立的人工智能技术设计的领域无关代理来展示ALE的潜力,这些技术涵盖了强化学习和规划两个方面。在此过程中,我们还提出了一种由ALE实现的评估方法,并报告了在超过55款不同游戏上的实证结果。所有软件,包括基准代理,均已公开发布。