HyperAIHyperAI

Command Palette

Search for a command to run...

使用深度强化学习玩Atari游戏

Volodymyr Mnih Koray Kavukcuoglu David Silver Alex Graves Ioannis Antonoglou Daan Wierstra Martin Riedmiller

摘要

我们提出了首个成功利用强化学习从高维感官输入中直接学习控制策略的深度学习模型。该模型是一个卷积神经网络,采用Q-learning的一种变体进行训练,其输入为原始像素,输出为估计未来奖励的价值函数。我们将该方法应用于Arcade Learning Environment中的七款Atari 2600游戏,且未对架构或学习算法进行任何调整。研究结果表明,该模型在六款游戏中超越了所有先前的方法,并在其中三款游戏中超过了人类专家的表现。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供