HyperAIHyperAI

Command Palette

Search for a command to run...

用于探索的噪声网络

Meire Fortunato; Mohammad Gheshlaghi Azar; Bilal Piot; Jacob Menick; Ian Osband; Alex Graves; Vlad Mnih; Remi Munos; Demis Hassabis; Olivier Pietquin; Charles Blundell; Shane Legg

摘要

我们介绍了NoisyNet,这是一种在权重中加入参数噪声的深度强化学习代理,并展示了该代理策略所引起的随机性可以用于促进有效的探索。噪声的参数通过梯度下降与网络中的其他权重一同学习。NoisyNet的实现简单直接,且计算开销很小。我们发现,用NoisyNet替代A3C、DQN和双网络代理(分别对应熵奖励和ε\varepsilonε-贪婪)的传统探索启发式方法,可以在广泛的Atari游戏中显著提高得分,在某些情况下甚至使代理从次人类水平提升到超人类水平的表现。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供