Command Palette

Search for a command to run...

优先经验回放 Prioritized Experience Replay

日期

1 年前

优先经验回放 (Prioritized Experience Replay) 是一种用于强化学习的方法,它根据经验的重要性以不同的频率重放经验,从而提高学习效率。这个方法由来自 Deepmind 的 Tom Schaul 、 John Quan 、 Ioannis Antonoglou 和 David Silver 在 2015 年提出,并在 2016 年的 ICLR 会议上发表了论文「Prioritized Experience Replay」。优先经验回放的核心思想是,不是所有经验对于学习都是同等重要的。一些经验可能因为它们带来的意外或学习价值更高,应该被更频繁地重放学习。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供