优先经验回放 Prioritized Experience Replay

优先经验回放 (Prioritized Experience Replay) 是一种用于强化学习的方法,它根据经验的重要性以不同的频率重放经验,从而提高学习效率。这个方法由来自 Deepmind 的 Tom Schaul 、 John Quan 、 Ioannis Antonoglou 和 David Silver 在 2015 年提出,并在 2016 年的 ICLR 会议上发表了论文「Prioritized Experience Replay」。优先经验回放的核心思想是,不是所有经验对于学习都是同等重要的。一些经验可能因为它们带来的意外或学习价值更高,应该被更频繁地重放学习。