優先エクスペリエンス再生は、エクスペリエンスの重要性に基づいて異なる頻度でエクスペリエンスを再生し、学習効率を向上させる強化学習の手法です。この方法は、2015 年に Deepmind の Tom Schol、John Quan、Ioannis Antonoglou、David Silver によって提案され、2016 年の ICLR カンファレンスで論文を発表しました。優先エクスペリエンスのリプレイ”。体験の再現を優先する基本的な考え方は、学習にとってすべての体験が同じように重要であるわけではないということです。体験によっては、驚きや学習の価値が高く、より頻繁に繰り返す必要がある場合があります。